今日花费
- 早午饭 4
- 鸭脖 12.90
- 面包 6
- 小零食 4.80
- 晚饭 22.00
- 总花费:49.70
总结
今天首先完善了数据标注网页,添加了手动保存以及余弦相似图提示性信息。完善了数据标注逻辑。简化了命令参数的设置。 随后训练了模型,包括将交叉注意力 Token 和 MaskDecoder 融合的方法,发现效果不好,随后尝试训练了最初的设计。预训练模型 MaskDecoder 使用 HyperFree 貌似效果更好 背诵了英语单词(附不太熟的几个 perceptive improvise plasma crest rally enzyme thwart) 学习了 Warp Scheduler 相关的知识。