8月29日总结

2025-08-29

今日花费

  • 早午饭 4
  • 鸭脖 12.90
  • 面包 6
  • 小零食 4.80
  • 晚饭 22.00
  • 总花费:49.70

总结

今天首先完善了数据标注网页,添加了手动保存以及余弦相似图提示性信息。完善了数据标注逻辑。简化了命令参数的设置。 随后训练了模型,包括将交叉注意力 Token 和 MaskDecoder 融合的方法,发现效果不好,随后尝试训练了最初的设计。预训练模型 MaskDecoder 使用 HyperFree 貌似效果更好 背诵了英语单词(附不太熟的几个 perceptive improvise plasma crest rally enzyme thwart) 学习了 Warp Scheduler 相关的知识。