- 2 回复
- 496 浏览
给微调模型喂财报,loss死活降不下去
手头在调一个财务问答模型,喂了500份财报PDF转的文本,loss卡在0.8下不去了。试过调lr和batch size都不管用,有没有懂行的说说是不是预处理坑了?
手头在调一个财务问答模型,喂了500份财报PDF转的文本,loss卡在0.8下不去了。试过调lr和batch size都不管用,有没有懂行的说说是不是预处理坑了?
按楼层回复,支持引用与表情;使用 @用户名 或 @昵称 可提醒对方;发言计入圈子贡献字数。
本地偏好 · 配色仅保存在当前浏览器
点此注册,收藏与评论更方便
Welcome! This site is in Chinese. Tap EN in the top bar to read in English.
2s 条评论