标签驱动的可信金融大模型训练全流程-Agentar-Fin-R1工程思路浅尝
原创
AgentarFinR1的开发pipline可概括为“数据→训练→评估→归因→迭代”五个闭环阶段,每一阶段都有明确输入、处理逻辑和输出。一、数据构造AgentarFinR1的数据构造围绕LabelSystem和MultiAgent可信合成展开的三级流水线:1.1LabelSystem(任务标签体系)两类标签:每个样本被打上(Scene,Task)a.Scene:银行、证券、保险、信托、基金等业务场景b.Task:NER、意图识别、槽位填充、消歧、咨询式问答等任务类型非正交稀疏性...