一文带你了解【SFT微调】与【Unsloth】
社区头条 在当下流行的几种大模型微调方法中,大家经常会看到谈论SFP与Unsloth的文章,那我们应该如何了解它们?它们的技术特点又有哪些?各自应用在哪些模型微调的场景呢?本篇我们带着这些问题,一起来了解一下。一、SFT微调技术介绍监督微调(SupervisedFinetuning,SFT)是一种迁移学习(TransferLearning)技术,指的是在已经预训练好的模型(例如大语言模型中的GPT、BERT等)基础上,使用带有人工标注标签的监督数据,对模型进行进...