技术
监督式微调 (SFT)
Supervised fine-tuning (SFT)
用一组(输入、理想输出)配对数据 fine-tune 预训练模型的方法,是 post-training 的第一步。
技术
Supervised fine-tuning (SFT)
用一组(输入、理想输出)配对数据 fine-tune 预训练模型的方法,是 post-training 的第一步。
We use cookies
Anonymous analytics help us improve the site. You can opt out anytime. Learn more