欧易数字货币Web3的直通车

新手必读、操作指南、进阶策略、行业热点尽在新手学院,精彩一站直达,轻松玩转数字货币。

进入欧易官网

斯坦福与华盛顿大学合作研发低成本推理AI模型

2025年,斯坦福大学和华盛顿大学的人工智能研究团队发布了一项令人瞩目的研究成果,他们成功地开发出了一种名为“s1”的AI推理模型。根据上周五发布的研究论文,研究团队通过不到50美元的云计算积分,训练出了这一模型,而这一成本远低于现有的尖端推理模型,如OpenAI的o1和DeepSeek的r1。该模型在数学和编码能力的测试中表现出色,达到了与领先推理模型相似的水平。

s1模型的训练方法与传统的AI模型训练大不相同。研究团队采用了一种称为“提炼”(distillation)的方法,利用已训练好的AI模型的答案来提取推理能力。这种方法通过训练另一个AI模型来模仿前者的思维过程,借此增强模型的推理能力。据悉,s1模型就是从谷歌的推理模型——Gemini 2.0 Flash Thinking Experimental中提炼出来的,展示了低成本推理模型的潜力。

s1的开发基于阿里巴巴旗下中国AI实验室Qwen的小型现成AI模型,这一模型能够免费下载并用于研究。为了训练s1,研究人员构建了一个包含1,000个精心策划问题的数据集,并附上这些问题的答案及背后的“思考”过程。通过使用16个Nvidia H100 GPU,研究团队仅在30分钟内便完成了s1模型的训练,并在多个AI基准测试中取得了令人瞩目的成绩。

值得注意的是,s1的训练成本非常低廉,研究人员称,他们可以以大约20美元的价格租用所需的计算能力。相比之下,DeepSeek在训练其模型时采用了大规模的强化学习方法,这使得其训练成本要高得多。通过使用监督微调(SFT)技术,s1能够利用相对较小的数据集进行推理能力的提炼,而这种方法不仅高效,而且更具成本效益。

s1模型的成功预示着推理模型的开发进入了一个新的阶段。研究人员表示,他们的目标是开发一种能够进行更高效推理和“测试时间扩展”的AI模型,这意味着AI在回答问题之前能进行更多的深度思考。这一突破使得AI模型不仅仅局限于简单的答案生成,而是能够在更复杂的任务中提供更精确的推理。

斯坦福大学研究员Niklas Muennighoff在接受采访时表示,s1的训练不仅展示了低成本高效能的潜力,而且有望进一步推动人工智能领域的发展。随着AI技术的不断进步,未来低成本、高性能的推理模型有可能在更广泛的应用场景中发挥重要作用,从而为各行各业带来更多创新机会。

总体而言,s1的开发为人工智能研究领域提供了一种新的思路,它不仅突破了传统模型训练的高成本壁垒,还开辟了推理能力研究的新天地。随着类似技术的推广,AI的实际应用将变得更加广泛和深入。

风险提示

登载此文出于传递更多信息之目的,并不意味着赞同其观点或证实其描述。文章内容仅供参考,不构成投资建议。投资者据此操作,风险自担!

热门推荐