老外都看懵了!花买车位的钱搞AI,竟直接拿下了Nature封面!

发布日期:2025-10-07 22:05    点击次数:63

说出来你可能不信,搞出个世界顶尖的AI模型,花的钱可能还不够在北京买个像样的车位。

就29.4万美元,512张H800显卡跑了80个小时,这事儿就办成了。在动辄烧掉数千万美元的AI竞赛里,这个数字听起来像个笑话。可就是这个“笑话”,在9月17号,直接登上了《Nature》的封面,这是中国AI头一回享受到这种待遇。

老外们确实有点蒙。过去大家玩AI,都跟练独门秘籍似的,训练数据、算法模型,全都藏着掖着,生怕别人学了去,整个行业像个巨大的“黑箱”。结果DeepSeek这帮人倒好,直接把箱子给拆了。他们搞的这个DeepSeek-R1,老老实实接受了8个国际专家长达5个月的“拷问”,那份长达64页的审稿报告和作者回复,一字不落地全公开了。

等于说,他们把自己的家底——训练数据、算法架构这些东西,全摊在了桌面上,任由全世界的同行检验。清华大学的沈阳教授一句话说得很到位:这是要把AI重新拉回到科学共同体的规矩里来。你行不行,不是你自己说了算,得让大家评评。

当然,马上就有人跳出来说,你们是不是走了捷径,偷偷“蒸馏”了GPT-4的技术?这种质疑很正常,毕竟成本低得太离谱了。DeepSeek团队也没回避,在补充材料里一条条回应:我们的训练数据截止到2024年7月,那时候GPT-4o还没出来呢;为了保证数据干净,我们筛掉了600万条可能有问题的样本,还找了第三方来验证。连审稿人之一的Lewis Tunstall都觉得,现有的证据足够说明,他们是靠自己的强化学习搞出来的。

这个叫GRPO的强化学习框架,算是他们的一个“秘密武器”。简单说,就是让模型不再依赖人工喂给它的“标准答案”,而是通过结果好坏自己去学怎么推理,自己进化。这就好比教小孩下棋,不是一步步教他怎么走,而是让他自己跟自己下,赢了有糖吃,输了没得吃,慢慢地他就自己悟出棋道了。

这帮人的背景也挺有意思。带头的梁文锋是个湛江人,本硕都在浙江大学读的。团队里大部分核心成员,都没有那种在海外大厂镀过金的光鲜履历。就是这么一支本土队伍,开发的模型在Hugging Face平台上下载量超过了1090万次,成了全球最受欢迎的开源推理模型之一。

这事一出,国际上的反应也五花八门。《金融时报》承认中国的AI确实在搅动全球的棋局,而《纽约时报》则老调重弹,拐弯抹角地质疑你的“伦理约束”是不是不够。但《Nature》的社论说得很明白,DeepSeek开创了一种“可验证的声誉资本”模式,给整个AI研究立了个新规矩:以后别光吹牛,拿出真东西来让大家验一验。

在芯片出口受限的大背景下,这种靠算法创新杀出一条血路的故事,就显得格外有分量。他们甚至还搞出了一个轻量版的R1-Micro模型,让那些没那么多钱、没那么多算力的中小机构也能玩得起前沿研究,这等于是在打破巨头们的算力垄断。

这已经不只是一个技术上的突破了。它标志着中国AI正在从一个追赶者,慢慢尝试着去成为一个制定规则的人。

过去,AI的牌桌上,玩家们都把自己的底牌捂得死死的。现在,有人直接把牌摊开放在了桌上,还告诉所有人他是怎么算的牌。这下,游戏还怎么玩下去?



上一篇:阳江小程序商城系统开发

下一篇:没有了