老外都看懵了！花买车位的钱搞AI，竟直接拿下了Nature封面！

热点资讯

推荐资讯

产品展示你的位置：意昂体育 > 产品展示 >

意昂体育介绍

产品展示

新闻动态

老外都看懵了！花买车位的钱搞AI，竟直接拿下了Nature封面！

发布日期：2025-10-07 22:05 点击次数：71

说出来你可能不信，搞出个世界顶尖的AI模型，花的钱可能还不够在北京买个像样的车位。

就29.4万美元，512张H800显卡跑了80个小时，这事儿就办成了。在动辄烧掉数千万美元的AI竞赛里，这个数字听起来像个笑话。可就是这个“笑话”，在9月17号，直接登上了《Nature》的封面，这是中国AI头一回享受到这种待遇。

老外们确实有点蒙。过去大家玩AI，都跟练独门秘籍似的，训练数据、算法模型，全都藏着掖着，生怕别人学了去，整个行业像个巨大的“黑箱”。结果DeepSeek这帮人倒好，直接把箱子给拆了。他们搞的这个DeepSeek-R1，老老实实接受了8个国际专家长达5个月的“拷问”，那份长达64页的审稿报告和作者回复，一字不落地全公开了。

等于说，他们把自己的家底——训练数据、算法架构这些东西，全摊在了桌面上，任由全世界的同行检验。清华大学的沈阳教授一句话说得很到位：这是要把AI重新拉回到科学共同体的规矩里来。你行不行，不是你自己说了算，得让大家评评。

当然，马上就有人跳出来说，你们是不是走了捷径，偷偷“蒸馏”了GPT-4的技术？这种质疑很正常，毕竟成本低得太离谱了。DeepSeek团队也没回避，在补充材料里一条条回应：我们的训练数据截止到2024年7月，那时候GPT-4o还没出来呢；为了保证数据干净，我们筛掉了600万条可能有问题的样本，还找了第三方来验证。连审稿人之一的Lewis Tunstall都觉得，现有的证据足够说明，他们是靠自己的强化学习搞出来的。

这个叫GRPO的强化学习框架，算是他们的一个“秘密武器”。简单说，就是让模型不再依赖人工喂给它的“标准答案”，而是通过结果好坏自己去学怎么推理，自己进化。这就好比教小孩下棋，不是一步步教他怎么走，而是让他自己跟自己下，赢了有糖吃，输了没得吃，慢慢地他就自己悟出棋道了。

这帮人的背景也挺有意思。带头的梁文锋是个湛江人，本硕都在浙江大学读的。团队里大部分核心成员，都没有那种在海外大厂镀过金的光鲜履历。就是这么一支本土队伍，开发的模型在Hugging Face平台上下载量超过了1090万次，成了全球最受欢迎的开源推理模型之一。

这事一出，国际上的反应也五花八门。《金融时报》承认中国的AI确实在搅动全球的棋局，而《纽约时报》则老调重弹，拐弯抹角地质疑你的“伦理约束”是不是不够。但《Nature》的社论说得很明白，DeepSeek开创了一种“可验证的声誉资本”模式，给整个AI研究立了个新规矩：以后别光吹牛，拿出真东西来让大家验一验。

在芯片出口受限的大背景下，这种靠算法创新杀出一条血路的故事，就显得格外有分量。他们甚至还搞出了一个轻量版的R1-Micro模型，让那些没那么多钱、没那么多算力的中小机构也能玩得起前沿研究，这等于是在打破巨头们的算力垄断。

这已经不只是一个技术上的突破了。它标志着中国AI正在从一个追赶者，慢慢尝试着去成为一个制定规则的人。

过去，AI的牌桌上，玩家们都把自己的底牌捂得死死的。现在，有人直接把牌摊开放在了桌上，还告诉所有人他是怎么算的牌。这下，游戏还怎么玩下去？

上一篇：阳江小程序商城系统开发

下一篇：当存款变成笑话，一个叫“固收+”的缝合怪，凭什么成了万亿资金