DeepSeek最新模型硬刚o1！英伟达科学家等大佬：这才配叫OpenAI开云APP下载

开云体育NEWS CENTER

您当前位置：首页 > 开云体育

DeepSeek最新模型硬刚o1！英伟达科学家等大佬：这才配叫OpenAI开云APP下载

2025-04-10

浏览次数：次

返回列表

　　开云体育[永久网址:363050.com]成立于2022年在中国，是华人市场最大的线上娱乐服务供应商而且是亚洲最大的在线娱乐博彩公司之一。包括开云、开云棋牌、开云彩票、开云电竞、开云电子、全球各地赛事、动画直播、视频直播等服务。开云体育,开云体育官方,开云app下载,开云体育靠谱吗,开云官网，欢迎注册体验！1月20日，月之暗面推出多模态思考模型Kimi k1.5，DeepSeek开源R1推理模型，双双“硬刚”OpenAI。性能测试显示，这两款模型在多项测试中能与o1“叫板”。R1更是得到英伟达高级研究科学家Jim Fan等一众业界大佬的称赞。不过，R1与开源模型V3一样，面临着幻觉问题。

　　OpenAI怎么也没想到，o3还在画饼阶段，中国一夜之间就冒出来两个能和o1打对台的模型。

　　1月20日，月之暗面正式推出多模态思考模型Kimi k1.5，并首次公开该模型的训练技术报告。

　　Kimi k1.5在short-CoT（短链思考）方面达到领先水平，在其他多个测试中也大幅超越GPT-4和Claude Sonnet 3.5。在Long-CoT（长链思考）方面，该模型在多个领域的表现也与o1持平。

　　同一天，DeepSeek也正式开源R1推理模型，并发布技术报告。R1在多个基准测试中也与o1持平，并且成本只有o1的三十分之一。

　　不过，R1依然面临着开源模型V3一样的毛病。有网友向它提问“谁训练你的”时，它回答道：“我是被OpenAI开发的”。

　　月之暗面表示，这应该是全球范围内，有OpenAI之外的公司首次实现o1正式版的多模态推理性能。

　　同一天，DeepSeek也正式开源R1推理模型，允许所有人在遵循MIT License（注：被广泛使用的一种软件许可条款）的情况下，蒸馏R1训练其他模型。

　　更重要的是，R1的价格只有o1的约三十分之一，百万token输出只需16元人民币，相较而言，o1的百万token输出需要60美元（约合人民币436元）。

　　另外，R1的参数量较低，开发人员可以用相对较低的成本在本地运行模型。Exo Lab创始人Alex Cheema在家使用7个MacMini串联一个MacBook成功运行起了R1模型。他感叹道：“AGI（通用人工智能）到家了。”

　　R1的技术文档发布后，英伟达高级研究科学家Jim Fan第一时间对论文进行研究，之后发出了这样的感慨：“我们生活在这样一个时代：由非美国公司保持OpenAI最初的使命做真正开放的前沿研究、为所有人赋能。”

　　他补充道：“DeepSeek-R1不仅开源了大量模型，还泄露了所有训练秘密。他们可能是第一个显示 RL（强化学习）飞轮发挥主要作用、持续增长的OSS项目。（对AI研究的）影响不仅可以通过内部实现了ASI或草莓计划等神话名称来实现，也可以通过简单地转储原始算法和matplotlib学习曲线来产生影响。”

　　Jim Fan的每一句话都在戳喜欢搞神秘，卖期货的OpenAI的肺管子。

　　实际上，业界有这种看法的人还不少。Abacus ai的CEO Bindu Reddy评价道：“这是开源AGI的胜利，一家来自中国的小型初创公司击败了所有人”。

　　除了对OpenAI的讽刺之外，Jim Fan还深入解读了R1模型的创新之处。

　　他表示，R1模型纯粹由RL驱动，完全没有SFT（“冷启动”）。这让人想起 AlphaZero从头开始掌握围棋、将棋和国际象棋，而无需先模仿人类大师级的动作。

　　而且，R1使用由硬编码规则计算的真值奖励，避免使用任何RL容易攻击的学习奖励模型。随着训练的进行，模型的思考时间稳步增加。Jim Fan强调，这不是预先编程好的，而是一种模型自主的突发特性，并且模型也出现了自我反省和探索行为。

　　DeepSeek还使用了一种名为GRPO（组相对策略优化）的新优化方法，有效减少了内存使用。GRPO由DeepSeek于2024年2月发明。这也是为什么家用设备也能完整运行R1的原因。

　　基于此，有网友指出，鉴于Deepseek仍在使用GRPO等GPU性能较差的方法，可以推断出，该公司可能没有很多功能强大的Hopper GPU。这意味着，算力训练成本也是极低的。

　　有网友评价，这是AI的“顿悟时刻”：“R1-Zero（注：R1是R1-Zero调整后的模型）证明模型可以自我开发推理策略。举个例子：当遇到问题时，它学会了回溯并质疑其最初的假设这是一种从未明确编程的行为。”这代表着DeepSeek的新模型已经能够具有像人类一样的自主学习能力了。

　　知名AI评测员Matthew Berman表示，R1拥有他所见过的最像人类的内心独白。

　　然而，R1依然面临着开源模型V3一样的毛病。有网友向他提问谁训练你的时，它回答道：“我是被OpenAI开发的”。

　　如需转载请与《每日经济新闻》报社联系。未经《每日经济新闻》报社授权，严禁转载或镜像，违者必究。

　　特别提醒：如果我们使用了您的图片，请作者与本站联系索取稿酬。如您不希望作品出现在本站，可联系我们要求撤下您的作品。

　　五大维度评测OpenAI全新o1模型：代码编写、游戏制作等能力“惊艳”，事实性知识却“翻了车”

　　OpenAI王炸新一波：向开发者开放满血o1，测试中全面超越人类博士专家，准确率达到78.3%

　　Deepseek、Kimi争相对标“o1”，初创公司能打破“技术”和“用户”二选一魔咒吗？

　　欧盟反制，对美加征25%关税！欧洲股市跌幅扩大，美股三大指数集体上涨！冯德莱恩：欧盟将像激光束一样聚焦美国以外的83%全球贸易

　　中方强硬反制：四箭齐发！美股突发大跳水，美元大跌！油价暴跌，黄金飙涨……

　　中国对美加征84%关税正式生效！欧盟反制美国，法财长：“有分寸且极其强硬”！美媒：特朗普关税政策重创美六代战机计划

　　最新！文旅部对赴美中国游客发布风险提示！美国国际游客人数“断崖式”下跌！美加航班预定量锐减七成……

　　中国对美加征84%关税，海关总署发布细则；欧盟对美加征25%关税；特朗普威胁台积电；美股反弹，原油、黄金大涨丨每经早参

　　“搞钱色交易，境内办事、境外收钱……”，中海油原总经理李勇被控受贿6794万余元，他曾年薪近百万

上一篇：开云APP下载DeepSeek再发新模型

首页

关于我们

开云体育

产品展示

留言板

咨询研究

联系我们

开云体育NEWS CENTER

DeepSeek最新模型硬刚o1！英伟达科学家等大佬：这才配叫OpenAI开云APP下载