1月27日,苹果App Store中国区免费榜显示,近一周全球刷屏的DeepSeek一举登上首位。同时,DeepSeek在美国区苹果App Store免费榜从昨日的第六位飙升至第一位,超越ChatGPT、Meta旗下的社交媒体平台Threads、Google Gemini、Microsoft Copilot等美国科技公司的生成式AI产品。
据了解,这是历史首次中国应用同时在中国区和美国区苹果App Store占据第一位。
苹果APP Store美国区免费榜
苹果APP Store中国区免费榜
“物美价廉”硬刚OpenAI
“神秘的东方力量”一夜爆火
Deepseek来自国产大模型公司深度求索,系量化巨头幻方量化旗下大模型公司。
去年12月DeepSeek-V3发布后,AI数据服务公司Scale AI创始人Alexander Wang就发贴称,DeepSeek-V3是中国科技界带给美国的苦涩教训。“当美国休息时,中国(科技界)在工作,以更低的成本、更快的速度和更强的实力赶上。”
不到一个月之后,今年1月20日,DeepSeek正式开源R1推理模型。一经推出,DeepSeek-R1便凭借其“物美价廉”的特性在海外开发者社区中引发了轰动。
作为一款开源模型,R1在数学、代码、自然语言推理等任务上的性能能够比肩OpenAI o1模型正式版,并采用MIT许可协议,支持免费商用、任意修改和衍生开发等。目前,在国外大模型排名榜Chatbot Arena上,DeepSeek-R1的基准测试排名已经升至全类别大模型第三,与OpenAI的ChatGPT-4o最新版并列,并在风格控制类模型(StyleCtrl)分类中与OpenAI的o1模型并列第一。
DeepSeek-R1 API价格。图源:澎湃新闻
更令市场惊讶的是,据DeepSeek介绍,R1的预训练费用只有557.6万美元,在2048块英伟达H800 GPU(针对中国市场的低配版GPU)集群上运行55天完成,仅是OpenAI GPT-4o模型训练成本的不到十分之一。DeepSeek表示,R1在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下,极大提升了模型推理能力。此外,DeepSeek不仅将R1训练技术全部公开,还蒸馏了6个小模型向社区开源,允许用户借此训练其他模型。
英伟达高级研究科学家Jim Fan表示,DeepSeek-R1可能是“首个展示了RL(强化学习)飞轮可以发挥作用且能带来持续增长的OSS(开源软件)项目”。其中,“飞轮”用来形容AI系统中自我强化、正向循环的过程。DeepSeek的论文显示,不同于过去AI模型往往依赖于监督微调(SFT,指AI模型通过已标注的数据进行训练),R1完全由强化学习驱动,证明了直接强化学习是可行的。
DeepSeek震动全球AI圈
扎克伯格、周鸿祎、冯骥等纷纷点赞
发布一周之后,DeepSeek刷屏全球各大主流媒体和社交网站,引来多方关注和讨论。
1月26日,游戏科学创始人、CEO,《黑神话:悟空》制作人冯骥评价DeepSeek:可能是个国运级别的科技成果。
冯骥表示:“希望DeepSeek R1会让你对当前最先进的AI祛魅,让AI逐渐变成你生活中的水和电。太幸运了!太开心了!这样震撼的突破,来自一个纯粹的中国公司。知识与信息平权,至此又往前迈出了坚实的一步。”
此外,360集团创始人、董事长周鸿祎发微博称,相信将来如果要对抗美国的AI技术霸权,中国大模型技术复仇者联盟战队里一定有DeepSeek的一份,因为这家公司和它的创始人非常低调,他们技术能力和未来前景被市场严重低估了。
Meta创始人兼CEO扎克伯格表示,DeepSeek非常先进,并认为中美之间的AI差距非常小。扎克伯格还表示,中国正在全力冲刺,如果将来有一个开源模型能被全世界广泛使用,我们希望它是一个美国模型。
英伟达高级研究科学家Jim Fan在个人社交平台上表示:“我们正身处这样一个历史时刻:一家非美国公司正在延续OpenAI最初的使命——通过真正开放的前沿研究赋能全人类。看似不合常理,但最有趣的结局往往最可能成真。”
《福布斯》杂志则指出,DeepSeek的开源策略可能重塑全球AI标准,推动中国成为开源模型的主导者之一,其开放共享精神“为全人类提供了前所未有的机遇”。
《自然》杂志评价称,R1的强化学习架构和推理能力使其成为“经济实惠的OpenAI替代品”,其开放性远超闭源模型的“黑匣子”特性。
多只概念股涨停
横空出世让对手恐慌
1月27日早间,Deepseek概念股高开,每日互动、航锦科技、南威软件、美格智能竞价涨停,飞利信、卓创资讯、思特奇高开超10%。此外,AI概念股也同步走强,万国数据涨10%,第四范式涨近6%,金山云涨5%,百度集团涨近3%,商汤涨2%。
此前,1月24日,一条发布在匿名平台teamblind上的帖子疯传。一名Meta员工称,现在Meta内部因为DeepSeek的模型,已经进入恐慌模式。
这位Meta员工写道:“一切源于DeepSeek-V3的出现,它在基准测试中已经让Llama 4相形见绌。更让人难堪的是,一家‘仅用550万美元训练预算的中国公司’就做到了这一点。工程师们正在争分夺秒地分析DeepSeek,试图复制其中的一切可能技术。这绝非夸张。管理层正为GenAI研发部门的巨额投入而发愁。当部门里一个高管的薪资就超过训练整个DeepSeek V3的成本,而且这样的高管还有数十位,他们该如何向高层交代?DeepSeek-R1的出现让情况更加严峻。具体细节属于机密,不便透露,不过很快就会公开了。”
资料来源:中新经纬、澎湃新闻、九派新闻等
(大众新闻编辑 韩雨婷 整合 策划 张晨)
这些信息可能会帮助到你: 联系作者 | 报毒说明
修改版本软件,加群提示等均为修改者自留,非本站信息,注意鉴别
评论(0)