- 发布日期:2025-02-02 21:22 点击次数:54
智东西 1 月 27 日报道,今日,"国产 AI 之光" DeepSeek 把美股"打爆"了。
DeepSeek 这些天俨然一副"杀疯了"的架势,今日再创历史时刻:力压 ChatGPT,登顶美区 App Store 免费榜,在国内 App Store 免费榜同样位居第一。
美区 App Store 免费榜 Top100 中,DeepSeek 和 ChatGPT 跻身前三,谷歌 Gemini 排第 33 名,其他明星 AI 聊天机器人 App 则了无踪影。在 TikTok 被迫下架的空档期,DeepSeek 再度霸榜美国应用商店,展现出中国应用程序惊人的出海影响力。
市场迅速做出反应,刚被美国 3.6 万亿元"星际之门" AI 巨型项目重振的纳斯达克 100 指数迷你期货,哐哐下跌超过 300 点。
这是中国 AI 带给美国的最新暴击。
在国内,DeepSeek 也"刷屏"股市,AI 智能体、AI 语料等概念股领涨。相关炒作亦是闻风而动,与 DeepSeek 关联的股东、合作伙伴被相继挖出,名单涉及浙江东方、华金资本等股权关联方,浪潮信息、中科曙光、润泽科技、航锦科技等算力基础设施供应商,拓尔思、科大讯飞、金山办公等垂直领域合作方,南威软件、并行科技等技术合作方,每日互动、卓创资讯等数据与生态合作方 ……
《黑神话:悟空》制作人冯骥专门发了篇小作文,盛赞 DeepSeek "可能是个国运级别的科技成果"、"会让你对当前最先进的 AI 祛魅",让知识和信息平权"又往前迈出了坚实的一步"。
他总结了 DeepSeek 做到的六大突破:强大、便宜、开源、免费、联网、本土。
这个横空出世的"神秘东方力量",正凭借这些突破在硅谷引起连连巨震,令许多顶尖 AI 竞争对手手忙脚乱。
就在两天前,美国财经媒体 CNBC 针对 DeepSeek 制作了一期长达 40 分钟的专题视频报道,标题为《中国新型 AI 模型 DeepSeek 如何威胁美国主导地位》。目前这个视频观看量已经超过 200 万。
评论有上万条。其中一则高赞评论称受够了"威胁论",任何中国和其他国家的进步都是美国的"威胁";另一则评论拿 DeepSeek 与 OpenAI 作对比,说 DeepSeek 开放开源,OpenAI 却封闭且保密,颇具讽刺意味。
应对来势汹汹的 DeepSeek,OpenAI 联合创始人兼 CEO Sam Altman 发文预告 ChatGPT 免费套餐将可用 o3-mini。Meta 被曝紧急成立 4 个作战小分队,层层拆解 DeepSeek 模型的技术秘诀。OpenAI 等其他顶级 AI 公司的研究人员也一直在仔细研究 DeepSeek 模型如何做到更便宜高效。
DeepSeek 成立于 2023 年 5 月,背靠国内对冲基金巨头,因开源和低价而闻名,素有" AI 界拼多多"、"国产 AI 价格屠夫"之称。
就在一周前,DeepSeek 推出性能媲美 OpenAI o1 模型的推理模型 R1,成本仅用了 o1 的一小部分,而且开源,API 付费价格远低于 o1,App 和网页版均支持免费使用,还支持联网搜索。
开源意味着只要你的电脑配置充足,你就可以用 Ollama 等应用把最大版本的 R1 模型下载到电脑本地,充分保护隐私和数据安全。你也可以把 DeepSeek R1 1.5B 版本部署到手机,让它在手机本地的 Web 浏览器上流畅运行。免费使用意味着在联网状态下,你不用花钱,就能享受 ChatGPT 付费用户每月花 20 美元、200 美元才能使用的高端模型。
这让大众看到了真正的 AI 自由。
短短几天之内,DeepSeek 已经成为硅谷讨论最多的公司,被视作"威胁美国 AI 巨头"的存在。一些外媒将 DeepSeek R1 的问世比作"中国的 ChatGPT 时刻",称其"打破了美国在 AI 领域无敌的论调",令整个硅谷嗡嗡作响。
硅谷顶级风投 a16z 的创始人 Marc Andreeseen 发文评论说,DeepSeek 是"我见过的最令人惊叹、令人印象深刻的突破之一","作为开源,是给世界的一份意义深远的礼物"。
斯坦福大学计算机科学系客座教授吴恩达在第 55 届世界经济论坛上说对 DeepSeek 的进展印象深刻,微软董事长兼 CEO 萨提亚 · 纳德拉表态"必须非常非常认真地对待中国的这些进展"。
许多网友夸赞 DeepSeek 成为"新晋开源 AI 之王",其影响就像安卓之于移动生态。英伟达高级研究经理兼 GEAR Lab 联合创始人 Jim Fan 发文称赞:"一家非美国公司正在让 OpenAI 的最初使命继续存在——真正开放、前沿的研究,赋能所有人。" Meta 首席 AI 科学家杨立昆说,DeepSeek 的成功表明开源模型正在超越专有模型,开源将使每个人都从中受益。
在国内,DeepSeek R1 的文笔已经风靡社交平台。它能够模仿不同语言风格,洋洋洒洒输出各种奇妙的金句,写出文采斐然的精彩文章,不过仍不能解决严重的幻觉问题。让 DeepSeek R1 一句话辣评竞品,它也能给出非常有梗的毒舌点评:
AI 社区的活力被持续激发。软件作曲家 Riley Brown 分享自己使用 DeepSeek 推理模型,在短短 1 小时内,创建了 AI 搜索引擎 Perplexity AI 的克隆版。他说自己没写一行代码。
来自 AI 实验室 EXO Labs 的 Alex Cheema 分享说,他把 7 台 M4 Pro Mac mini 和一台 M4 Max MacBook Pro 相连来运行 DeepSeek R1,总内存 496GB,利用 EXO Labs 的分布式推理和 4bit 量化来实现"在家 AGI "。
Y Combinator 首席执行官 Garry Tan 今日发文分享他的使用体验:"经过几次查询后,DeepSeek 搜索感觉更加可靠,因为看到推理过程(乃至它对自己知道什么和可能不知道什么有多么认真)会大大增加用户的信任。"
此前一则在硅谷匿名八卦分享平台 Blind 上发布的消息广为流传,称 Meta 因 DeepSeek 的成功而陷入危机。另据 The Information 今日援引 Meta 员工消息,Meta AI 基础设施主管 Mathew Oldham 等高管担心 Meta 的下一代 Llama 旗舰模型的表现不会像 DeepSeek 那么出色。
据说 Meta 生成式 AI 团队和基础设施团队已经启动 4 个作战小分队来剖析 DeepSeek 工作原理:
小分队 1 和 2 试图搞清楚 DeepSeek 是如何降低训练和运行成本的;小分队 3 负责研究 DeepSeek 可能使用了哪些数据来训练模型;小分队 4 正在考虑基于 DeepSeek 模型的属性重组 Meta 模型的新技术。
Meta 计划将从中吸取的经验用于改进 Llama。下一个版本的 Llama 可能将在本季度发布,将包括多款模型。
"我们在开发过程中定期评估所有竞争模型,自从(公司的)生成式 AI(团队)成立以来,我们就一直这样做。" Meta 发言人 Jon Carvill 在一份声明中说," Llama 一直是建立开源 AI 模型生态系统的基础,我们对即将发布的 Llama 4 扩展这一领先地位感到非常兴奋。"
一些 AI 公司已经考虑转向 DeepSeek。
Together AI 是一家帮助开发者运行和调整开放权重模型的 AI 公司。其联合创始人兼 CEO Vipul Ved Prakash 说,过去两周,他们每天都将 DeepSeek 模型的运行能力提高 1 倍,以满足客户需求;许多客户已经从 Anthropic 的 Claude 3.5 Sonnet 转向 DeepSeek 模型,用于 AI 编程。
企业级 AI 代理开发商 SuperFocus 的联合创始人 Steve Hsu 一直在使用上个月发布的 DeepSeek v3 模型,认为它的性能与为 SuperFocus 大部分生成式 AI 功能提供支持的 OpenAI 旗舰模型 GPT-4 相似甚至更好。他说 SuperFocus 可能会在未来几周转向 DeepSeek,因为 DeepSeek 可以免费下载、在自家服务器上存储和运行,并将增加销售产品的利润率。
" DeepSeek 效应"令美股陷入动荡,更给美国 AI 公司们带来了空前紧迫感。
中国 AI 公司证明了用有限的计算资源,足以做出顶尖水平的模型。OpenAI 估值已经高达 1570 亿美元,如果不能确保在 AI 前沿赛道遥遥领先,又不能展现出显著的投资回报率,如何证明其高估值和高开销的合理性?
AI 经济效益悬而未决,而美国正计划大举砸钱投入 AI 基础设施。就在上周,美国新任总统特朗普宣布 OpenAI、甲骨文、软银将成立一家合资企业"星际之门项目",未来四年斥资 5000 亿美元(约合人民币 3.6 万亿元)建设新的 AI 数据中心。(特朗普宣布 AI 巨型项目:3.6 万亿!)
今年早些时候,微软宣布将投入 800 亿美元用于 AI 数据中心建设。Meta 创始人扎克伯格也在上周发文,称今年将是" AI 决定性的一年",Llama 4 将成为领先的 SOTA 模型,Meta 正在建设一个 2GW+ 数据中心,将拥有超过 130 万块 GPU,计划今年将 600 亿 ~650 亿美元用于资本支出。
记者 Holger Zschaepitz 评价 DeepSeek 可能是对美国股市的最大威胁,因为该模型引发了对数千亿美元资本支出的效用的质疑。Garry Tan 则认为 DeepSeek 的成功对美国竞争对手有好处:"如果训练模型变得更便宜、更快、更容易,那么对推理(实际使用 AI)的需求将增长和加速得更快,这确保了计算的供应将被使用。"
在去年 7 月接受《暗涌》采访时,DeepSeek 创始人梁文锋曾谈道,DeepSeek 押注了三个方向:一是数学和代码,二是多模态,三是自然语言本身。他认为过去三十多年 IT 浪潮里,中国基本没有参与到真正的技术创新里,随着经济发展,中国也要逐步成为贡献者,而不是一直搭便车。
股市的激烈波动或许短暂,通往 AGI 的发展路径也尚不明晰。但显而易见,DeepSeek R1 正在改写 AI 游戏规则。它所代表的中国 AI 开源力量扇动翅膀,已经在全球科技产业刮起影响深远的飓风。