战国时期,墨家学派的创始人墨子以“兼爱非攻”理念闻名于世。面对楚国欲用云梯攻宋的危局,墨子孤身赴楚都,以“守城九术”破解攻城之法。他不仅展示了高超的防御工事设计,更通过沙盘推演证明:真正的战略优势不在于资源堆积,而在于以巧破力的创新思维。这场博弈最终迫使楚国罢兵,成为中国古代科技智慧战胜蛮力的经典案例。
两千年后的今天,当中国人工智能公司DeepSeek以2000块显卡训练出对标OpenAI的模型震撼硅谷时,历史仿佛以另一种形式重演。这家由对冲基金转型而来的企业,在算力被美国芯片出口限制“卡脖子”的困境中,凭借算法创新与开源战略,实现了“四两拨千斤”的突围。其创始人梁文峰甚至受邀参与中国政府工作报告的讨论,被外界视为中国科技战略转型的象征。这场逆袭不仅颠覆了全球AI竞争格局,更打破了人们习以为常的“算力为王”的认知,从而带来了一系列深刻影响。接下来我们先看看DeepSeek是怎么发展起来的。
一、突围密码:在算力围城中开辟新战场
(1)算力困局催生“极限优化”
美国自2022年起实施的芯片出口管制,将中国AI企业置于“算力荒漠”。DeepSeek虽手握10000块A100显卡的早期储备,但相比OpenAI动辄数万块H100的算力规模,其硬件劣势如同冷兵器对阵火器。然而正是这种压迫,倒逼团队研发出多模态潜在注意力机制(MLA)和专家混合架构(MoE),通过算法重构将训练成本压缩至竞品的十分之一。这种“在螺蛳壳里做道场”的极致优化,甚至让Meta工程师在拆解其代码后感叹“仿佛看到魔法”。
(2)开源战略的“阳谋”
DeepSeek-R1模型全面开源,一方面是技术共享的理想主义,另一方面能快速构建生态。当美国企业因商业利益封闭技术时,中国团队通过开放源代码快速构建开发者生态,形成“用全球智慧对抗美国算力”的格局。这种策略既符合年轻科研者“解决世界级难题”的抱负,又巧妙规避了硬件劣势——正如墨子当年用沙盘推演替代实战消耗。
(3)金融基因的降维打击
DeepSeek团队来自国内的顶级量化基金幻方,真金白银的厮杀让DeepSeek拥有独特的“数据炼金术”。其团队将金融市场高频交易中的分布式计算优化与概率模型压缩技术跨界移植到AI训练,创造出“用2000块显卡实现行业标杆性能”的奇迹。这种将金融工程思维注入基础科研的路径,打破了传统互联网公司“堆资源换性能”的惯性。
DeepSeek最开始可能也没想到,它推出一个新模型居然给了世界一些不小的“中国冲击”。
(1)从“尾灯战略”到“换道超车”
不可否认,过去十年中国科技企业多遵循“跟随创新”模式,在既有技术路线上追赶西方。而DeepSeek选择在模型架构底层发起变革:其无监督强化学习框架绕过了OpenAI依赖的人类反馈微调(RLHF),直接从数据海洋中提炼认知逻辑。这种突破恰似墨子放弃城墙加高策略,转而设计可移动拒马与连弩机括——本质是对游戏规则的重新定义。
(2)科研组织的“轻骑兵模式”
与传统大厂“人海战术”不同,DeepSeek团队不足10人,核心成员多为清北应届博士。梁文峰坚信“解决世界难题才是顶级人才的兴奋剂”,通过提供自由探索环境与充足算力,激发年轻学者将论文成果快速工程化。这种“精锐小队+饱和资源”的配置,在硅谷巨头以及一众大公司层层审批的官僚体系中几乎不可能实现。
(3)技术民族主义的双刃剑
美国芯片管制意外激活了中国科技的“应激创新”能力。当西方企业沉迷于“暴力计算”时,中国团队被迫发展出更精巧的算法外科手术——正如战国工匠在青铜时代造出超越铁器的复合弓。但这种突破也加剧了旧有路线集团的反扑:Anthropic CEO呼吁加强出口管制,而Meta科学家则适时地开始担忧开源生态失控。
很多人在研究了DeepSeek及其背后的团队之后,直接断言说中国国运的转折已经到来,新文明形态已经破晓。
(1)创新范式的代际更替
DeepSeek现象揭示了一个残酷现实:当算力军备竞赛达到物理极限时,算法创新效率将成为决定性变量。其模型训练成本仅600万美元,都不如一个硅谷大公司高管的年薪,却实现了95%的性能价格比优势。这种“穷人的智慧”可能颠覆现有产业格局,如同指南针虽简陋,却开启了地理大发现时代。
(2)科技话语权的重新洗牌
梁文峰受邀参与政府工作报告研讨,标志着中国开始将“原创性基础研究”纳入国家战略。这与墨子受宋国重用的历史形成呼应——当防御需求催生技术创新时,工匠阶层开始进入权力中枢。DeepSeek的突围证明:在芯片、操作系统等传统赛道外,中国完全可以在算法层构建新的标准体系。
(3)文明竞争的本质回归
美国将DeepSeek崛起比作“AI界的斯普特尼克时刻”,却忽视了更深层隐喻:正如苏联卫星刺激了阿波罗计划,当前中美的竞争可能推动人类整体突破。梁文峰关于“语言即思维”的哲学思考,暗示着AI发展正从技术竞赛升维至文明认知重构。在这场关乎人类存在方式的革命中,任何国家的单极霸权都是伪命题。
回望墨子守城的故事,真正的启示不在于某次技术胜利,而在于揭示竞争的本质:当资源不对称时,智慧与创新才是破局关键。DeepSeek的突围不应简单解读为“中国崛起VS美国衰落”,而应视为人类智能进化史上的共同财富。
在这个算力与算法交织的新战国时代,或许我们需要重温墨家的古老智慧:最好的防守不是筑起更高的城墙,而是创造让攻城失去意义的全新规则。当DeepSeek将模型训练成本压缩90%时,它不仅在改写科技竞争规则,更在重塑人类对“可能性”的认知边界——这才是超越国族叙事的真正转折点。