随着对DeepSeek-V1、R1等系列模型的挖掘,超低成本、开源驱动、创新训练、本土AI等关键词引发了Deep-Seek的全球热潮。AI竞逐不断升温,发展态势瞬息万变,背后是不断掀翻“刻板印象”的中国初创力量。
有惊喜,是因为DeepSeek以较低成本实现了性能领先,掀翻了“更强模型必须更高算力、更高成本”的“刻板印象”。
根据测试数据,与OpenAI相比,DeepSeek-V3的能力与GPT-4o相近;在后训练阶段大规模使用强化学习技术后,DeepSeek-R1与o1不分高下。然而,如此领先的性能,根据其技术论文,V3的训练GPU成本仅为557.6万美元,所用GPU小时仅为278.8万个,低于标杆开源模型Llama-3.1所花费的10%。
更低的训练成本、更强的模型性能,使得DeepSeek的推理定价大幅降低至仅约OpenAI的3%,从而快速赢得用户的青睐。作为“土生土长”的中国AI,DeepSeek不仅是首个登顶中国区和美国区苹果应用商店免费榜的国产应用,还创造了史上最快突破日活跃用户3000万大关的纪录。
有惊诧,是因为DeepSeek“奇袭”硅谷,掀翻了AI前沿领域“美国引领、中国跟随”的“刻板印象”。
戏剧性的是,与DeepSeek-R1发布近乎同一时间,美国总统特朗普宣布美国政府将与OpenAI、甲骨文和软银合作,共同投资5000亿美元用于支持美国的人工智能基础设施建设,进一步巩固并彰显美国的“AI霸权”。
而DeepSeek的“横空出世”,解构了OpenAI的闭源“高墙”,绕过了英伟达高性能算力卡的禁售“封锁”,让美国在AI领域的“小院高墙”出现了裂痕,促使美国反思AI产业软硬件封锁是否有用和超高投入的AI发展路线是否正确。
有惊叹,是因为DeepSeek选择将模型开源,以共享推动AI创新与生态繁荣,掀翻了“闭源AI更领先”的“刻板印象”。
近年来,AI大模型闭源与开源的路线之争越发激烈,其核心矛盾在于如何解决大模型的投入与盈利的可持续问题。选择开源还是闭源,企业各有其考量,也有两方同时布局的选项。
显然,DeepSeek选择开源,对它维持自身的技术优势是不利的,但无疑对提振开源热情、壮大开源社区、繁荣AI生态是有利的。特别是开源AI大模型的自主定制、成本较低、社区活跃等特点,将极大激发我国在各应用场景部署、使用并进一步开发AI大模型的主动性。此外,引导更加开放、透明、共享的AI开源发展,将成为我国破局“小院高墙”“脱钩断链”的关键一招。
“DeepSeek的成功并非仅仅是中国AI的胜利,还是开源模型战胜了专有模型。”图灵奖获得者、Meta首席人工智能科学家杨立昆(Yann LeCun)对DeepSeek及中国AI发展成果不吝赞美,OpenAI、英伟达、微软、Meta等AI巨头也对DeepSeek高度重视。
从AI基础设施厂商、国产芯片厂商,到三家基础电信企业、阿里云、华为云、亚马逊AWS、微软Azure等国内外云计算巨头全面接入DeepSeek开源大模型,国家超算互联网平台正式上线,再到多媒体传媒、工业软件、自动驾驶等应用爆发——DeepSeek的成功,充分诠释了一家初创企业的“颠覆式”创新能产生怎样的“爆发力”。
DeepSeek团队的成功,不仅有望成为2025年中国AI应用全面爆发的启动点,还将极大鼓舞正在各领域积极寻求创新突破的年轻人,他们将成为我国在新一轮科技革命和产业变革中竞逐制高点的核心力量。
业界预计,2025年我国有望培养大模型应用开发人才30万~50万人,从“人口红利”转向“工程师红利”的趋势不断显现。高素质的人才队伍中必将涌现一批敢于创新、善于创新的初创团队,从高校到企业,他们将聚焦垂直领域,无论是技术创新还是工程创新,在推动科技创新和产业创新融合发展的春天来临时,他们将是承载希望、茁壮成长的“雨后春笋”。
关键词:
凡注有"环球传媒网"或电头为"环球传媒网"的稿件,均为环球传媒网独家版权所有,未经许可不得转载或镜像;授权转载必须注明来源为"环球传媒网",并保留"环球传媒网"的电头。