行业动态 | DeepSeek V3 上线,谷歌接力发布 Gemini 2.5 Pro

文/Doo Prime 2025-03-26 13:46:50

行业动态 | 3 月 25 日至 26 日,谷歌发布 Gemini 2.5 Pro,称其为“世界上最强大的模型”;同日稍早, OpenAI 发布新文生图模型,Altman 盛赞这是难以置信的产品;而此前一日, DeepSeek V3 刚刚上线,其性价比远超其他模型。与此同时,铜价飙至历史新高;调查显示美国消费者信心连跌四月。  

COMEX 铜期货盘中涨超 2.3%,刷新盘中历史新高至每磅 5.2105 美元,超越了去年 5 月 20 日创下的 5.199 美元的历史纪录。纽铜期货一度涨超 2.5%,最高报每磅 5.2255 美元。年初至今,美国铜价已累涨近 30%,与之相比,前两年的涨幅仅为 1.87% 和 3.39%。这是因为市场预计特朗普可能对铜征收高额进口关税,交易员提前买入纽铜期货进行布局。

美国 3 月谘商会消费者信心指数降至 92.9,明显低于预期 94 和前值 100.1,创 2021 年年初以来新低、连续第四个月下滑。尤其是未来六个月的预期指数大幅跌至 65.2,创 12 年新低,且远低于通常预示经济衰退的 80 门槛。消费者对食品和关税影响的担忧加剧,未来 12 个月通胀预期率再次上升至 6.2%。股市看空情绪上升,仅 37.4% 的消费者预计股市上涨。 

3 月 26 日,谷歌的全新模型 Gemini 2.5 Pro 深夜上线,它是一个“思考”模型,能够在回应前先进行思考推理,从而提升性能,并改善准确性。 

谷歌称,它是世界上最强大的模型,具备统一的推理能力,以及用户所喜爱的 Gemini 的所有功能,如长上下文、工具等。Gemini 2.5 Pro 在多个基准测试中达到了 SOTA 水平。在不使用任何外部工具的条件下,它就在挑战人类知识和推理能力的极限前沿“人类最后的考试”中取得了 18.8% 的准确率,达到业界领先。无需使用测试阶段会增加计算成本的技术(如多数投票法),Gemini 2.5 Pro 就能在 GPQA 和 AIME 2025 等数学和科学基准评测中表现卓越。 

目前, Gemini 2.5 Pro 在 LMArena 上排名第一,而且创下了历史最大分数飞跃,比 Grok-3、GPT-4.5 整整高出了 40 分!在代号“nebula”的测试中,它也横扫所有类别夺得第一,并且独揽数学、创意写作、指令遵循、长查询和多轮对话五大领域的冠军。此外,Gemini 2.5 Pro 还成功登顶了视觉竞技场(Vision Arena)排行榜榜首! 

Gemini 2.5 Pro 现已在 Google AI Studio 和 Gemini 应用中,向 Gemini Advanced 用户开放,并将很快在 Vertex AI 上推出。而它的定价方案,会在未来几周内公布,用户可以在更高使用配额下,将模型应用于大规模生产环境。 

同日稍早凌晨 2 点,OpenAI 进行了技术直播,对 GPT-4o 和 Sora 进行了重大更新,提供了全新文生图模型。除了文生图之外,该模型还支持自定义操作、连续发问、风格转换、图像PPT等超实用功能,例如,更改图片的宽高比、图像物体中的角度,用十六进制代码指定精确颜色等。 

对于新的文生图模型,OpenAI 创始人兼 CEO Sam Altman 给出了非常高的评价,“这是一项令人难以置信的产品。我还记得看到这个模型最初生成的一些图像时,很难相信它们真的是由人工智能创作的。我们认为大家会喜欢它,并且很期待看到由此激发的创造力。” 

新的文生图模型已在 ChatGPT 和 Sora 中开始向所有 Plus、Pro、Team 和免费用户推出,而面向企业版、教育版和 API 即将到来。  

不仅如此,此前 25 日,DeepSeek 在毫无预告的情况下,悄悄上线了 DeepSeek-V3-0324。 

作为一个没有思维链的非推理模型,DeepSeek-V3-0324 模型在推理类任务上的表现可圈可点。根据第三方评测,新版的 DeepSeek-V3 模型与 Grok-3 打平,并列传统对话类模型榜首。但其最大的亮点是,DeepSeek-V3-0324 的输入价格是 Claude-3.7-Sonnet 的 1/11,GPT-4.5 的 1/277。 

此外,这次开源同样是 MIT 许可证——可以免费用于商业用途。 

 

分享按钮-->

相关新闻