行业动态 | DeepSeek V3 上线，谷歌接力发布 Gemini 2.5 Pro

文/Doo Prime 2025-03-26 13:46:50

行业动态 | 3 月 25 日至 26 日，谷歌发布 Gemini 2.5 Pro，称其为“世界上最强大的模型”；同日稍早， OpenAI 发布新文生图模型，Altman 盛赞这是难以置信的产品；而此前一日， DeepSeek V3 刚刚上线，其性价比远超其他模型。与此同时，铜价飙至历史新高；调查显示美国消费者信心连跌四月。

铜价飙至历史新高

COMEX 铜期货盘中涨超 2.3%，刷新盘中历史新高至每磅 5.2105 美元，超越了去年 5 月 20 日创下的 5.199 美元的历史纪录。纽铜期货一度涨超 2.5%，最高报每磅 5.2255 美元。年初至今，美国铜价已累涨近 30%，与之相比，前两年的涨幅仅为 1.87% 和 3.39%。这是因为市场预计特朗普可能对铜征收高额进口关税，交易员提前买入纽铜期货进行布局。

美国消费者信心连跌四月

美国 3 月谘商会消费者信心指数降至 92.9，明显低于预期 94 和前值 100.1，创 2021 年年初以来新低、连续第四个月下滑。尤其是未来六个月的预期指数大幅跌至 65.2，创 12 年新低，且远低于通常预示经济衰退的 80 门槛。消费者对食品和关税影响的担忧加剧，未来 12 个月通胀预期率再次上升至 6.2%。股市看空情绪上升，仅 37.4% 的消费者预计股市上涨。

谷歌发布 Gemini 2.5 Pro，堪称“世界上最强大的模型”？

3 月 26 日，谷歌的全新模型 Gemini 2.5 Pro 深夜上线，它是一个“思考”模型，能够在回应前先进行思考推理，从而提升性能，并改善准确性。

谷歌称，它是世界上最强大的模型，具备统一的推理能力，以及用户所喜爱的 Gemini 的所有功能，如长上下文、工具等。Gemini 2.5 Pro 在多个基准测试中达到了 SOTA 水平。在不使用任何外部工具的条件下，它就在挑战人类知识和推理能力的极限前沿“人类最后的考试”中取得了 18.8% 的准确率，达到业界领先。无需使用测试阶段会增加计算成本的技术（如多数投票法），Gemini 2.5 Pro 就能在 GPQA 和 AIME 2025 等数学和科学基准评测中表现卓越。

目前， Gemini 2.5 Pro 在 LMArena 上排名第一，而且创下了历史最大分数飞跃，比 Grok-3、GPT-4.5 整整高出了 40 分！在代号“nebula”的测试中，它也横扫所有类别夺得第一，并且独揽数学、创意写作、指令遵循、长查询和多轮对话五大领域的冠军。此外，Gemini 2.5 Pro 还成功登顶了视觉竞技场（Vision Arena）排行榜榜首！

Gemini 2.5 Pro 现已在 Google AI Studio 和 Gemini 应用中，向 Gemini Advanced 用户开放，并将很快在 Vertex AI 上推出。而它的定价方案，会在未来几周内公布，用户可以在更高使用配额下，将模型应用于大规模生产环境。

OpenAI 发布新文生图模型，Altman 盛赞难以置信

同日稍早凌晨 2 点，OpenAI 进行了技术直播，对 GPT-4o 和 Sora 进行了重大更新，提供了全新文生图模型。除了文生图之外，该模型还支持自定义操作、连续发问、风格转换、图像PPT等超实用功能，例如，更改图片的宽高比、图像物体中的角度，用十六进制代码指定精确颜色等。

对于新的文生图模型，OpenAI 创始人兼 CEO Sam Altman 给出了非常高的评价，“这是一项令人难以置信的产品。我还记得看到这个模型最初生成的一些图像时，很难相信它们真的是由人工智能创作的。我们认为大家会喜欢它，并且很期待看到由此激发的创造力。”

新的文生图模型已在 ChatGPT 和 Sora 中开始向所有 Plus、Pro、Team 和免费用户推出，而面向企业版、教育版和 API 即将到来。

DeepSeek V3 上线，性价比远超其他模型

不仅如此，此前 25 日，DeepSeek 在毫无预告的情况下，悄悄上线了 DeepSeek-V3-0324。

作为一个没有思维链的非推理模型，DeepSeek-V3-0324 模型在推理类任务上的表现可圈可点。根据第三方评测，新版的 DeepSeek-V3 模型与 Grok-3 打平，并列传统对话类模型榜首。但其最大的亮点是，DeepSeek-V3-0324 的输入价格是 Claude-3.7-Sonnet 的 1/11，GPT-4.5 的 1/277。

此外，这次开源同样是 MIT 许可证——可以免费用于商业用途。