行业信息情报站

半导体、AI、新能源行业情报分析

0%

AI 行业简报 -2026-03-24

🚀 模型发布

MiniMax M2.7:自进化的早期迹象

MiniMax M2.7 展现自进化早期迹象。经过三次试验,每次 24 小时迭代进化,M2.7 训练的 ML 模型随时间推移持续获得更高奖牌率。最终最佳运行获得 9 金 5 银 1 铜,平均奖牌率 66.6%,仅次于 Opus-4.6 (75.7%) 和 GPT-5.4 (71.2%),与 Gemini-3.1 (66.6%) 持平。

[来源:MiniMax] 查看详情 | 2026-03-23


MiniMax M2.5:专为现实世界生产力打造 ⭐

MiniMax M2.5 正式发布,专为现实世界生产力打造。在数十万复杂现实环境中通过强化学习广泛训练,M2.5 在编码、智能体工具使用和搜索、办公工作等经济价值任务上达到 SOTA 水平。SWE-Bench Verified 得分 80.2%,Multi-SWE-Bench 得分 51.3%,BrowseComp 得分 76.3%(含上下文管理)。M2.5 执行复杂智能体任务速度极快,SWE-Bench Verified 评估比 M2.1 快 37%,速度匹配 Claude Opus 4.6。

[来源:MiniMax] 查看详情 | 2026-03-24


Cursor 的 Composer 2 击败 Claude Opus 4.6

Cursor 的新一代编码模型 Composer 2 发布,击败 Claude Opus 4.6 但仍落后 GPT-5.4。在 Terminal-Bench 2.0(衡量 AI 智能体在命令行终端界面执行任务能力)上,GPT-5.4 仍以 75.1 分领先,Composer 2 得分 61.7,领先 Opus 4.6 的 58.0 分。

[来源:VentureBeat] 查看详情 | 2026-03-24


📊 模型对比

我花费 9800 美元在生产环境测试 GPT-5.4 与 Claude Opus 4.6

花费 9800 美元在生产环境测试 GPT-5.4 与 Claude Opus 4.6。OpenAI 新旗舰模型 3 月 5 日发布,声称具有最佳推理能力。

[来源:Medium] 查看详情 | 2026-03-23


Composer 2:下一代 AI 编码模型

Composer 2 是 Cursor 开发的下一代 AI 编码模型,专为软件工程任务设计。以前沿水平编码性能提供,成本比 Claude Opus 4.6 等竞争对手低达 10 倍。

[来源:CometAPI] 查看详情 | 2026-03-24


📰 行业动态

OpenAI 与 Broadcom 合作定制 AI 芯片

OpenAI 与 Broadcom 合作定制 AI 芯片。2024 年,OpenAI 开始与 Broadcom 合作设计能够同时进行训练和推理的定制 AI 芯片,目标 2026 年大规模生产,由台积电采用 3nm 工艺节点制造。

[来源:Wikipedia] 查看详情 | 2026-03-23


LLM 今日新闻(2026 年 3 月)

LLM 今日新闻(2026 年 3 月)。LLM Stats 提供全面的 LLM 新闻,涵盖所有主要提供商。LLM 更新包括 GPT、Claude、Gemini、Llama 和其他模型系列。聚合来自 TechCrunch、The Verge、VentureBeat 和官方 AI 实验室公告的新闻。

[来源:LLM Stats] 查看详情 | 2026-03-24


数据来源:MiniMax, VentureBeat, CometAPI, Medium, Wikipedia, LLM Stats 等权威媒体
生成时间:2026-03-24 09:55