| 公司 | 最新产品/模型 | 主要功能亮点 | 面向用户 | 热度 | 🔗 查看来源 |
|---|---|---|---|---|---|
| 阿里巴巴 | Qwen3-Max 旗舰模型, Qwen3 全系列(包括 Qwen3-2507) | 参数量超万亿,MoE 稀疏架构;全模态覆盖:文本/图像/音频/视频/3D | 个人开发者、AI 应用开发商、企业客户、企业开发者、教育机构、科研机构 | 🔥🔥🔥🔥 | 📎 Qwen3-Ma 📎 Qwen3 全系 |
| 字节跳动 | 豆包大模型 2.0 (Doubao-Seed-2.0), Doubao-Seed-2.0-pro(2026-02-15) | 全模态感知:文字/图像/语音/视频统一理解;复杂推理与长链路任务处理能力大幅提升 | 普通消费者、Agent 应用开发商、企业开发者、内容创作者 | 🔥🔥🔥🔥 | 📎 豆包大模型 2. 📎 Doubao-S |
| 腾讯 | 混元 Hy3 Preview, 混元多模态开源系列 | 创新 CL-bench 上下文学习评估体系;多参数规模:0.5B / 1.8B / 4B / 7B | 研究人员、高校机构、企业客户、开发者、腾讯生态内用户 | 🔥🔥🔥 | 📎 混元 Hy3 P 📎 混元多模态开源系 |
| 百度 | 文心 5.0 (ERNIE 5.0), 文心 X1.1 推理增强版 | 2.4 万亿参数,国内规模最大;迭代式混合强化学习训练 | 金融/医疗/法律行业、普通用户、企业用户、开发者、内容创作者 | 🔥🔥🔥🔥 | 📎 文心 5.0 ( 📎 文心 X1.1 |
| 华为 | 盘古大模型 5.5 | 准万亿参数 MoE 架构 | 能源企业、制造业、政府机构、气象部门 | 🔥🔥🔥 | 📎 盘古大模型 5. |
| DeepSeek | DeepSeek-V4 开源旗舰 | V4-Pro:1.6 万亿参数 MoE 架构 | 全球用户、研究机构、创业公司、开发者 | 🔥🔥🔥🔥 | 📎 DeepSeek |
| 智谱AI | GLM-5.1 开源模型, GLM-5 旗舰模型 | Layer 级 MoE 绝对均衡,推理效率更高;推理能力大幅提升,数学/代码领先 | 企业用户、华为云用户、开发者、研究人员、企业开发团队 | 🔥🔥🔥 | 📎 GLM-5.1 📎 GLM-5 旗舰 |
| MiniMax | MiniMax M3 | 自研 MSA 稀疏注意力架构,全球领先 | 全球用户、内容创作者、企业用户、开发者 | 🔥🔥🔥🔥 | 📎 MiniMax |
| OpenAI | GPT-5.5 & GPT-5.5 Instant | 原生全模态融合(文本/图像/音频/视频) | 普通用户、企业用户、专业人士、开发者 | 🔥🔥🔥🔥 | 📎 GPT-5.5 |
| Gemini 3.5 Flash & Gemini Spark, Gemini 3.1 Pro | Gemini 3.5 Flash:轻量快速,面向开发者;ARC-AGI-2 基准 77.1%,推理能力大幅跃升 | 普通用户、企业用户、企业开发者、开发者、研究人员 | 🔥🔥🔥🔥 | 📎 Gemini 3 📎 Gemini 3 | |
| Anthropic | Claude Opus 4.8, Claude 4 全系(Opus/Sonnet/Haiku) | 编程与高级推理能力业界顶尖;Opus 4:顶级推理,适合复杂任务 | 代码工程师、AI 研究员、企业用户、开发者 | 🔥🔥🔥🔥 | 📎 Claude O 📎 Claude 4 |
| xAI (Grok) | Grok 4.3 | 推理速度较前代提升 3 倍 | X 平台用户、科研人员、开发者 | 🔥🔥🔥🔥 | 📎 Grok 4.3 |
| 快手 | Kling 3.0 系列模型 | 四大核心模块:Video 3.0 / Video 3.0 Omni / Image 3.0 / Image 3.0 Omni | 广告公司、视频创作者、企业客户、MCN 机构 | 🔥🔥🔥🔥 | 📎 Kling 3. |
| 科大讯飞 | 星火 X2 旗舰模型, 星火 X2-Flash | 293B 参数 MoE 稀疏架构;30B 参数 MoE 架构,轻量高效 | 政企用户、普通消费者、企业用户、开发者、教育机构 | 🔥🔥🔥 | 📎 星火 X2 旗舰 📎 星火 X2-Fl |
| 月之暗面 | Kimi K2.6 多模态模型 | K2 系列全面升级,多模态理解能力跃升 | 普通消费者、知识工作者、企业用户、开发者 | 🔥🔥🔥🔥 | 📎 Kimi K2. |
| 百川智能 | Baichuan-M4 医疗大模型 | 医疗专用增强大模型,事实性幻觉率仅 3.3% | 健康管理平台、家庭用户、医疗机构 | 🔥🔥🔥 | 📎 Baichuan |
| 昆仑万维 | SkyClaw-v1.0 Agent 模型 | 原生 Agent 模型,深度适配真实工作场景 | 自动化工程师、Agent 应用开发商、企业开发者 | 🔥🔥🔥🔥 | 📎 SkyClaw- |
| Meta | Llama 4 系列(70B / 400B / 4000B) | 三个版本:70B / 400B / 4000B 参数 | 研究机构、企业用户、开发者、全球 AI 社区 | 🔥🔥🔥🔥 | 📎 Llama 4 |
| Mistral AI | Mistral 3 系列开源模型 | 旗舰 Mistral Large 3:对标 GPT-4 级闭源模型 | 开源社区、开发者、欧洲企业用户 | 🔥🔥🔥 | 📎 Mistral |
| Apple | Apple Intelligence + Gemini 版 Siri | Siri 15 年来最大变革,深度融合生成式 AI | 企业用户、iPhone/iPad/Mac 用户、开发者 | 🔥🔥🔥 | 📎 Apple In |
| Amazon | Amazon Nova 2 系列模型 | 四款新模型:Nova 2 Pro / Lite / Flash / Micro | 电商商家、AWS 企业用户、开发者 | 🔥🔥🔥 | 📎 Amazon N |
| Cohere | Command R+ 企业级 RAG 模型 | 35B 参数,128K 长上下文 | 知识管理平台、搜索技术服务商、企业用户 | 🔥🔥🔥 | 📎 Command |
阿里通义发布迄今最强旗舰模型 Qwen3-Max,在 Chatbot Arena 排行榜位列第三,代码与智能体能力大幅领先。
- 参数量超万亿,MoE 稀疏架构
- Instruct 与 Thinking 双版本,支持切换推理模式
- 代码生成能力业界领先,Agentic 任务表现突出
- 支持 API 商用调用,阿里云百炼平台上线
阿里云千问大模型覆盖文本、代码、视觉、音频、视频全模态,Qwen3 系列持续迭代,开发者可在阿里云百炼一站式部署。
- 全模态覆盖:文本/图像/音频/视频/3D
- 支持 0.5B 到万亿参数多种规格
- 开放 API 及模型微调服务
- 与阿里云 PAI 平台深度集成
字节跳动发布豆包大模型 2.0,首次跨代升级,以全模态感知、长链路 Agent、多版本矩阵为核心,进化为全场景 AI 智能体平台。
- 全模态感知:文字/图像/语音/视频统一理解
- 长链路 Agent:支持复杂多步骤任务自动执行
- 多版本矩阵:Pro / Lite / Flash 覆盖不同场景
- 豆包 App 日活跃用户超亿级,绝对领先国内
面向 Agent 时代的复杂推理与长链路任务旗舰模型,中文通用测评绝对领先,开放火山引擎 API 调用。
- 复杂推理与长链路任务处理能力大幅提升
- 中文理解与生成能力业界第一
- 支持超长上下文处理
- 火山引擎 API 开放商用
腾讯混元发布 Hy3 Preview,显著提升上下文学习与指令遵循能力,复杂指令处理再上台阶,同步开放腾讯云 API。
- 创新 CL-bench 上下文学习评估体系
- 指令遵循能力大幅提升,多轮对话更稳定
- 复杂任务推理能力增强
- 腾讯云 API 商用,支持腾讯全系业务
腾讯混元发布一套完整的预训练和指令微调开源模型,覆盖 0.5B 到 7B 多种参数规模,在 Hugging Face 开放下载。
- 多参数规模:0.5B / 1.8B / 4B / 7B
- 支持文本、图像、视频、3D 多模态
- 完整预训练权重开源
- 已上线腾讯云 API
百度发布文心 5.0 正式版,2.4 万亿参数,国内首个原生全模态统一建模大模型,全球综合能力排名第二。
- 2.4 万亿参数,国内规模最大
- 原生全模态:文本/图像/音频/视频统一建模
- 事实性较前代提升 34.8%
- 指令遵循能力提升 12.5%
- 文心一言 App 及百度云 API 全面上线
文心 X1.1 采用迭代式混合强化学习框架,事实性提升 34.8%,智能体能力更强,面向企业级复杂场景。
- 迭代式混合强化学习训练
- 事实性大幅提升,幻觉减少
- 企业级 Agent 应用能力增强
- 与百度搜索、地图等产品深度集成
华为发布盘古大模型 5.5,准万亿 MoE 架构,自适应推理效率提升 8 倍,深度聚焦工业、气象、能源等垂直行业。
- 准万亿参数 MoE 架构
- 推理效率提升 8 倍
- 气象预报、工业制造、能源等垂直行业深度落地
- 与昇腾 AI 云服务深度集成
- 已开源部分核心能力(70B 密集模型 + 720B MoE)
DeepSeek 发布开源旗舰 V4 系列,Pro 版本 1.6 万亿参数、支持 100 万 token 超长上下文,首周 API 享 75% 折扣,震动开源社区。
- V4-Pro:1.6 万亿参数 MoE 架构
- V4-Flash:284B 参数低成本版本
- 原生 100 万 token 超长上下文
- Engram 架构 + mHC 框架,长文本高效处理
- 完全开源,支持商业使用
- 首周 API 享 75% 折扣
智谱发布 GLM-5.1 开源模型,采用 Layer 级 MoE 绝对均衡架构,昇腾算力上整体吞吐提升 30%,同日上线华为云。
- Layer 级 MoE 绝对均衡,推理效率更高
- 系统级优化,昇腾算力吞吐提升 30%
- 支持 AI 搜索工具(Web Search API / Search Agent)
- 强化 Agent 编排与长程任务能力
智谱最新旗舰 GLM-5 大幅提升推理能力与成本效益,支持复杂编程与长上下文,性能对标国际一流。
- 推理能力大幅提升,数学/代码领先
- 成本较前代降低 40%
- 长上下文支持增强
- 智谱 API 开放商用
MiniMax 最新发布 M3 通用大模型,自研稀疏注意力架构,国内首个同时具备前沿编程、1M 超长上下文、原生多模态三大能力的模型。
- 自研 MSA 稀疏注意力架构,全球领先
- 1M token 超长上下文(国内首个)
- 原生多模态:文本/图像/视频/音频
- 前沿编程能力,代码生成媲美 GPT-5.5
- 同期启动 A+H 两地上市计划
OpenAI 发布 GPT-5.5 系列,支持原生全模态融合与 100 万 Token 上下文,GPT-5.5 Instant 成为 ChatGPT 新默认模型,幻觉减少 52.5%。
- 原生全模态融合(文本/图像/音频/视频)
- 100 万 Token 超长上下文
- 首 Token 延迟低于 120 毫秒
- 医学/法律/金融高风险场景幻觉减少 52.5%
- GPT-5.5 Instant 成为 ChatGPT 默认模型
- o3 与 GPT-4.5 正式退役
Google I/O 2026 发布 Gemini 3.5 系列及 AI 智能体 Gemini Spark,将 Gemini 从聊天助手推向持续行动的 Agent 系统。
- Gemini 3.5 Flash:轻量快速,面向开发者
- Gemini Spark:首个持续行动 AI 智能体
- AI Search 代理化,搜索引擎智能体革命
- Antigravity 2.0:全新 AI 应用框架
- Google 全生态(搜索/Gmail/Docs/Maps)深度融合
Gemini 3.1 Pro 在 ARC-AGI-2 基准测试达 77.1%,比前代推理性能提升超 2 倍。
- ARC-AGI-2 基准 77.1%,推理能力大幅跃升
- 复杂多步骤推理领先行业
- 更长上下文处理能力
Anthropic 发布旗舰模型 Claude Opus 4.8,同步完成 650 亿美元 H 轮融资,估值近万亿美元,是目前最受企业青睐的顶级模型之一。
- 编程与高级推理能力业界顶尖
- SWE-bench 代码能力领先
- 支持复杂 AI Agent 构建
- 企业安全与合规性最强
- Claude.ai 及 API 同步上线
Claude 4 全系覆盖顶级推理(Opus)、均衡商用(Sonnet)、轻量快速(Haiku)三档,满足不同场景需求。
- Opus 4:顶级推理,适合复杂任务
- Sonnet 4:性价比均衡,主流商用
- Haiku 4:轻量快速,低成本场景
xAI 发布 Grok 4.3,推理速度提升 3 倍,综合能力被评测为超越 GPT-4.5、Claude 4 Opus 与 DeepSeek R1,AI 竞争进入「连续部署」时代。
- 推理速度较前代提升 3 倍
- 工具调用与 Agent 能力显著增强
- 实时联网能力,信息获取最新
- X(Twitter)平台原生集成
- 迭代周期压缩至 1.6 个月
快手发布 Kling 3.0 系列,涵盖视频/图片生成四大模块,全球用户突破 1 亿,企业客户近 5 万家,子公司估值 180 亿美元。
- 四大核心模块:Video 3.0 / Video 3.0 Omni / Image 3.0 / Image 3.0 Omni
- AI 视频生成「动作大师」,人物动作流畅度业界领先
- 全球用户突破 1 亿,覆盖 224 个国家和地区
- 企业客户近 5 万家,子公司估值 180 亿美元
讯飞发布星火 X2,293B MoE 架构、全国产算力训练,推理性能提升 50%,国内唯一基于国产算力的主流大模型。
- 293B 参数 MoE 稀疏架构
- 全国产算力训练,数据安全合规
- 推理性能较前代提升 50%
- 130+ 语言支持,面向国际化
讯飞发布星火 X2-Flash 轻量版,30B 参数 MoE 架构,支持 256K 超长上下文,智能体与代码能力突出。
- 30B 参数 MoE 架构,轻量高效
- 256K 超长上下文窗口
- 智能体与代码生成能力强化
- 对标国际顶尖轻量模型
月之暗面发布 Kimi K2.6,替代 K2 全系列,多模态能力大幅增强,同期推出通用型本地 Agent 产品 Kimi Work。
- K2 系列全面升级,多模态理解能力跃升
- Kimi Work:面向知识工作者的通用本地 Agent
- 内核为 Kimi Code,支持技能安装与定时任务
- 继承在线 Kimi Agent 建站等能力
百川智能发布 Baichuan-M4 医疗专用大模型及家庭 AI 医生「百小医」,事实性幻觉率降至 3.3%,跻身全球顶尖医疗 AI。
- 医疗专用增强大模型,事实性幻觉率仅 3.3%
- 配套产品「百小医」:面向家庭的 AI 健康助手
- 循证医学推理能力强,覆盖常见病症咨询
- 通过微信社交生态接入
昆仑万维发布高性能原生 Agent 模型 SkyClaw-v1.0,百万 Token 上下文,国产 Agent 模型跻身全球第一梯队。
- 原生 Agent 模型,深度适配真实工作场景
- 百万 Token 超长上下文
- 复杂工具调用与多轮任务执行能力
- 轻量化版本 SkyClaw-v1.0-lite 同步发布
- 定价低至行业一半
Meta 震撼开源 Llama 4 系列,最高 4000B 参数、Apache 2.0 协议,彻底打破超大规模 AI 模型的封闭壁垒。
- 三个版本:70B / 400B / 4000B 参数
- MoE 混合专家架构,推理效率极高
- Apache 2.0 完全开源,自由商用
- 10M token 超长上下文(Scout 版本)
- iRoPE 技术实现高效长文本处理
Mistral AI 发布 Mistral 3 系列,含旗舰 Large 3 及多款小型稠密模型,全部 Apache 2.0 开源,性能直逼闭源巨头。
- 旗舰 Mistral Large 3:对标 GPT-4 级闭源模型
- 多款小型稠密模型,覆盖边缘设备到云端
- 全部 Apache 2.0 许可证开源
- 欧洲 AI 旗舰,强调隐私与合规
Apple WWDC 2026 即将发布史诗级 Siri 重构,深度融合 Gemini 模型,Apple Intelligence 全面升级为真正的 AI 原生系统。
- Siri 15 年来最大变革,深度融合生成式 AI
- 与 Google Gemini 模型深度合作
- 首次开放第三方应用深度集成
- 新版 Siri 支持自然对话上下文联想
- iOS 27 首发搭载
AWS 发布 Nova 2 系列四款模型,覆盖推理、多模态、对话式 AI,以极具竞争力的价格性能比进军大模型市场。
- 四款新模型:Nova 2 Pro / Lite / Flash / Micro
- Nova 2 Lite 经济高效,15 项基准领先同级别模型
- Nova Reel 视频生成与 Nova Canvas 图像生成
- 通过 Amazon Bedrock 一站式调用
- 支持 Agent 构建与 RAG 增强
Cohere 发布 Command-R 新版,35B 参数 + 128K 上下文,深耕企业级 RAG 与工具调用,在企业搜索场景中表现卓越。
- 35B 参数,128K 长上下文
- 企业级 RAG(检索增强生成)能力行业领先
- 单步与多步工具调用支持
- 多语言支持(含中文)
- 企业数据安全与私有化部署