筆記 · 開源模型 · 各國比較 · jdd-kami

各國開源模型比較表

2026 年 6 月 18 日快照。涵蓋中國、美國、法國、德國、日本、韓國、印度、歐盟。資料來源:BenchLM、Presenc AI、klymentiev.com、lilting.ch、NII、arXiv 等。模型發展很快,排名每週都在變動。

中國 美國 法國 德國 日本 韓國 印度 歐盟

01總覽:全部模型

欄位說明:「規模」= 總參數量(如 1.6T = 1.6 兆參數);「Active」= 每次推理實際啟動的參數量(MoE 架構);「Context」= 最大上下文長度(如 1M = 100 萬 tokens)。資料截至 2026-06-18。

國家 實驗室 旗艦模型 規模 Active 授權 強項 Context
中國
DeepSeek
深度求索
DeepSeek V4 Pro 1.6T49B MIT 程式 SWE-Bench 83.7%、最低成本 1M
中國
Alibaba (Qwen)
阿里巴巴
Qwen 3.5 397B 397B17B Apache 2.0 全能型、多語言、多模態 256K
中國
Moonshot (Kimi)
月之暗面
Kimi K2.6 ~1T~32B MIT 程式 HumanEval 99% 200K
中國
Z.ai (Zhipu)
智譜
GLM-5.2 744B40B 開源 知識 MMLU 96、BenchLM #1 128K
中國
Tencent (Hunyuan)
騰訊
Hunyuan 3.0 295–406BMoE 開源 多模態:文字、影片、3D 世界 128K
中國
Huawei (Pangu)
華為
Pangu Ultra MoE 718B 開源 唯一在中國硬體棧(昇騰)上從零訓練 128K
中國
ByteDance (Doubao)
字節跳動
Seed 2.0 多層級 專有 最低價 $0.022/M output
中國
Baidu (ERNIE)
百度
ERNIE 5.0 混合 LMArena top-10、15 億日 API 呼叫
中國
01.AI (Yi)
零一萬物
Yi-Lightning 混合 混合 先驅者、Yi-Coder 仍強
中國
MiniMax
稀宇科技
abab 系列 多層級 專有 長語境多模態、港交所上市
美國
Meta
臭鼬實驗室
Llama 4 Maverick 400B17B Llama Community 生態系最大、1M 語境 1M
美國
Meta
臭鼬實驗室
Llama 4 Scout 109B17B Llama Community 10M 超長語境(開源最長) 10M
美國
Google
谷歌
Gemma 4 medium ~27Bdense Gemma 單 GPU 推論、安全調校 256K
美國
OpenAI
開放AI
GPT-oss 120B 120Bdense Apache 2.0 OpenAI 格式、一鍵替換 128K
法國
Mistral AI
米斯特拉爾
Mistral Medium 3.5 675B41B Apache 2.0 EU 友善、GDPR 合規、企業支援 128K
法國
kyutai
非營利
Moshi / Helium 小規模 開源 語音模型 Moshi
法國
Pleias
普雷亞斯
Pleias 1.0 公有領域 嚴格開放資料
德國
Aleph Alpha
阿萊夫
Pharia-1 / Luminous 專有導向 企業主權、可審計、在地部署
歐盟
Silo AI (AMD)
芬蘭
Poro / Viking 開源 多語言 EU、OpenEuroLLM 共同主持
歐盟
OpenEuroLLM
20+ 組織
開發中 開源 涵蓋所有 EU 語言
日本
NII
情報學研究所
LLM-jp-4-32B-A3B 32B3.8B Apache 2.0 從零訓練(11.7T tokens)、MT-Bench JA 7.82
日本
NVIDIA (JP)
輝達日本
Nemotron Nano 9B JP 9B NVIDIA Open 主權 AI、sub-10B 第一
日本
東工大 / AIST
東京工業大學
Swallow 30B-A3B 30B3B 開源 續訓 + RL、OCR 修正強
日本
Preferred Networks
PFN
PLaMo 2.0 31B 未公開 從零訓練
日本
NEC
日本電氣
cotomi v3 未公開 從零訓練
日本
Sakana AI
佐川AI
Namazu 多規模 依基底 後訓練在 DeepSeek 上
韓國
Upstage
上堂
Solar Open 102BMoE Solar-Apache-2.0 雙語(韓英) 128K
韓國
Naver
納弗
HyperCLOVA X Seed 32B 32B 有限開源 下載量領先韓國
印度
Sarvam AI
薩爾瓦姆
Sarvam 105B / 30B 105BMoE 開源 印度最大開源模型、從零訓練、22+ 印度語言

02中國前五大開源模型(BenchLM 排名)

排名 模型 BenchLM 分數 強項 授權
#1
GLM-5.2
Z.ai(智譜)
94 知識、推理、agentic 開源
#2
Qwen 3.7-Max
Alibaba(阿里巴巴)
90 程式、全語境 Apache 2.0
#3
Qwen 3.7-Plus
Alibaba(阿里巴巴)
88 平衡型 混合
#4
DeepSeek V4 Pro
DeepSeek(深度求索)
87 程式(最強開源)、低成本 MIT
#5
Kimi K2.6
Moonshot(月之暗面)
~85 程式(HumanEval 99%) MIT

03觀察重點

🌐

中國開源生態最密集

10 家實驗室在前沿或接近前沿,西方僅 3–4 家(Meta、Mistral、AI2)。DeepSeek 是唯一完全 MIT 的頂級模型。

📈

2026 是中國 AI 上市年

Z.ai(1 月港交所)和 MiniMax 相繼 IPO,改變了資本結構與揭露節奏。

🔧

華為唯一軟硬體一體

唯一在前沿模型 + 前沿訓練晶片(昇騰)上都自有的實驗室。硬體主權的角度獨特。

🇯🇵

日本三條路線並存

從零訓練(LLM-jp-4)vs 續訓(Swallow、Nemotron JP)vs 後訓練(Namazu)。三種路線代表不同的主權策略。

🇪🇺

歐盟走主權 + 合規路線

不是拼規模,是拼可審計、GDPR 合規、多語言覆蓋。Mistral 是錨點實驗室($13.7B 估值)。

🇮🇳

印度剛起步

Sarvam AI 是第一個從零訓練的 105B 級模型,聚焦 22+ 印度語言。

⚖️

開源 vs 專有的收斂

多數中國實驗室開放基礎層、關閉旗艦層。DeepSeek(全 MIT)是例外。開源模型在多數基準上已追平閉源前沿。

發布節奏是季度或更快

多數實驗室在過去 12 個月內發布了 4–7 次旗艦級更新。模型發展很快,排名每週都在變動。

04按國家分布

中國 10 家實驗室

DeepSeek、Alibaba (Qwen)、Moonshot (Kimi)、Z.ai (GLM)、Tencent (Hunyuan)、Huawei (Pangu)、ByteDance (Doubao)、Baidu (ERNIE)、01.AI (Yi)、MiniMax。前五大在 BenchLM 上的分數從 94 到 ~85,密集程度全球最高。

美國 3 家主力

Meta(Llama 4 Maverick / Scout)——生態系最大、超長語境 10M。Google(Gemma 4)——單 GPU 推論。OpenAI(GPT-oss 120B)——OpenAI 格式相容。

法國 + 德國 + 歐盟

Mistral AI($13.7B 估值、Apache 2.0、GDPR 合規)。Aleph Alpha(企業主權、可審計)。kyutai(非營利、語音)。Pleias(公有領域)。Silo AI(多語言 EU)。OpenEuroLLM 聯盟(20+ 組織、涵蓋所有 EU 語言)。

日本 三種訓練路線

從零訓練:NII LLM-jp-4(11.7T tokens、Apache 2.0)、PLaMo 2.0、cotomi v3。續訓:Nemotron Nano 9B JP(NVIDIA)、Swallow 30B-A3B(東工大/AIST)。後訓練:Namazu(Sakana AI、在 DeepSeek 上)。

韓國 雙雄

Upstage Solar Open(102B MoE、Solar-Apache-2.0、韓英雙語)。Naver HyperCLOVA X Seed 32B(下載量領先韓國)。

印度 新進

Sarvam AI(Sarvam 105B / 30B)——印度最大的開源模型,從零訓練,聚焦 22+ 印度語言。2026 年 3 月開源。