2025/12/05

Mistral AI、2024年に新世代モデル「Mistral 3」発表 中国モデルと性能比較

Mistral AI、2024年に新世代モデル「Mistral 3」発表 中国モデルと性能比較 のキービジュアル

Mistral AIはフランス拠点の大規模言語モデル企業で、2024年9月にNVIDIAから3度目の投資を受け、企業価値が約135億米ドルに達したことを受けて、新世代モデル「Mistral 3」シリーズを正式にリリースした。

同社は今回、欧州版DeepSeekと称されることもある自社モデルを、中国のオープンソースモデルDeepSeek‑V3.1やKimi‑K2と直接比較し、性能とコスト面での優位性をアピールしている。

背景とMistral AIの位置付け

欧州におけるAIスタートアップの中で、Mistral AIはOpenAIやGoogleといった大手に加えて、中国のDeepSeekやQwenといったオープンソース勢に挟まれ、注目を集めてきた。2024年9月、NVIDIAが同社に対し3度目の出資を行い、評価額は約135億米ドルとなり、欧州AI領域のユニコーンとしての地位を確固たるものにした。

Mistral AIの2024年時点の企業価値推移

新モデル「Mistral 3」シリーズの概要

今回発表されたMistral 3シリーズは、フラッグシップモデル「Mistral Large 3」と、3種の小型モデル(3B、8B、14B)から構成される「Ministral」シリーズである。Mistral Large 3は総パラメータ数が675B、アクティブパラメータが41Bという規模で、2023年末から2024年初頭にかけてリリースされたMixtral 8×7Bや8×22Bに続く、Mistral初のオープンウェイト混合エキスパートモデルである。

Mistral Large 3 の特徴とベンチマーク

公式が公開したベンチマーク結果によると、Mistral Large 3はMMMLUで85.5点、AMCで52.0点を取得し、DeepSeek‑V3.1を僅かに上回った。一方、プログラマーが重視するLiveCodeBenchとSimpleQAではKimi‑K2に劣る結果となった。

さらに、価格面ではDeepSeekの約3倍のコストがかかるとされ、推論速度もGPT‑5より遅いと指摘されている。Artificial Analysisの最新AI指数では、Mistral Large 3の総合スコアは38点で、上位のGemini 3 Pro(73点)、Claude Opus 4.5(70点)、GPT‑5.1(70点)に大きく差をつけられている。

LMArenaのランキングでは、オープンソース非推論モデル部門で第2位、総合ランキングで第6位に位置付けられたが、トップクラスのモデルに比べて「屠榜(圧倒的な優位)」とは言い難い。

小型モデル「Ministral」シリーズの魅力

一方、3種の小型モデルはパラメータ規模ごとにベース版、指令版、推論版が提供され、すべてApache 2.0ライセンスでオープンソース化されている。これにより商用利用や自由な改変が可能となり、コストパフォーマンスの面で高く評価されている。

特筆すべきは、全サイズが画像理解機能を備えている点で、従来の「盲目」モデルとは一線を画す。14Bの推論版はAIME'25テストで85%の正答率を記録し、実務での利用価値が示された。

Ministral 3B・8B・14B の構成とライセンス情報

市場での評価と課題

テックブロガーはMistral Large 3に対し「効率の王」との主張に対し、性能が劣り、価格が高く、速度も遅いという三つの欠点を指摘し、"slow death"(徐々に死に向かう)とまで評した。実際、ツール呼び出しの正確性が低く、画像ベースのベンチマークでも平均的な評価にとどまっている。

対照的に、Ministralシリーズは「コストと性能のバランスが最も優れている」と評価され、特に中小企業やスタートアップが自社製品に組み込みやすい点が支持を集めている。

今後の展望

欧州における先端的なモデルメーカーとしてのMistral AIは、依然として中国のオープンソースモデルが価格面で大きくリードする中で、性能だけでなくコストと速度の両立が求められる。次世代のイテレーションで「欧州の光」となるかは、価格競争力と実装の容易さをどれだけ高められるかにかかっている。

現時点では、Mistral Large 3は「性能はまずまず」程度に留まり、ユーザーが求める「極致の賢さ」や「極致の安さ」を同時に提供できていない。今後のモデル改良とエコシステムの拡充が、欧州AI市場での競争力を左右するだろう。

出典: https://www.ifanr.com/1647328