ラベル 生成AI・LLM の投稿を表示しています。 すべての投稿を表示
ラベル 生成AI・LLM の投稿を表示しています。 すべての投稿を表示

2025/11/12

AMD、2027年発売の「Medusa」AIプロセッサで性能10倍向上を発表

AMD、2027年発売の「Medusa」AIプロセッサで性能10倍向上を発表 のキービジュアル

AMDは2025年の財務アナリストデーで、2027年に新たに投入する「Medusa」AIプロセッサが、2024年以降のAI計算性能を10倍に引き上げることを発表した。さらに、2026年に発売予定の「Gorgon」シリーズも同時に明らかにし、同社のAIチップ戦略が加速する姿勢を示した。

AMDのAIプロセッサロードマップ

AMDは2027年に「Medusa」ブランドのRyzen AIプロセッサをリリースし、2024年からの累積性能向上率を10倍とする目標を掲げている。この目標は、CPUコア数の増加だけでなく、AI専用アクセラレーションユニットの拡張や、メモリ帯域幅の大幅改善に基づく。

同時に、2026年に投入予定の「Gorgon」シリーズは、ミッドレンジ向けに設計されたAI機能強化版Ryzenプロセッサで、ゲームやクリエイティブ用途におけるAI推論性能を向上させることを狙いとしている。

業績見通しと価格戦略

AMDは2025年のクライアントおよびゲーム事業の合計売上が140億米ドルを超えると予測し、前年同期比で50%以上の成長を見込んでいる。クライアントPCの売上シェアは、2023年の15%から2025年には約28%に拡大し、中期的には40%以上を目指す方針だ。

さらに、同社は2025年のクライアント向けプロセッサの平均単価が2023年比で1.5倍になる見込みであるとし、2025年から2030年にかけてクライアントとゲーム事業の売上が現在の3倍以上に成長すると予測している。

中国市場におけるAIチップ競争の背景

中国は近年、AIチップ開発に国家規模の投資を行い、華為(Huawei)や寒武紀(Cambricon)といった企業が独自のAIプロセッサを市場に投入している。中国政府は2025年までにAIチップの国内シェアを70%以上に引き上げる目標を掲げており、国内メーカーは性能向上とコスト削減を同時に追求している。

このような環境下で、AMDが掲げる「Medusa」の10倍性能向上は、中国のAIチップメーカーに対抗する上で重要な差別化要因となり得る。特に、データセンター向けの大規模推論や、エッジデバイスでのリアルタイムAI処理において、AMDのCPU+GPU統合アーキテクチャは中国企業が提供するASICベースのソリューションと競合する形になる。

日本市場への影響と期待

日本のPCメーカーやゲーム開発企業は、AMDのCPUシェアが拡大するにつれ、開発ツールや最適化ソフトウェアの対応を進めている。特に、AI生成コンテンツやリアルタイムレイトレーシングを活用した次世代ゲームにおいて、CPU側のAI推論性能がボトルネックになるケースが増えている。

「Medusa」プロセッサが2027年に実装されれば、開発者はCPUレベルでのAIアクセラレーションを前提に設計でき、GPUへの依存度を下げつつ高効率な処理が可能になる。これにより、開発コストの削減と製品の差別化が期待される。

今後の展望と課題

AMDが掲げる性能目標は、AIアルゴリズムの急速な進化と相まって、実際の市場投入時にどれだけ実現できるかが鍵となる。特に、メモリ帯域幅や電力効率の課題は、データセンターやエッジデバイスでの採用を左右する。

また、中国市場における規制強化や、国内メーカーの価格競争力が高まる中で、AMDは価格設定とサポート体制の両面で競争力を維持する必要がある。日本の企業にとっては、AMDのロードマップを踏まえた早期の技術評価と、パートナーシップ構築が重要になるだろう。

AMDの「Medusa」および「Gorgon」シリーズが実際に市場に投入されるまでには数年の時間があるが、同社のAIチップ戦略は、グローバルなAIインフラ市場に新たな選択肢を提供する可能性を秘めている。

出典: https://www.ithome.com/0/896/807.htm

京東、2025年11.11購物祭で取引額過去最高 AIが生産性ツールへ転換

京東、2025年11.11購物祭で取引額過去最高 AIが生産性ツールへ転換 のキービジュアル

京東が2025年11月11日(23:59)に開催した大型セール「11.11」では、取引額が過去最高を記録し、AI技術が単なる補助から本格的な生産性ツールへと変貌したことが明らかになった。ユーザー数は40%増、注文件数は約60%増と、規模拡大と同時にAI活用の効果が顕在化した。

京東の2025年11.11ショッピングフェス概況

京東は公式に、2025年11月11日23:59までの取引データを公表し、注文ユーザー数が前年同期比で40%増、総注文件数が約60%増加したと発表した。具体的な売上金額は未公表だが、各カテゴリで顕著な伸びが見られた。

特に「帯電品類」(携帯電話・デジタル機器)は京東の強みであり、スマートフォンの新製品売上は前年同期比で4倍以上に跳ね上がった。AI搭載タブレットは200%増、AI大型スマートフォンは150%増、AI眼鏡・AIスピーカー・AI家庭用ストレージはそれぞれ100%増と、AI関連製品が全体の成長を牽引した。

家電・家具の新商品売上は150%増、設置・組み立てを一体化したサービスの注文は90%超の伸びを示した。これらの数字は、AIが商品提案から物流、アフターサービスまでシームレスに結びつくことで、消費者体験が大幅に向上したことを示唆している。

京東の11.11ショッピングフェスの様子

AIが支えるサプライチェーンとデジタル人材

京東は、AIが「補助ツール」から「生産性ツール」へと役割を変えたと公式に説明した。中心となるのは「JoyAI」全スタックAIシステムで、同社のスーパーサプライチェーン全体に深く組み込まれている。

JoyAIとJoyAgentの全方位展開

内部運用では、30,000を超える「JoyAgent 3.0」ベースのデジタルエージェントが「デジタル社員」として稼働し、販売、物流、金融、産業といった多様な領域をカバーしている。これらのエージェントは、需要予測、在庫最適化、配送ルート自動生成など、従来は人手が必要だった業務をリアルタイムで処理し、全体の効率を大幅に向上させた。

JoyAI大規模言語モデルは、1,800以上のシナリオで活用され、618イベント(中国の大規模ショッピング祭)時の呼び出し回数と比べて4倍に増加した。これにより、注文ピーク時のシステム負荷を抑えつつ、迅速な意思決定が可能となった。

デジタル人「JoyStreamer」の効果

販売側では、デジタルヒューマン「JoyStreamer」が4万以上のブランドを支援し、実際の人間ライブ配信者のコストの1/10で運用できた。販売実績は、リアル配信者を上回る80%以上の転換率を達成し、11.11期間中にブランド売上を230億人民元(約3.6兆円)以上増加させた。

このコスト削減と高いパフォーマンスは、AIが単なるサポートを超えて、直接的な売上創出エンジンとして機能していることを示す好例である。

消費者向けサービスの変化

顧客対応面でもAIは大きく貢献した。京東のスマートカスタマーサービスは、24時間365日体制で稼働し、累計で420億件以上の問い合わせに対応した。そのうち80%以上が満足度調査で「満足」以上の評価を受けている。

AIチャットボットは、商品検索、配送状況確認、返品手続きなどを自然言語で処理し、ユーザーがアプリやウェブ上で瞬時に解決策を得られるようにした。これにより、コールセンターへの負荷が軽減され、人的リソースをより高度な業務へシフトできた。

今後の展望と課題

京東は、AIをコアに据えた「スーパーサプライチェーン」のさらなる高度化を目指すと同時に、データプライバシーやアルゴリズムの公平性といった課題にも取り組む姿勢を示している。特に、AIが生成する推奨や価格設定が消費者に与える影響については、透明性の確保が求められる。

中国全体でAI規制が強化される中、京東は国内外の法令遵守を前提に、技術開発とビジネス拡大を両立させる必要がある。今後もAIが物流・販売・カスタマーサービスの各段階でどのように統合され、競争優位性を維持できるかが注目される。

今回の11.11は、単なる売上記録に留まらず、AIが企業運営の根幹に組み込まれた実証の場となった。京東が示した「デジタル社員」や「デジタルヒューマン」の成功事例は、他の中国企業だけでなく、グローバルなeコマース市場にも波及効果をもたらす可能性が高い。

出典: https://www.ithome.com/0/896/740.htm

2025/11/11

Kimi、K3開発計画と460万ドルコストを公開―2025年

Kimi、K3開発計画と460万ドルコストを公開―2025年 のキービジュアル

中国のオープンソースAIスタートアップKimiが、最新モデルK2 Thinkingの実績と次世代モデルK3に関する詳細をRedditのAMAで明らかにした。創業者の楊植麟氏らが登壇し、訓練コストや技術戦略、OpenAIとの違いについて率直に語った。

K2 Thinkingの実績と市場の反応

先週公開されたKimi K2 Thinkingは、ベンチマークテストでOpenAIやAnthropicのモデルを上回るスコアを記録し、国内外のSNSで大きな話題となった。実際に筆者らが行った評価でも、長文生成、コード補完、エージェント的推論において顕著な性能向上が確認された。

Reddit AMAで明かされたK3計画とコスト構造

同社はReddit上で情報量の多いAMA(Ask Me Anything)を開催し、楊植麟氏、周昕宇氏、呉育昕氏の3名が質問に全て回答した。質問の中で最も注目を集めたのは、次世代モデルK3のリリース時期と訓練コストだった。

「K3は『ウルトラマンの万億ドル規模データセンターが完成するまでに』リリースする予定です」と答えた楊氏は、実際には具体的な時期は未定であることをユーモア交じりに示した。コストに関しては「460万ドルという数字は公式ではなく、正確な金額は測りにくいが、研究開発費の大部分が費やされている」と説明した。

OpenAIとの差別化戦略

KimiはOpenAIの大規模投資路線に対し、「我々は独自のペースと哲学で開発を進めている」と強調した。特に、AIブラウザ(Chromiumラッパー)の開発は行わず、モデル自体の性能向上に注力すると述べた。

ハードウェア面では、NVIDIA H800 GPUとInfiniBandを使用しているが、米国の最上位GPUほど性能は高くなく、カード枚数でも劣ると認めつつ、限られたリソースを最大限に活用していると語った。

モデルの個性とユーザー評価

K2 Thinkingは「謙虚さが少なく、散文的で洞察に富む」点が評価される一方で、過度にポジティブでAIらしさが残るという批判もあった。Kimiはこの特徴を「事前学習+後学習(ファインチューニング)で意図的に付与したスタイル」と説明し、報酬モデルの設計が出力のトーンに直結していることを認めた。

また、ベンチマークスコアが高いことに対し「HLEなど特定の指標に最適化したわけではなく、長系列推論の微小な改善がスコア向上に寄与した」と回答し、実務での汎用性向上を今後の課題とした。

核心技術:KDA注意機構と長系列推論

10月末に公開された論文『Kimi Linear: An Expressive, Efficient Attention Architecture』で紹介されたKDA(Kimi Delta Attention)は、従来の全注意機構と線形注意機構のハイブリッドとして設計された。長系列の強化学習タスクで計算コストを削減しつつ、性能を維持できる点が評価された。

しかし、Kimiは「ハイブリッド注意はコスト削減が主目的であり、長入力タスクでは依然として全注意が優れる」ことを認め、K3でもKDAをベースにした最適化を続ける方針を示した。

K2 Thinkingは最大300個のツール呼び出しを伴う長い推論チェーンをサポートし、INT4量子化訓練(INT4 QAT)を訓練段階から組み込むことで、推論速度と長系列安定性を同時に実現した。

マルチモーダルへの展望

現在はテキストモデルに注力しているが、視覚言語モデルの開発も進行中であるとチームは述べた。データ収集と訓練に膨大なリソースが必要なため、まずはテキスト領域での実績を固めた上で、将来的にマルチモーダル対応を目指すというロードマップだ。

エコシステムと料金体系の課題

開発者向けAPIは「呼び出し回数」ベースで課金されており、トークン単位の従量課金に比べて透明性が低いと指摘された。Kimiは「コスト構造を明確に示すために回数課金を採用したが、より良い計算方法も検討中」と回答した。

また、1Mトークン対応モデルがコスト面で廃止された理由は「運用コストが高すぎた」ためであり、256Kトークンのコンテキスト長は今後拡張予定だと述べた。

オープンソースへのコミットメントとAGI観

Kimiは「オープンソースはAIの普遍的な発展を促す」とし、企業や組織が独自のAIアシスタントを構築できる環境整備を重視している。AGI(汎用人工知能)については「定義は曖昧だが、AGIに近い雰囲気はすでに感じられる」と楽観的に語り、次世代モデルでさらなるブレークスルーを目指す意向を示した。

今回のAMAは、Kimiが中国国内のAIエコシステムにおいてオープンソースの旗手として位置付けられることを改めて示した。今後のK3リリースとマルチモーダル化が、国内外のAI競争にどのような影響を与えるか注目が集まる。

出典: https://www.ifanr.com/1644032

AIの次の十年に必要な空間インテリジェンス―2025年の展望

AIの次の十年に必要な空間インテリジェンス―2025年の展望 のキービジュアル

ChatGPT が世界を驚かせた今、AI が本当に必要としているのは言語だけではなく、空間を正確に認識し操作できる能力だと李飛飛教授が指摘した。彼女は最新のブログで、次の十年で最も重要になるのは「空間インテリジェンス」だと論じている。

空間インテリジェンスとは何か

空間インテリジェンスは、物体の位置・距離・方向を感覚的に把握し、頭の中で回転させたり、物理法則を予測したりできる能力を指す。言語は情報を抽象化する手段だが、実際に手を伸ばしてコーヒーカップを掴むときに必要なのは、視覚・触覚・運動感覚が統合された空間的な理解である。古代ギリシャの学者が影を利用して地球の周長を測ったり、DNA の二重らせん構造を金属線で再現したりした例は、言語よりも先に空間認知が文明を牽引したことを示す。

現在の大型言語モデル(LLM)の限界

現在主流の大型言語モデル(LLM)は、膨大なテキストデータから文脈を予測する能力に長けているが、実世界の物理的経験は持ち合わせていない。そのため、ロボット制御や科学的発見、没入型クリエイティブ領域で根本的な壁に直面している。たとえば、AI が画像を生成できても、生成されたシーン内で物体同士の距離を正確に測れなければ、実際のロボットに指示を出すことはできない。

マルチモーダルモデルの現状と課題

マルチモーダル大規模モデル(MLLM)は画像とテキストを同時に扱えるようになり、一定の進歩は見られる。しかし、距離感の推定や物体の回転、重力や摩擦といった基本的な物理法則の予測は依然として人間の感覚に遠く及ばない。李飛飛氏は、これらのギャップを埋めるために「世界モデル(World Model)」の構築が必要だと述べている。

世界モデルが目指す三つの能力

李飛飛氏は、次の三つの特性を備えたモデルを「世界モデル」と定義した。

  • 生成性(Generative):感覚情報・幾何情報・物理法則が一貫した仮想世界を生成できること。
  • 多モーダル性(Multimodal):画像・動画・深度マップ・テキスト・動作指示など、複数の情報形式を同時に処理・出力できること。
  • 相互作用性(Interactive):入力された「行動」に対して次の状態を予測し、さらに次に取るべき行動を提示できること。

世界モデル構築の三大挑戦

世界モデルは言語モデルよりもはるかに高次元の情報を扱うため、以下の三つの課題がある。

1. 新たな訓練タスクの設計

LLM で用いられる「次の単語予測」のようなシンプルで汎用的なタスク関数を、空間・物理情報に拡張する必要がある。これは単なる画像予測ではなく、時間軸を含む 3D/4D の変化を学習させるタスク設計が求められる。

2. 大規模な空間データの確保

インターネット上の画像・動画から深層的な空間情報を抽出し、合成データやシミュレーションデータと組み合わせて学習データセットを構築しなければならない。中国国内の大規模映像プラットフォームや産業用シミュレーションデータが活用される見込みだ。

3. 新しいモデルアーキテクチャの開発

従来の 1 次元・2 次元 シーケンス処理にとどまらず、3 次元・4 次元 の空間認識を直接扱える構造が必要になる。李飛飛氏が共同設立した World Labs は、独自の RTFM(Real‑Time Fusion Model)というアーキテクチャを提案し、空間情報の統合と高速推論を実現しようとしている。

空間インテリジェンスがもたらす産業変革

空間インテリジェンスは、短期・中期・長期の三段階で応用が広がると予測されている。

短期:クリエイティブ領域の拡張

ストーリーテリングや映画制作、ゲーム、建築デザインにおいて、AI が 3D 世界を自動生成し、クリエイターが直感的に編集できる環境が整う。World Labs が提供する「Marble」プラットフォームは、ユーザーがテキストや画像から即座に仮想空間を構築できるサービスとして注目されている。

中期:ロボットの具身知能化

世界モデルを用いたシミュレーション訓練により、ロボットは実環境での「行動と結果」の因果関係を学習し、人間と協働できる具身インテリジェンスを獲得する。中国の製造業や物流企業は、既に試験的に導入を進めている。

長期:科学・医療・教育へのインパクト

薬剤設計や材料探索において、分子構造の空間的相互作用を正確にシミュレートできれば、実験回数を大幅に削減できる。医療画像診断や遠隔教育でも、仮想空間でのインタラクティブな学習体験が実現し、教育格差の是正に寄与する可能性がある。

李飛飛氏のビジョンと中国AIエコシステムへの期待

李飛飛氏は、AI は人間の能力を拡張すべきであり、置き換えるべきではないと強調する。空間インテリジェンスは、人間の創造力や共感力を支える基盤として位置付けられ、AI がそれを補完する形で社会に貢献できると考えている。

中国では、政府主導のAI戦略と民間ベンチャーの活発な投資が相まって、世界モデルの研究開発が加速している。北京や上海の大学・研究機関がデータ収集・アルゴリズム開発に参画し、World Labs のようなスタートアップが実装段階へと橋渡しを行っている。李飛飛氏は、国内外の研究者・企業が協力し、空間インテリジェンスをオープンかつ安全に共有することが、次の十年のAI革命を実現する鍵だと呼び掛けている。

言語モデルが情報の「文字」を操る時代から、空間モデルが現実の「形」を扱う時代へ。AI が本当の意味で人間と同等、あるいはそれ以上の知能を持つために、空間インテリジェンスの実装は避けて通れない道である。

出典: https://www.ifanr.com/1644054

商汤が開源した空間理解AI SenseNova‑SI、2025年にGPT‑5を上回る性能を示す

商汤が開源した空間理解AI SenseNova‑SI、2025年にGPT‑5を上回る性能を示す のキービジュアル

概要

中国のAIベンチャー、商汤科技(SenseTime)は本日、空間構造の理解と推論に特化した大規模マルチモーダルモデル「SenseNova‑SI」シリーズをオープンソース化したと発表した。公式のベンチマーク結果によれば、同シリーズは同規模のオープンソースモデルだけでなく、米国や欧州のトップクラスのクローズドモデルであるGPT‑5やGemini 2.5 Proをも上回る性能を示した。

背景と市場の位置付け

近年、自然言語処理やコード生成といった領域で大規模言語モデル(LLM)が急速に進化した一方で、空間情報の認識・推論は依然として弱点とされてきた。ロボティクスや拡張現実(AR)といった「具身知能(Embodied Intelligence)」の実装には、視覚情報と空間関係を正確に捉える能力が不可欠である。中国政府は2023年に「新一代人工知能産業発展計画」を策定し、空間認知技術を重点分野に掲げているため、商汤の取り組みは政策的後押しとも合致している。

SenseNova‑SI の技術概要

SenseNova‑SI は 2 B と 8 B の二つのパラメータ規模で提供され、マルチモーダル入力(画像+テキスト)を統合的に処理できるよう設計されている。モデルは従来のトランスフォーマーアーキテクチャに加え、空間関係を明示的に学習するための「空間埋め込み層(Spatial Embedding Layer)」を組み込んでいる。この層は、画像中のオブジェクト間の相対位置や視点変化をベクトル化し、言語トークンと同時にエンコードすることで、空間的推論を自然言語生成にシームレスに結び付ける。

オープンソース化の意義

GitHub(https://github.com/EvolvingLMMs-Lab/EASI)で公開されたコードは、モデル本体だけでなく、学習に使用したデータパイプラインや評価スクリプトも含まれる。これにより、研究者やスタートアップは独自のデータでファインチューニングを行うことが可能となり、国内外のエコシステム全体の活性化が期待される。

ベンチマーク結果と他モデルとの比較

商汤が提示した評価は、空間理解に特化した4つのベンチマーク(VSI、MMSI、MindCube、ViewSpatial)を中心に実施された。特に 8 B バージョン(SenseNova‑SI‑8B)は、4 つのベンチマークの平均スコアが 60.99 と、同規模のオープンソースマルチモーダルモデルである Qwen3‑VL‑8B(40.16)や BAGEL‑7B(35.01)を大きく上回った。

さらに、空間タスクに特化したモデルである SpatialMLLM(35.05)や ViLaSR‑7B(36.41)と比較しても、同様に高得点を記録している。興味深いのは、クローズドモデルである GPT‑5(49.68)や Gemini‑2.5‑Pro(48.81)をも上回っている点である。これは、単なるパラメータ数の増加による性能向上ではなく、空間認知能力に関する「質的」なブレークスルーを示唆している。

具体的な問題例と回答比較

以下は、公開された SITE‑Bench と MindCube の問題例と、GPT‑5 と SenseNova‑SI‑8B の回答を比較したものだ。

  • 立方体の組み合わせ図から正しい俯視図を選択する問題:正解は B。GPT‑5 は D を選択したが、SenseNova‑SI‑8B は正解の B を選んだ。
  • 手持ちカメラの位置から見たモーターサイクルの左右判定:正解は右側(B)。GPT‑5 は左側(A)を選択し、SenseNova‑SI‑8B は正解の B を選んだ。
  • 多車線道路で黄色車の次の動作を予測:正解は右折(D)。GPT‑5 は静止(C)と回答し、SenseNova‑SI‑8B は正解の D を選択した。
  • 屋外シーンで視点変化に伴う移動方向を判断:正解は左前方(D)。GPT‑5 は C を選び、SenseNova‑SI‑8B は正解の D を選んだ。
  • 室内シーンで家具配置からの移動方向:正解は左前方(A)。GPT‑5 は D を選択し、SenseNova‑SI‑8B は正解の A を選んだ。
  • 黒い服を着た人物が写ったテーブルの右側にある物体を判定:正解はドア(C)。GPT‑5 は B を選び、SenseNova‑SI‑8B は正解の C を選んだ。

これらの例は、空間的文脈を正確に把握し、視点変化や相対位置を推論できる点で、従来の大規模言語モデルが抱えていた根本的な課題を克服したことを示している。

中国AI産業へのインパクト

商汤は2024年度の決算で売上 37.7 億人民元(約5.9 億米ドル)を計上し、前年同期比 10.8 %増と報告した。そのうち生成AI事業の売上は 24 億人民元に達し、前年から 103.1 %増加した。SenseNova‑SI のオープンソース化は、同社が生成AI領域でのリーダーシップを強化しつつ、エコシステム全体の活性化を狙う戦略的な動きと捉えられる。

中国国内では、百度や阿里巴巴(Alibaba)も独自のマルチモーダルモデルを開発中であり、競争は激化している。オープンソース化は、研究者コミュニティからのフィードバックを迅速に取り込むだけでなく、国内外のスタートアップが商用化に向けたプロトタイプを短期間で構築できる環境を提供する。

今後の展望と課題

技術的には、現在の評価は主に 2 D 画像とテキストの組み合わせに限られている。真の具身知能を実現するには、3 D センサーデータやリアルタイム動画ストリームへの対応が不可欠である。商汤は 2026 年までに「SenseNova‑SI‑3D」や「リアルタイム推論」機能を追加する計画を示しており、ハードウェア側の AI チップやエッジコンピューティングインフラとの連携が鍵になるだろう。

また、オープンソースモデルは知的財産権や安全性の観点から慎重な運用が求められる。中国政府は AI の安全性評価フレームワークを整備中であり、商汤はそのガイドラインに沿ったデータガバナンスを実装する必要がある。

総じて、SenseNova‑SI は空間認知という未踏の領域で実用的なブレークスルーを示した点で、2025 年の中国 AI 産業における重要なマイルストーンとなるだろう。今後、オープンソースコミュニティと産業界がどのように協働し、実世界のロボティクスや AR/VR アプリケーションへと結びつけていくかが注目される。

出典: https://www.ithome.com/0/896/448.htm

2025/11/10

2025年 AIとロボットが職を変える―マスク予測と中国のAI政策

2025年 AIとロボットが職を変える―マスク予測と中国のAI政策 のキービジュアル

エロン・マスク氏は、AIが2026年に個人の知能を超え、2030年までに人類全体の知能を凌駕すると予測し、スマートフォンは5〜6年以内に姿を消すと語った。これに対し、中国政府は「AI+製造」戦略で産業全体のデジタル化を加速させ、世界的なAI競争の構図が変わりつつある。

マスク氏の未来予測とその根拠

米国の実業家エロン・マスクは、先週のインタビューで「AIは2026年に単一人間のIQを超え、2030年までに人類全体の知能の総和を上回る」と断言した。さらに、メール処理や電話応対といったデスクワークは1〜2年以内に大規模な自動化が進み、プログラミングやコンテンツ制作も同様に置き換えられると予測した。

同氏は「未来にはOSもアプリも存在しない。スマートフォンはAI推論を行うエッジノードに過ぎず、画面やボタンのない端末が情報をリアルタイムで生成する」と述べ、5〜6年後に現在のスマートフォンエコシステムが消滅すると警告した。

AIとロボットがもたらす職業構造の変化

マスク氏の指摘は、単なる予測に留まらず、実際に企業が導入を進めているAI・ロボット技術と合致している。自動運転技術の成熟に伴い、物流・運転手は大幅な転換を余儀なくされ、溶接や調理といった物理労働もロボット化の波に飲み込まれる見通しだ。

米Microsoftのサティア・ナデラCEOは、AIインフラの最大課題は「計算資源の過剰」ではなく「電力供給」だと指摘。GPUを稼働させるための電力が不足すれば、データセンターは機器を倉庫に置いたままにせざるを得ないという。

OpenAIとMicrosoftの最新動向

OpenAIのサム・アルトマンCEOは、同社の年間売上が130億米ドルを超えていると主張しつつ、同時に巨額の赤字も抱えていると認めた。Microsoftは同社の約27%の株式を保有し、2023年度の決算ではOpenAIへの投資が原因で純利益が31億米ドル減少、四半期ベースで約115億米ドルの赤字が生じたと報じられている。

アルトマンは上場の具体的な時期は未定だが、最短でも2027年以降が現実的と述べ、投資家からの圧力に対し「株価が下がれば空売りで利益を得る」姿勢を見せた。

中国政府のAI産業政策と実装状況

中国工業情報化部(MIIT)は、2024年に「AI+製造」戦略を正式に策定し、製造業をAIの主戦場と位置付けた。具体的には、重点産業・重点工程・重点領域のスマート化転換タスクを定め、AI活用ガイドラインを発行した。

同部は、設計支援、バーチャルシミュレーション、故障予測といったシナリオでAIを深く組み込むとともに、AIスマートフォンやAIパソコンといった次世代消費端末の開発を加速させる方針を示した。さらに、人型ロボットや脳機能インターフェースなどの新世代ロボット技術の研究開発支援も明記されている。

実際、DeepSeekやKimiといった中国発AIサービスは、米国のChatGPTやGeminiに匹敵する利用者数を誇り、国内外の研究者から高い評価を受けている。ノーベル化学賞受賞者のマイケル・レヴィット氏も、日常的にDeepSeekを利用しつつ「中国は西側を上回る速度でAIエコシステムを構築している」とコメントした。

産業界の反応と今後の展望

ロボット産業のスタートアップ、宇樹科技(ユッシュテクノロジー)の創業者王興興氏は、2024年の中国ロボット企業の平均成長率が50〜100%に達すると楽観的に見ている。一方で、具身型大規模モデル(VLAやWorld Model)の実用化は予想よりやや遅れ、完全な「ChatGPT時代」のロボットはまだ80%程度のタスク達成に留まると指摘した。

香港特別行政区政府は、AIを「ダブルエンジン」戦略の中心に据え、算力・アルゴリズム・データ・資本・人材の六本柱で産業全体のAI導入を推進すると発表した。金融・物流・医療・スマート製造といった分野でのAI活用が加速すれば、国内外の企業は新たな競争環境に直面することになるだろう。

結論:AIとロボットが切り開く次世代社会

エロン・マスク氏の「スマートフォン消滅」予測は、AIとロボットが生活基盤を根本から変える可能性を示唆している。米国では電力供給とインフラ整備が課題となり、OpenAIとMicrosoftの財務構造が揺れ動く中、中国は政策主導でAI産業の全方位的な拡大を図っている。

日本企業にとっては、AIインフラの電力確保やデータ活用の安全性を確保しつつ、中国や米国の動向を注視し、産業AI(実装)への投資戦略を再検討する時期が来ていると言えるだろう。

出典: https://www.tmtpost.com/7757180.html

2025/11/08

月之暗面が2025年に公開したKimi K2 Thinking、460万ドルで訓練

月之暗面が2025年に公開したKimi K2 Thinking、460万ドルで訓練 のキービジュアル

Kimi K2 Thinkingの概要

中国のAIスタートアップ、月之暗面(Moonshot AI)は本日、同社史上最も高性能なオープンソース思考モデル「Kimi K2 Thinking」を発表した。人間終極試験(Human-Level Examination、略称HLE)において44.9%の正答率を記録し、GPT-5やClaude 4.5といった商用大型モデルを上回る成果を示した。

同モデルは、従来の大規模言語モデル(LLM)に対し、長文推論やマルチステップ思考を重視した設計が特徴で、最大256Kトークンのコンテキスト長をサポートする。API の応答速度は 1 秒あたり 40 トークンに最適化され、実務利用に耐える実装が行われている。

Kimi K2 Thinkingの概念図

訓練コストと比較

同社が公開した情報によれば、Kimi K2 Thinking の訓練費用は 460 万米ドル(2025年11月時点の為替レートで約 3,277 万人民元)である。これは、同じく中国発の DeepSeek V3(560 万米ドル)よりも約 100 万米ドル安い数字だ。

対照的に、米国の OpenAI が同等レベルのモデル開発に投入したとされる資金は数十億米ドル規模と報じられている。CNBC の報道は、OpenAI の GPT 系列は数十億ドル規模の投資が必要であると指摘し、Kimi K2 Thinking のコスト効率の高さを際立たせている。

オープンソース戦略の意義

Kimi K2 Thinking は、モデル本体の重みだけでなく、訓練スクリプト、データ配分、評価ツールチェーンをすべてオープンソースとして公開している。さらに、商用利用を許可するライセンス形態を採用しており、開発者や企業が低コストで高度なAI機能を組み込める環境を提供している。

このオープンソース化は、閉鎖的な商用モデルが支配的だった世界的なAI市場に対し、参入障壁を大幅に下げる効果が期待される。中国国内の大学やベンチャー企業は、既存のデータセットや計算資源を活用し、Kimi K2 をベースにしたカスタマイズやファインチューニングを迅速に行える。

中国AI市場における位置付け

中国政府は近年、AI 産業の自立と国際競争力強化を政策目標に掲げ、AI 研究開発への補助金や税制優遇を拡充している。月之暗面のようなスタートアップは、こうした政策支援と国内の豊富な計算インフラ(例えば、国内データセンターの GPU クラスタ)を背景に、低コストで高性能モデルの開発を実現している。

また、国内の大手テック企業が自社モデルのオープン化を進める中、Kimi K2 は「オープンソース+商用利用可」というハイブリッド戦略で差別化を図っている。これにより、AI チップメーカーやクラウドプロバイダーとの連携が進み、AI インフラ(訓練・推論)市場の拡大が期待される。

今後の展望と課題

月之暗面は、Kimi K2 の API 速度改善や推論効率向上に向けたハードウェア増強を継続的に行うと表明している。さらに、モデルの安全性評価やバイアス除去に関する研究も同時に進め、商用展開に伴うリスク管理を強化する方針だ。

一方で、オープンソース化に伴う知的財産権の管理や、データプライバシーに関する規制対応は依然として課題である。特に、中国国内外でのデータ使用許諾や、欧州連合(EU)の AI 法規制への適合が求められる可能性がある。

それでも、Kimi K2 Thinking が示した「低コスト・高性能・オープンソース」の三位一体は、AI 産業全体に新たな競争モデルを提示したと言えるだろう。今後、同モデルが実際のビジネスシーンでどの程度採用されるか、そして他の中国AI企業がどのように追随するかが注目される。

出典: https://www.ithome.com/0/895/884.htm

2025/11/07

Kimi K2 ThinkingがオープンソースAIでGPT‑5を超える―2024年

Kimi K2 ThinkingがオープンソースAIでGPT‑5を超える―2024年 のキービジュアル

中国のスタートアップKimiが開発したオープンソース大規模言語モデル「Kimi K2 Thinking」が、複数のベンチマークで最先端の閉鎖型モデルを上回ったことが確認された。1兆パラメータを持つ同モデルは、ツール呼び出しを組み合わせた高度な推論能力で注目を集めている。

モデル概要と技術的特徴

K2 Thinkingは、2024年11月に正式リリースされたエージェント指向の混合専門家(MoE)モデルで、総パラメータ数は1兆、アクティブパラメータは32 B、コンテキスト長は256 Kトークンに達する。従来の大規模言語モデルと異なり、ツール呼び出しを200〜300回にわたってシーケンシャルに実行でき、タスク目標を保持しつつ継続的に思考を深めることが可能だ。

量子化と推論速度の向上

本モデルは訓練段階からINT4量子化感知訓練(QAT)を導入し、推論時のメモリ使用量を大幅に削減しつつ、速度を約2倍に向上させた。これにより、GPUメモリが限られた環境でも長鎖の推論が崩れずに実行できる点が評価されている。

ベンチマーク結果と競合比較

TAU(ツール呼び出し能力)ランキングでトップに立ち、OpenAIのGPT‑5やAnthropicのClaude 4.5 Sonnetを抜いた。さらに、Human‑Level‑Evaluation(HLE)やBrowseComp、複数のプログラミングベンチマークでも上位にランクインし、ClaudeやGPT系モデルに匹敵するスコアを記録した。

特に、学際的な専門家レベルの質問に対するHLEランキングと自律検索系の3つの指標で第1位を獲得。プログラミングタスクに関しては、3つの評価項目すべてでClaudeやGPT系モデルに近い得点を示した。

実際のタスクでのパフォーマンス

実証実験では、K2 Thinkingは23回のツール呼び出しと推論を組み合わせ、博士課程レベルの数学問題を解決した例が報告されている。また、曖昧な検索クエリに対しては、検索→ブラウジング→コード実行のサイクルを自律的に繰り返し、正確な情報を抽出した。

フロントエンド開発においては、HTMLやReactのコードを瞬時に生成し、機能的なウェブページを数分で完成させた。SVGを用いた「自転車に乗るペリカン」の描画でも、1分未満でコードを出力した。

エージェント機能と実装状況

現在、Kimi公式サイトのチャットモードでK2 Thinkingは利用可能だが、軽量化のため一部ツールと呼び出し回数が制限されている。フルエージェントモードは近日中にアップデート予定で、開発者はAPI経由でも同機能を試すことができる。

中国AI市場における位置付け

過去2年間、中国のAI競争はQwenや百度、DeepSeekといったモデルがChatGPTに追随する形で進展した。Kimiは2024年7月にK2、9月にK2 Instruct、11月にK2 Thinkingと、年内に3つの主要リリースを行い、オープンソース路線でスピード感を示した。

同時期に、智谱(Zhipu)やMiniMax、DeepSeekのR2・V3.2などもオープンソース化され、Hugging Faceのダウンロードランキング上位に名を連ねている。これにより、閉鎖型モデルが長い開発サイクルで市場に投入される中、オープンソースモデルがベンチマークで実績を示す転換点となっている。

今後の課題と展望

安定した出力やプロンプトへの寛容性に関しては、依然として閉鎖型モデルに劣る面が指摘されている。一方で、オープンソースでありながら高度なツール呼び出しと長文推論を実現できたことは、研究コミュニティ全体にとって大きな刺激となるだろう。

量子化技術の成熟とエージェント指向の設計が進むことで、将来的にはさらに低コストで高性能なAIサービスが提供可能になると期待されている。Kimi K2 Thinkingは、オープンソースAIが閉鎖型モデルと同等の実用性を持ち得ることを示す重要なマイルストーンである。

出典: https://www.ifanr.com/1643694

AI大言語モデルの信念と事実判別の限界 2025

研究の概要

米スタンフォード大学の研究チームは、ChatGPT をはじめとする 24 種類の大規模言語モデル(LLM)に対し、ユーザーの個人的信念と客観的事実が食い違う状況での応答精度を検証した。2025 年 11 月 3 日に『Nature Machine Intelligence』に掲載された本論文は、AI が「信念」と「事実」を安定的に区別できないことを示した。

研究では、13,000 件に上る質問を投げかけ、モデルが事実か信念かを判別する能力を数値化した。結果は、最新モデルでも信念の誤認率が高く、特に虚偽の第一人称信念(例:\"私は○○だと信じている\")に対する識別が著しく低下した。

実験結果と課題

信念と事実の識別精度

最新モデル(2024 年 5 月以降にリリースされた GPT‑4o など)の事実判定正確率は 91.1%〜91.5% と高い一方で、第一人称の虚偽信念を正しく認識できる確率は、同モデルで実際の信念に比べて 34.3% 低下した。旧世代モデル(GPT‑4o 以前)ではその差が 38.6% に達した。

具体例として、GPT‑4o の全体的な正確率は 98.2% だったが、虚偽信念に対しては 64.4% にまで落ち込んだ。DeepSeek R1 は 90% 超の正確率から、虚偽信念に対しては 14.4% という極端な低下を示した。

中国AI企業への示唆

本研究は米国の大学によるものだが、同様の課題は中国のAI企業にも共通している。中国では大手テック企業が自社の大言語モデルを次々に発表し、法務・医療・ニュース配信といった高リスク領域への応用を試みている。しかし、信念と事実を混同するリスクは、規制当局の注意を引く可能性が高く、特に中国政府が AI の「安全性」と「倫理性」を強化する方針を示す中で、モデルの信頼性向上は急務となっている。

例えば、百度が提供する Ernie 系列や、阿里巴巴の M6 系列は、国内外での実証実験で高い生成性能を誇るが、同様の信念判別テストが不足しているとの指摘がある。中国の AI 産業団体は、スタンフォードの研究結果を踏まえ、モデル評価の標準化や第三者検証機関の設置を検討している。

今後の課題と業界への影響

研究者は、LLM が知識の「真実性」特性を十分に理解できていないことが根本的な課題であると指摘する。特に法律、医療、報道といった領域では、誤った信念がそのまま誤情報として拡散し、重大な社会的損害をもたらす恐れがある。

対策としては、モデル内部に「事実チェック」モジュールを組み込む手法や、外部知識ベースとリアルタイムで照合するハイブリッド構造の導入が提案されている。また、訓練データの品質管理と、信念と事実を明示的にラベル付けしたデータセットの拡充が求められる。

さらに、AI の導入効果が企業の投資回収率に結びつかないケースが増えていることを示す MIT の調査結果(2025 年 8 月)と合わせて考えると、単にモデルを大きくすれば性能が向上するという従来の考え方は限界に達している。AI インフラの最適化や、業務フローとの統合を重視した実装戦略が、今後の競争力の鍵となるだろう。

結論として、AI 大言語モデルは依然として「信念」と「事実」の区別に弱点を抱えており、特に高リスク領域での実装には慎重な評価と継続的な改良が不可欠である。中国の AI 企業も、国内外の研究成果を取り入れつつ、モデルの安全性と信頼性を高める取り組みを加速させる必要がある。

出典: https://www.ithome.com/0/895/526.htm