NEWS ANALYSIS|2026.03.18
Hugging Face「State of Open Source Spring 2026」公開──中国がモデルDL数で米国を抜き首位、個人開発者シェアは2倍超に急増
Hugging Faceが2026年春の最新レポートを公開。オープンソースAIの地殻変動を示す5つの主要データを読み解く。
レポートの概要──200万モデル時代の全体像
Hugging Faceは2026年3月、プラットフォーム上のオープンソースAIの現状をまとめた「State of Open Source on Hugging Face: Spring 2026」を公開した。プラットフォームは現在1,100万ユーザー、200万以上の公開モデル、50万以上の公開データセットを擁する。レポートが浮き彫りにしたのは、オープンソースAIの「地政学的再編」と「個人開発者の台頭」という2つの構造変化だ。
注目すべきは、全ダウンロードの49.6%がわずか上位200モデル(全体の0.01%)に集中する一方、約半数のモデルは総ダウンロード数200件未満にとどまるという極端な二極化である。オープンソースの「民主化」が進む一方で、実際に使われるモデルは一握りという現実も明らかになった。
中国が米国を逆転──ダウンロード数で41%のシェア
中国がHugging Face上のモデルダウンロード数で41%のシェアを獲得し、米国を抜いて首位に立った。Hugging Faceのレポートによると、中国は月間ダウンロード数でも米国を上回っている。英国、ドイツ、フランスが続くが、中国と米国の合計で過半数を占める構造は変わらない。
中国Big Techのリポジトリ公開数(2024年→2025年)
- Baidu:0件 → 100件超(ゼロからの急拡大)
- ByteDance:約8〜9倍増
- Tencent:約8〜9倍増
- MiniMax:クローズドからオープンへ方針転換
この急成長の背景にはDeepSeek R1の公開(2025年1月)がある。DeepSeek R1は公開直後にHugging Faceで最も「いいね」されたモデルとなり、中国のオープンソースコミュニティ全体を活性化させた。MIT Technology Reviewの報道によると、中国発の新規ファインチューニングモデルが全体の63%を占めるまでに拡大している。
Alibaba Qwen一強──派生モデルがGoogle+Meta合計を凌駕
Alibaba(阿里巴巴)のQwenファミリーが派生モデル数でGoogle・Meta両社の合計を上回った。Qwenをベースにした派生モデルは11万3,000件超、Qwenタグ付きリポジトリは20万件を突破している。AI CERTsの分析によると、累計ダウンロード数は7億回に達し、MetaのLlamaを抜いて首位に立った。
| 指標 | Qwen(Alibaba) | 参考 |
|---|---|---|
| 派生モデル数 | 113,000+ | Google+Meta合計を上回る |
| タグ付きリポジトリ | 200,000+ | 新規派生の40%超がQwenベース |
| 累計ダウンロード数 | 7億回超 | Meta Llamaを逆転 |
Qwenの強さは「質」と「量」の両面にある。2025年のHugging Faceで最も「いいね」されたモデルにはDeepSeek-R1が首位に立ったが、トレンドモデルの多くが中国発もしくは中国モデルの派生であった。Qwenが事実上の「ベースモデルの標準」になりつつある状況は、かつてのLlamaの地位を想起させる。
個人開発者シェアが17%→39%に倍増──企業独占の終焉
レポートが示した最も象徴的な変化は、個人(非所属)開発者のシェア急増だ。2022年以前は約17%だった個人開発者のシェアが、2025年には39%に達した。同時期に企業(Industry)のシェアは約70%から37%に縮小している。
| カテゴリ | 2022年以前 | 2025年 | 変化 |
|---|---|---|---|
| 企業(Industry) | 約70% | 約37% | -33pt |
| 個人開発者 | 約17% | 約39% | +22pt |
個人開発者は一時的に利用量の50%超を占める時期もあったとレポートは指摘する。Hugging Faceのトレンドモデルランキングでも個人ユーザーが4番目に多い「エンティティ」にランクインしており、もはやオープンソースAIは企業の独占領域ではない。小型モデル(1〜9Bパラメータ)のダウンロード数が100B超モデルの約4倍という事実は、個人開発者がローカル環境で実用的なモデルを運用している実態を裏付ける。
ロボティクスが最大カテゴリに──データセット数23倍増の衝撃
サブコミュニティで最も急成長したのはロボティクス分野だ。ロボティクス関連データセットは2024年の1,145件から2025年には26,991件へと約23倍(+2,257%)に膨張し、全カテゴリ中1位に躍進した。2024年時点では44位だった。比較対象として、テキスト生成データセットは約5,000件にとどまる。
ロボティクスデータセットの推移
1,145 → 26,991
2024年 → 2025年(+2,257%)|カテゴリ順位:44位 → 1位
Hugging FaceのLeRobotプロジェクトのGitHubスターは過去1年でほぼ3倍に増加。AIとロボティクスの融合が「研究段階」から「実用フェーズ」に移行しつつあることを示す。
モデルサイズの二極化──平均は20.8Bへ急拡大、中央値はほぼ横ばい
ダウンロードされたモデルの平均パラメータ数は2023年の8.27億から2025年には208億へと25倍に急拡大した。一方、中央値は3.26億→4.06億とわずか24%の増加にとどまる。大規模モデルが平均を押し上げる一方、実際に多くの開発者が利用するのは依然として小型モデルという構図だ。
ダウンロードパターンを見ると、1〜9Bパラメータのモデルが最も多く、トップ10モデルのダウンロード数は100B超モデルの約4倍を記録した。リリース後の関心持続期間の中央値は約6週間で、継続的なアップデートがなければ急速に忘れ去られる厳しい競争環境も浮き彫りになった。
国家主権AIの台頭──韓国・欧州の動き
レポートはオープンソースAIを「国家AI主権」の手段として活用する動きにも注目する。韓国は2025年半ばに「National Sovereign AI Initiative」を立ち上げ、LG AI Research、SK Telecom、Naver Cloud、Upstageなどをチャンピオン企業に指定。2026年2月には韓国発モデルが同時に3つトレンド入りする成果を上げた。
欧州ではスイスのSwiss AIイニシアチブ、EU各国の政府支援プロジェクトが進行。米国ではOpenAIのGPT-OSS、AI2のOLMo、GoogleのGemmaがオープン戦略を強化した。オープンソースモデルは「ローカル展開・カスタマイズが可能」という特性から、データ主権を重視する国家戦略と親和性が高い。
Fortune 500の30%超がHugging Faceにアカウント開設
企業導入も加速している。Fortune 500企業の30%以上がHugging Faceに認証済みアカウントを開設した。Airbnbなどの大手テック企業がエコシステムへの関与を拡大し、レガシー企業も組織サブスクリプションをアップグレードする動きが進む。NVIDIAはBig Tech企業の中で最も積極的なコントリビューターとして台頭し、リポジトリ公開数で一貫した増加を見せている。
主要データまとめ
| 指標 | 数値 |
|---|---|
| プラットフォームユーザー数 | 1,100万人 |
| 公開モデル数 | 200万以上 |
| 公開データセット数 | 50万以上 |
| 中国のDLシェア | 41%(首位) |
| 個人開発者シェア | 39%(17%→) |
| Qwen派生モデル数 | 113,000+ |
| ロボティクスデータセット増加率 | +2,257% |
| 平均DLモデルサイズ(2025年) | 20.8B |
| Fortune 500のアカウント開設率 | 30%超 |
Aitly編集部の見解
このレポートが示す最大のメッセージは「オープンソースAIの覇権が、企業から個人へ、米国から世界へ移った」という構造転換だ。中国の41%シェアは単なる量の話ではなく、Qwenが事実上のベースモデル標準になりつつあるという質的変化を伴っている。Llama 2がオープンソースLLMの「デファクト」だった時代は終わりを迎えた。
個人開発者シェアの倍増は、AIの民主化が掛け声ではなく実態として進行していることを証明する。1〜9Bパラメータの小型モデルが最も多くダウンロードされている事実は、ローカルGPU1枚で動かせるモデルこそが実用の中心であることを意味する。日本の個人開発者にとっても、Qwenベースの小型モデルを自前でファインチューニングする選択肢は現実的になった。
ロボティクスデータセットの爆発的増加は「次の波」を予感させる。テキスト・画像・動画の次に、物理世界とAIの接点が拡大するフェーズに入ったことをデータが裏付けている。オープンソースAIは「言語モデルの共有場所」から「あらゆるAI技術のインフラ」へと進化している。
参考リンク
文:Aitly編集部|2026年3月18日