
ニュース
テキストプロンプトからプレイ可能な一貫性のある世界を作り出す。Google DeepMindの新たな汎用ワールドモデル「Genie 3」発表
フレームレートは24FPS,解像度は720pに対応し,数分間にわたり生成した世界の一貫性を保てるという。
![]() |
これまで操作可能なモデルとしては,「GameNGen」や「Genie 2」が2024年に発表されている。
![]() |
GameNGenは特定のゲーム(DOOM)に絞ったもので,操作方法やグラフィックスは対象のゲームに依存しているものの,数秒間にわたりリアルタイム生成可能だった。
3Dゲームをリアルタイムにまるごと生成する「GameNGen」が発表される。「DOOM」を“移植”ではなく“生成”する時代へ

Google Researchの研究員ら4名は2024年8月27日,ニューラルモデルのみを搭載したゲームエンジン「GameNGen」を発表した。従来のゲームエンジンを一切使用せずに,プレイヤーの入力に合わせ「DOOM」をリアルタイムに描画できる。
Genie 2では,対象を特定のゲームから3D環境全体に広げ,キーボードやマウスの入力を事前に渡すことで,リアルタイムではないものの,10秒から20秒の一貫性を保ったインタラクティブな世界を構築できていた。
1枚の画像から探索可能な3Dワールドを生成できるAIモデル「Genie 2」発表。命令に合わせ自動的にゲームをプレイする「SIMA」との連携も

Googleは本日(2024年12月5日),1枚の画像から探索可能な3Dワールドを生成できるAIモデル「Genie 2」を発表した。プレイヤーの入力を受け取り,それに合わせてゲームフレームを生成する。
Genie 3では,ゲームのような3D空間に限らず,火山や夜景,台風などフォトリアルな世界も生成できる汎用的なモデルとなっている。
物理法則を理解した動画生成モデルVeoで培った技術を継承したうえで,実際の操作に合わせて,リアルタイムで生成可能できる。
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
さらに,移動入力だけでなく,プロンプトによって世界を改変することも可能だ。天気を変えたり,熊を出現させたりと,環境に変化を加えられる。
また,3D環境向けのAIエージェントであるSIMAとの互換性もあり,生成された世界に対してエージェントに達成させたい目標を設定して,シミュレーションさせられる。
Google DeepMindの3D仮想環境向け汎用型AIエージェント「SIMA」とは?[CEDEC 2024]
![Google DeepMindの3D仮想環境向け汎用型AIエージェント「SIMA」とは?[CEDEC 2024]](/games/999/G999905/20240821086/TN/029.jpg)
2024年8月21日,ゲーム開発者向けカンファレンス「CEDEC 2024」で,セッション「SIMA: Developing General AI Agents with Video Games/SIMA:ビデオゲームを用いた汎用型AIエージェントの開発」が行われた。その内容をレポートする。
Genie 3は,一貫性のある世界の構築のため,少なくとも1分前までの世界の情報を保持し,それをもとに各フレームを生成する。
事前に3D環境を構築して,それをベースにするという方式ではなく,プレイヤーの操作やプロンプトにもとづいてフレームを逐次生成することで,動的で豊かな表現ができるという。
![]() |
Google DeepMindは,Genie 3をワールドモデルにとっての重要な節目であるとし,将来的に多くのテスターに利用してもらえるように取り組んでいくとしている。
Google DeepMind「Genie 3: A new frontier for world models」
- 関連タイトル:
開発/テクノロジ
- この記事のURL: