VisionActionModel


Paper/Blog Link My Issue
#ComputerVision #Dataset #read-later #Selected Papers/Blogs #Game #UMM #4D (Video) Issue Date: 2025-12-21 GPT Summary- NitroGenは、1,000以上のゲームを対象に40,000時間のプレイ動画で訓練された汎用ゲーミングエージェント向けのビジョン-アクション基盤モデルです。プレイヤーの操作を自動抽出したビデオ-アクションデータセット、クロスゲーム一般化を測るマルチゲームベンチマーク、ビヘイビア・クローン学習によるモデルを含みます。3Dアクションゲーム、2Dプラットフォーマー及び手続き的生成世界において高い能力を示し、未見のゲームでも最大52%のタスク成功率向上を実現。データセットやモデルの重みを公開し、汎用的な体現エージェントの研究を促進します。 Comment

元ポスト:

Loading…

HF: https://huggingface.co/nvidia/NitroGen
pj page: https://nitrogen.minedojo.org/

1000以上のゲームの40000時間を超えるゲームプレイから学習されたVideo to Action Model

CVPR Best Paper Honorable Mention:

Loading…