「世界モデル」という言葉は少し分かりにくいですが、簡単に言えば、現実世界で自動運転などに使えるような、より拡張された知識の枠組みを作るということです。
ただ、この考え方や技術は、専門外の人間がいきなり説明するのはかなり難しい。そこで、Microsoft Copilotの力を借りて、世界モデルがどういうものか、何が難しいのかを理解することを目標としました。
自動運転に注目し、ポイントがボケないように動画生成などの分野は省きます。また、回答も専門的な内容は省略し、筋を追えば、なんとなく理解したつもりになれるレベルを目指します。

[内容]

  • 生成AIの世界モデルとはどんなもの
  • ChatGPTのような大規模言語モデルと何が違い、何が同じ
  • 技術的には何が違い、何が同じ
  • 文脈ベクトルに相当する世界モデルの表現ベクトルの次元はどのくらい
  • 世界モデルの生成AIを自動車に積めるまでコンパクトに構成できるか
  • 自動運転における生成AIの世界モデルはどの程度の完成度になれば使える技術と判断できるのか
  • 日本で自動運転が実用化されるにはいつ頃になりそうか

自動運転に絞って、生成AIの世界モデルの現状についてレポートしました。生成AIは今後どんどん我々の社会に入り込んでくることは間違いありません。しかし、そうなった時に、今回のレポートで問題になった事柄が、自動運転の世界だけではなく、教育や医療はたまた行政、政治の世界でも重要な課題になることを忘れてはならないでしょう。

「生成AIの世界モデル」の記事を読む