1. プロジェクトの背景

NEDOより6/28に公募された調査事業をコンソーシアム

※公募概要抜粋

<aside> 💡 生成AIは、従来のAIでは不可能だった、様々な創造的な作業を人間に代わって行える可能性があることから、産業活動・国民生活に大きなインパクトを与えると考えられており、ポスト5G時代のキラーアプリケーションとしても位置づけられる。

</aside>

<aside> 💡 生成AIの開発には大量かつ良質なデータが必要であり、その確保が生成AIモデルの競争力を左右するが、生成AIの開発にあたって必要なデータは限られており、そのデータセットの構築手法といったデータセットのあり方も模索が続いているところである。また、2023年5月にAI戦略会議で取りまとめられた「AIに関する暫定的な論点整理」においても、「AI利⽤に大きな期待があるものの課題を抱える分野のデータを整備し、その分野に変⾰をもたらすAI開発を促進すべき」と明記されている。

</aside>

<aside> 💡 こうした背景から、例えば音声データセットの構築において効率的なアノテーションの手法が定まっていないといったデータセットの構築手法に課題を抱える分野のデータセットの構築と、それに対するユーザー(基盤モデル開発者)からのフィードバックを通じて、生成AIの開発を加速するためのデータセットの構築のあり方を調査する。本調査事業では、経済産業省の定める「ポスト5G情報通信システム基盤強化研究開発事業研究開発計画」に定められた「競争力ある生成AI基盤モデルの開発」に参画している事業者等と連携し、そのニーズの取り込みも図る。

</aside>


コンソーシアム参加企業

プロジェクトは4社のコンソーシアムによる協力で進行しており、各社が持つ専門性を活かして生成AI開発のためのデータセット構築を行います。

<aside>

主な参加企業

※NTMはソフトバンク株式会社からの再委託


2. プロジェクトの目的