おしゃれなこと言うね?…車から見える景色を話題にする対話AI NTTが開発

テクノロジー レスポンス

おしゃれな雰囲気のカフェだなあ……。AIが運転中のドライバーに話しかける。NTTは、車から見える移り変わる景色を話題として、パートナーのように知識応答や共感応答をする対話AIを実現した。NTTが5月30日に発表した。

従来の大半の対話システムは、話者の発話から得られるテキスト情報のみを入力とすることが多く、その周囲のリアルタイムな画像情報や位置情報などを取り込めなかった。日々のコミュニケーション・パートナーの対話システムでは、話者の身の回りの実際の状況を理解し、対話に取り込むことが求められる。

NTTはこの課題に対し、同社が構築した深層学習に基づく大規模テキスト対話モデルを、ドライブ中の対話データ・周辺情報データを用いて追加学習することで、景色として見える画像情報および関連する外部知識に基づく対話を実現したという。

NTTは、画像内の物体の情報と、自己位置周辺のスポット情報を大規模対話モデルに導入する技術を開発した。画像内に写っている物体群については、物体検出と呼ばれる技術を用いて抜き出し、それぞれを大規模対話モデルで扱える数値情報(埋め込みベクトル)に変換して入力する。

スポット情報については、自己位置近傍のレストラン等のスポットに関する情報(ジャンル・名称等)をテキスト形式で取り出し、対話の文脈と同様の形式で入力する。大規模対話モデルはこれらの入力情報に基づき、それらを反映した対話AIの発話を出力する。

このように設計したモデルを、ドライブ対話データ(運転画像を見ながらガイド役・ドライバー役の間で行った対話)で学習することで、自己位置周辺の景色画像・スポット情報に基づく発話生成を実現した。

NTTでは、対話を通して人の興味や思考を引き出したり人の対話欲求を充足したりする、雑談対話AIの開発に取り組んでいる。近年の深層学習技術の進展によって、対話AIの性能は急激に向上しており、NTTでも日本語最大規模の学習データを用いた高性能日本語対話AIを構築しているという。

今後NTTでは、日常的なドライブのパートナーをめざして、日々繰り返される対話への適用や、居眠り運転・漫然運転防止の実証実験に取り組んでいく。

この対話AIの成果は、6月2日よりオンラインで開催の、コミュニケーション科学基礎研究所研オープンハウス2022に出展される。

  • 高木啓
  • 実現された対話の例《画像提供 NTT》
  • 画像・スポット情報の入力が可能な対話モデル《画像提供 NTT》
  • 対話AI全体の構成図《画像提供 NTT》
goo 自動車&バイク
トップ
中古車
車買取・査定
車検・整備
自動車保険
バイク
バイク買取・査定
ランキング
ニュース
特集
Q&A
サイトマップ