自然語理解(NLU)とは?

AIが速く、より正確にユーザーの意図を理解し、ユーザーの意思決定に有用な情報を抽出する能力を発揮するコア技術

コンピュータは自然語理解(NLU, Natural Language Understanding)を通じて話す人の言葉だけでなく、使用者が実際に意味することを推論することができる。 簡単に言えば、クローバ、Googleアシスタント、アレクサなどAI音声認識プラットフォームに「外は(外部)どうですか?」と尋ねたとき、プラットフォームはユーザーが天気予報を要求しているということが推測できる。

最近、音声認識プラットフォームは、人間の言語内でパターンと意味を認識することに重点を置いた人工知能であるNLUとして構築される。 コンピューターが特定の方式で尋ねなくても、言葉の意味を理解すれば、音声を使って実際に会話をしているように感じることができる。

「コミュニケーションは、意味を解釈することにおいて絶え間ない学習だ。 私たちは間違っている単語を使うのだが、私たちが言う言葉は実際に意味しないことがある。 NLUはコンピュータに必要な状況を説明し、同じ内容を話せる多様な変形を理解できる柔軟性を提供する。

NLU以前は音声入力で天気アプリをデザインするには、「雨降ってますか?」という数千種類の方法のリストが必要だった。 NLUを使えば音声認識デバイスは数千もの多様なアプリケーションで過去の相互作用を通じた学習を適用し、「雨が降るでしょうか」と「雨が降るだろう」が本質的に同一の質問であることが理解できる。 このような柔軟性により、音声経験は技術とより速く簡単に楽しく会話し、参加することができる。


NLUを統合した音声技術を通じて、開発者は有用な音声経験をデザインすることに集中することができ、使用者が話そうとする内容を推論しようとする努力を減らすことができる。

そうすると、より自然な音声経験をデザインするために、例えば意図の把握(IdentifyIntent)と人々が目標と意図を知らせるために言える他の単語や文句は何なのかの発話識別(IdentifyUtterances)の例題、ユーザーにエラーを修正したり回答を変更する機会を提供する見出し修正(CoverCorrections)、ふりをして間違った答えをするより常に「自分はそれに対する答えを知らない」と言うことが重要である。

音声デザインには他のレイヤーがたくさんある。 例えば、音声ユーザインタフェースは簡潔であり、必要な分だけ情報を提供すべきであり、自然な対話のように追加情報を通じてユーザの反応を漸進的に構築し、ユーザをターゲットに移動させることが何より重要である。

このように自然語理解(NLU)はAIが速く、より正確に使用者の意図を理解し、使用者の意思決定に有用な情報を抽出する能力を発揮する核心技術である。

関連記事一覧