TOP研究計画▽音声・言語情報処理研究グループ

声道モデルの高度化による音声生成機構の物理音響的特徴解析と知的システムのインターフェイスへの応用
音声生成過程の音響モデルの高度化は,音声合成,音声認識,話者認識,あるいは,音声に関連した感性情報処理の基礎となる重要なものである。MRIなどの観測技術の進展により声道の詳細形状が得られるようになってきているが,これらの3次元情報を利用して個人性を含むと考えられる声道の詳細な音響特徴解析が行われる必要がある。本研究では,3次元有限要素法やモード展開法などの数値計算手法を用いて,声道の微細構造の中から,音声の自然性や個人性の出現に重要な部分を明らかにしていく。また,摩擦子音のような非常に高い周波数域までをカバーできる音響モデルの構成や声道内部における音波と高速空気流の相互の結合問題について,計算機シミュレーションのみではなく,計測実験に基づく考察を進めていく。これらの結果を基に、声帯音源や声道壁の実体的なモデルを導入し、発声シミュレーション・システムの構築、高度化を進めていく。

    
▲3次元形状の有限要素メッシュ/a/(左)と声道内部の音圧分布/a/(3654Hz)(右)

言語および知識獲得のための学習能力に基づく音声対話処理
対話はコミュニケーションの手段として我々の日々の生活に不可欠なものである。そして、対話は言語に基づいている。この言語を人間は成長過程で動的に獲得していく。すなわち、人間の幼児は、言語も知識も持たない状態から周囲の様々な環境より学習を行うことで、言葉を話し、種々の知識を持つ大人に成長する。したがって、人間は言語および知識獲得のための生得的な能力を確かに有している。本研究の目的は、この生得的な能力を工学的に構築することによって、環境に応じ言語および多くの知識を習得し、かつ、対話によるコミュニケーションが可能なシステムを実現することである。その結果、システムは、個々のユーザのニーズに動的に適応可能な人にやさしい柔軟なものとなる。このような観点からの研究の応用としては、音声対話機能を持った知的家事手伝いロボットなどが考えられる。

言語情報処理の高度化と知的言語処理システムへの応用
言語情報処理の高度化のためには,知識と文脈情報の融合的な処理のしくみのモデル化とその具体的な実現についての研究開発が様々な視点から進められなければならない.本研究では,人間の文章理解過程における知識と文脈情報の融合的な処理のしくみについて基礎的な考察を進めるとともに,具体的な言語情報処理システムとしてのアイヌ語・日本語機械翻訳システムにおける知識と文脈情報の融合的な処理に関する応用的な考察を進める.さらに,より知的かつ応用的な言語情報処理システムとして,アイヌ語・日本語機械翻訳機構を組み込んだアイヌ語学習入門システムの構築を目指している.

   アイヌ語から日本語への漸進的な翻訳処理過程における知識と文脈情報の利用(例)
   アイヌ語:usey  e=ku        rusuy ya ? : <知識と文脈情報の利用>
     |   お湯 あなた=飲む           [辞書情報利用による単語直接翻訳]
     |   お湯をあなたが飲む           [動詞格フレーム情報利用による格助詞付加処理]
     |   お湯をあなたが飲み たい       [動詞活用処理]
     ↓   お湯をあなたは飲み たい か?   [が・は変換;助動詞活用処理]
   日本語 :あなたはお湯を飲みたいですか?   [主題語順変換と丁寧化処理]
 

 

視覚画像情報処理研究グループへ
ロボット・制御情報処理研究グループへ