研究内容
概要
自然言語処理で扱う言語の問題は文法などの言語固有の問題を越えて,人間の認識・理解,また言語で書き表されたものをどのように便利に扱うか,といったなどさまざまな問題と関連して存在しています.このような多層に広がる言語処理の問題について,我々は例えば以下のような研究課題を対象に研究を進めることで人間の言語理解のモデル化やそれを利用した応用処理などのサービスを考えています.
マルチモーダル情報を利用した言語処理
人間同士の言語を使ったコミュニケーションには,言語情報以外にも声の調子,どこを見ているか,どんなジェスチャーをともなっているかなど,言語以外のモーダルが関係しています.我々は視線計測装置を用いて対話している人間の視線を発話と同時に記録し,人間がどこを見ながら話しをしているかを分析し,対話においてより人間に近い振舞いをできるシステムの構築を目指しています.
照応・共参照解析
文章中に出現する代名詞や省略が何を指しているのかという照応・共参照の解析の課題は人間の言語理解を扱う問題として古くから研究が進められてきました.しかし,それらは個別に研究者が作成した少量の言語データを用いた評価にすぎず,実際にその評価が適切なのかの判断の見極めが困難でした.これに対し,近年では機械学習の成熟や言語処理の基盤処理の発展,言語資源の整備にともない,この課題をより客観的に扱う環境が整ってきました.このような背景から,これまでに談話研究で蓄積された知見を機械学習のモデルにどう組み込むか,また大規模な問題を問くことでわかる問題の分析,さらに解析結果を言語教育などのの応用処理へ利用するという研究テーマに取り組んでいます.
言語資源の構築と利用
人間が産出した言語表現の集積は,人間の言語活動を解明する上で有力な手がかりとなります.近年の言語処理では,コーパスと呼ばれるこのような言語表現の集積から主に統計的な手法によって言語処理に有用な様々な知識を構築するアプローチが主流になっています.そのためには,コーパスの構築とそれに詳細な情報を付加することが必要になります.我々はコーパスを構築するための支援環境の開発やそれを実際に使って種々のコーパスを作成しています.