XISLについて

[英語版]

XISLとは?

マルチモーダル 対話記述言語です.以下のような特徴を持ちます.
  • 利用モダリティの拡張が容易で,言語仕様の変更が必要ない.
  • 対話記述のみを,データやコンテンツから分離して記述するため,双方の再利用性が高い.

   
   
モダリティ,
マルチモーダル

元々は心理学で用いられている用語です.人間の「知覚的様相」,つまり人間の脳が知覚できる一つのチャンネルを流れる情報(言語,個性,感情など)をモダリティと呼びます.複数のモダリティを利用することをマルチモーダルといいます.
例えば,表情豊かに何かを喋るとき,顔では「感情」,音声では「言語」という二つのモダリティを扱っていることになります.したがって,これはマルチモーダル発話といえるでしょう.また,モダリティを伝えるメディアが一つであっても,複数のモダリティを使っている場合があります.例えば,感情を込めながら相手に力説するときや,面接で声を震わせながら喋るとき,音声という一つのメディアで「言語」と「感情」を伝えています.
近年の技術の発展に伴い,様々なモダリティがコンピュータ上で扱えるようになりました.当研究室で提案しているXISLは,そうしたモダリティを統合的に扱うための言語です.
   
   
対話記述言語

人間同士の対話では,対話中の双方が自由に発話して話を進めていきます.しかし,人間とコンピュータとの対話では,コンピュータが自由に喋るには,まだまだ研究の進歩が必要です.
そこで人間とコンピュータが対話するときに,あらかじめ対話のシナリオを準備し,それに従って対話を進めていくことが考えられました.そのシナリオを記述しているのが対話記述言語です.
これまでの対話記述言語としては,VoiceXMLが提案されています.VoiceXMLは電話を間に挟んだ対話を想定しているため,音声とプッシュボタンのみを使った対話が記述できます.
これに対して,XISLは任意のモダリティを利用した対話を記述することが可能です.