当研究室では計算機で「知的な処理」を行うための研究を行っています.
知的な処理を実現するためには,実世界に関する膨大な「知識」が 必要です.知識は様々な形式で表現されますが,最も柔軟性に富み, 「意味」に迫ることができるのが言語(自然言語)です.
特に90年代中盤以降のインターネットの普及に伴い,ネット上には膨大な知識が 言語の形で蓄えられています. 我々は知識源としてのウエブに注目し,二つの方向から研究を行っています. 一つはウエブコンテンツ, 特にテキスト(自然言語)の「理解」です.このための日本語解析や ウエブマイニングなどを研究しています.もう一つは発信側で 知識を構造化する「セマンティックウエブ」の利用です.特に 最近着実に進展しているLinked Data (Linked Open Data)は 意味処理とも親和性があります.我々は特に地域情報を 題材に,LODによる知識の共有を進めています.

人間の知的な活動においても言語と知識は二つの大きな柱です。 ウエブという膨大なデータを足掛かりにして, これら双方を計算機で扱うことにより、 私たちの社会を豊かにする方法を探りたいと思います。

研究テーマ


日本語解析・生成

「ネット日本語」の解析

ブログやマイクロブログ(twitter)には新聞や教科書のような日本語とは違う「崩れた表現」 やいわゆる「若者言葉」などが頻出し,計算機による解析を失敗させる原因になっています. 我々はこのような日本語を解析する手法を検討しています.

地域言語(岡山弁)

岡山県では都市部でも岡山弁が健在です.怖い,美しくない,と言われる(こともある)岡山方言ですが, 現代日本語が失ってしまった古語表現が生き残っているなど興味深いものです. ここでは analysis by synthesis をモットーに岡山弁の計算機モデルを検討し,「岡山弁のできる計算機」 の実現を目指しています.


情報抽出,ウエブマイニング

ブログやtwitterに代表されるマイクロブログから人々の行動や意識を探ります。特にマイクロブログは 情報発信の障壁をかなり低くしたと考えられ,コミュニケーションを本当に意図しているのか?と思 われるような「つぶやき」が多数投稿されている一方,そのリアルタイム性とユーザの多さから, 公共性の高い情報を提供する手段としても活用されていることも周知の通りです. ここではどちらかと言うと前者の「つぶやきに近い情報」に注目してネットユーザの動向等を探ります.


知識処理(オープンデータの流通と活用)

LD(Linked Data)/LOD(Linked Open Deata)による地域情報の流通促進

情報通信インフラの整備により、多くの有用な情報が「ウエブページ」の形で公開されています。これらの ウエブページは我々人間にとって分かりやすく希望の情報が探しやすいように工夫されていますが、 計算機プログラムによる二次利用(つまり計算機に「読ませて活用させる」こと)は容易でありません。 これは人間にとっては最も自然な情報伝達手段である「言葉(自然言語)」が計算機にとっては曖昧だったり, 多様だったりするためです.我々は上述のように「言葉を理解する計算機」を開発することでこの問題に取り組んで いますが,短期的には情報をウエブで発信する時にもう少し「計算機にとって理解しやすい記述」を使う (つまり計算機に歩み寄る)ということも必要だろうと考えています.そのような取組は Semantic Web, Linked Open Data(LOD)などと呼ばれ,以前から世界的な広がりをみせています. 我々は特に地域情報の高度利用という観点から、LODの有用性や課題について検討しています.

防災分野におけるデータの活用

総社市のデジタルハザードマップ(総社市サイト)

LOD普及に向けて

岡山・香川の観光イベント一括案内
岡山県と香川県は,穏やかで美しい瀬戸内海をはさんで非常に密接な関係にあります.観光でこの地域を訪れる方々も「県」という行政の境界を越えて 楽しんでおられます.そこで,このサイトではLODを用いて両県の観光境界が発信する観光イベント情報を統合的に検索できる 仕組みを作りました.おまけとして国立情報学研究所が主導するLODACの情報にもアクセスできるようにしています.

Linked Open Data チャレンジJapan 2013 「ベストプレゼンテーション賞」かいけつエクスプレス(菊井玄一郎,但馬康宏,齋藤美絵子(デザイン学部・造形デザイン学科)) 

大学入試問題(センター試験)を計算機に解かせる

大学入試問題は人間の知的能力の一つの側面を測定する尺度としてなかなか興味ふかいものです. 計算機に大学入試問題を解かせることにより,知的情報処理の現状の到達点と今後解決すべき課題が 明らかになると考えています.
このような考えのもと国立情報学研究所が中心となって「ロボットは東大に入れるか(略称:東ロボ)」という プロジェクトが立ち上がっています. 我々は当学科の磯崎研究室や企業の研究所,他の大学と連携して「英語チーム」としてこの課題に 取り組んでいます.この秋に行われた「代ゼミセンター模試」において我々の英語チームは受験生の 平均を若干上回る成績を取ることができました.
報道発表(NTT, 国立情報学研究所)
ページのトップへ戻る