コンピュータを用いて言語の意味がどのように理解されるか、ということを明らかにする研究に取り組んでいます。
言語の通時的な意味変化のモデル化
視覚言語モデルは何を理解しているのか
LLM はカードゲームのルールを理解してプレイできるか
KWIC (Keyword in context) 形式の用例検索の高速化・可視化と分析
自然言語処理や言語学・国語学、言語教育・言語学習などのための言語資源(ツール、コーパス、辞書)構築に取り組んでいます。
文書単位のテキスト平易化コーパスの構築
日本語の文書要約におけるハルシネーションの評価データセットの構築
マルチモーダル LLM(VLM、Video LLM)評価データセット構築
日本語の複単語表現の理解能力の評価データセット構築
大規模言語モデルなどを用いた言語理解・言語生成とその評価に関する研究に取り組んでいます。
LLM を用いた大喜利の生成と評価
新聞記事に対する理解度向上のための QA の生成と評価
日本語や中国語の古文の現代語への翻訳
大規模言語モデルの評価におけるバイアス
2026年現在、以下のような研究プロジェクトに取り組んでいます。
JST さきがけ「文理融合による人と社会の変革基盤技術の共創」領域で、自然言語処理と社会科学の交差点を目指して大規模言語モデルで社会科学がどう変わるかの研究に取り組んでいます。特設ページもご覧ください。(2027年3月まで)
また、同領域で九工大の峰松さんと「遊戯王カードゲームは大規模言語モデルで解けるのか?」、武蔵大の原さん・マックスプランク人間開発研究所の矢倉さんと「言語・非言語情報から探る過激思想と対立関係:フィールド調査へのAI 応用」というテーマで領域内連携研究を行っています。(2027年3月まで)
一橋 SDS の欅研究室と一緒に、大規模言語モデル時代に人間がどのようなテキストをどう好むのか、という謎について迫りたいと思っています。(2028年3月まで)
一橋の寺尾先生が代表となって、様々な研究グループが一緒になって言語や人種・生物などの科学的分類の再構築を行う、というプロジェクトで、分担者として言語を中心とした多言語モデルによる分類についての検討を行う予定です。(2027年3月まで)
明治大学の田中先生が代表となって、近現代の日本語の歴史を多角的に研究するというプロジェクトで、自然言語処理班(統計的手法による言語変化の研究)の分担メンバーとして研究を行う予定です。(2030年3月まで)
以下の方々と共同研究を行なっています(兼業除く)。
富士電機