JST さきがけ研究領域「文理融合による人と社会の変革基盤技術の共創」に採択された「意思決定のための自然言語処理による未来予測」の特設ページです。2023年度から2026年度までのプロジェクトです。
本プロジェクトでは下記の研究テーマに取り組んでいます。
近現代の言語変化のモデリング
単語埋め込み(ベクトル)に基づく通時的な単語の意味変化の研究を行っています。(木山ら, J NLP 2025; Kiyama et al., COLING 2025; 木山ら, NL研 2024=優秀研究賞; 木山ら, NLP 2024; 凌ら, J NLP 2024; 凌ら, NLP 2024)
ベクトルの時間変化の解釈性の高い分析手法の研究を行っています。(相田ら, NLP 2025)
言語モデルの価値判断やバイアスの分析
俳句 (結城ら, JSAI 2024) や大喜利 (坂部ら, YANS 2024; 坂部ら, NLP 2025) を対象に、クリエイティブなテキスト生成や評価を行う際にどのようなバイアスがあるか、といった分析の研究を行っています。
多言語大規模言語モデルに含まれるバイアスの検証 (Enomoto et al., NAACL 2025; 榎本ら NLP 2025; 榎本ら, YANS 2024) や、多言語言語モデルの分析 (Kim et al., EMNLP 2024; 金ら, JSAI 2025) の研究をしています。
多言語大規模言語モデルに含まれる数値バイアスの分析を行っています。(佐藤ら, YANS 2024; 佐藤ら, NLP 2025b; Sato et al., WMT 2024; Enomoto et al., BEA 2024)
言語モデルの社会的受容性の向上
社会科学的な分野を含めた色々な場面で自然言語処理を用いた解釈性の向上に取り組んでいます。(中島ら, NLP 2025; Nakajima et al., CDEF 2025; 佐藤ら, NLP 2025a)
大規模言語モデルのチューニングの透明性 (Nakajima et al., PACLIC 2024; 中島ら, NLP 2024; 中島ら, YANS 2024) に関する研究をしています。
マルチモーダル大規模言語モデルの評価のためのデータセットの構築やバイアスの分析を行っています。(大平ら, JSAI 2025)
また、同領域で九工大の峰松さんと「遊戯王カードゲームは大規模言語モデルで解けるのか?」、武蔵大の原さん・マックスプランク人間開発研究所の矢倉さんと「言語・非言語情報から探る過激思想と対立関係:フィールド調査へのAI 応用」というテーマで領域内連携研究を行っています。(2027年3月まで)
木山朔, 相田太一(都立大), 小町守, 小木曽智信(国語研), 高村大也(産総研), 持橋大地(統数研). 通時的な類似度行列に基づく単語の意味変化の分析. 自然言語処理, Vol.32, No.4, December, 2025. (Accepted)
凌志棟(都立大), 相田太一(都立大), 岡照晃, 小町守. 日本語意味変化検出のための評価データセットの構築と分析. 自然言語処理, Vol.31, No.4, pp. 1487-1522. 2024年12月. (PDF)
Shuta Nakajima, Toshiaki Watanabe, Mamoru Komachi, Atsushi Keyaki. Improving Explainability in Stock Return Prediction Using Stock Forum Texts with Independent Component Analysis. Proceedings of 3rd International Conference on Computational Data Sciences in Economics and Finance (CDEF 2025). July, 2025.
Taisei Enomoto (TMU), Hwichan Kim (TMU), Zhousi Chen, Mamoru Komachi. A Fair Comparison without Translationese: English vs. Target-language Instructions for Multilingual LLMs. Proceedings of the 2025 Annual Conference of the Nations of the Americas Chapter of the Association for Computational Linguistics (NAACL 2025). April, 2025. (PDF)
Hajime Kiyama (TMU), Taichi Aida (TMU), Mamoru Komachi, Toshinobu Ogiso (NINJAL), Hiroya Takamura (AIST), Daichi Mochihashi (ISM). Analyzing Continuous Semantic Shifts with Diachronic Word Similarity Matrices. The 31st International Conference on Computational Linguistics (COLING 2025). January, 2025. (PDF)
Kyotaro Nakajima (TMU), Hwichan Kim (TMU), Tosho Hirasawa (TMU), Taisei Enomoto (TMU), Zhousi Chen, Mamoru Komachi. A Survey for LLM Tuning Methods: Classifying Approaches Based on Model Internal Accessibility. Proceedings of the 38th Pacific Asia Conference on Language, Information and Computation (PACLIC 38). December, 2024. (poster)
Hwichan Kim (TMU), Jun Suzuki (Tohoku University), Tosho Hirasawa (TMU), Mamoru Komachi. Pruning Multilingual Large Language Models for Multilingual Inference. Findings of the 2024 Confernece on Empirical Methods in Natural Language Processing (EMNLP 2024), pp.9921–9942. November, 2024. (PDF)
Ayako Sato (TMU), Kyotaro Nakajima (TMU), Hwichan Kim (TMU), Zhousi Chen and Mamoru Komachi. TMU-HIT's Submission for the WMT24 Quality Estimation Shared Task: Is GPT-4 a Good Evaluator for Machine Translation? Ninth Conference on Machine Translation (WMT24), pp. 529-534. November, 2024. (poster, PDF)
Taisei Enomoto (TMU), Hwichan Kim (TMU), Tosho Hirasawa (TMU), Yoshinari Nagai (TMU), Ayako Sato (TMU), Kyotaro Nakajima (TMU) and Mamoru Komachi. TMU-HIT at MLSP 2024: How Well Can GPT-4 Tackle Multilingual Lexical Simplification? Proceedings of the 19th Workshop on Innovative Use of NLP for Building Educational Applications (BEA 2024), pp.590-598. June, 2024. (poster, PDF)
大平 颯人, 小町 守. VQA のための長尺動画からの必要断片抽出タスクの提案. 2025年度人工知能学会全国大会, 1Win4-33, pp. 1-4. 2025年5月. (PDF)
金 輝燦(都立大), 金子 正弘(MBZUAI), 平岡 達也(MBZUAI/理研), 小町 守, 乾 健太郎(MBZUAI/東北大/理研), Timothy Baldwin(MBZUAI). 知識汚染パラメータの枝刈りによる関係知識推論の改善. 2025年度人工知能学会全国大会, 3Win5-87, pp. 1-4. 2025年5月. (PDF)
相田 太一 (都立大), 小町 守 (一橋大), 小木曽 智信 (国語研), 高村 大也 (産総研), 持橋 大地 (統数研/国語研). ガウス過程による埋め込み点集合の時間遷移のモデル化. 言語処理学会第31回年次大会発表論文集, pp. 105--110. 2025年3月11日. (PDF)
中島 京太郎, 金 輝燦, 平澤 寅庄, 榎本 大晟 (都立大), 陳 宙斯, 小町 守 (一橋大). 大規模言語モデルに対するチューニング手法の調査:内部のアクセス性に基づく分類と比較. 言語処理学会第31回年次大会発表論文集, pp. 133--137. 2025年3月11日. (PDF)
佐藤 祥太 (金沢大), 木山 朔 (都立大), 中島 秀太, 小町 守 (一橋大), 唐堂 由其 (金沢大). 単語埋め込みの独立成分分析の軸が解釈できる粒度はどれくらいか? 言語処理学会第31回年次大会発表論文集, pp. 708--713. 2025年3月11日. (PDF)
佐藤 郁子, 金 輝燦 (都立大), 陳 宙斯 (一橋大), 三田 雅人 (サイバーエージェント/都立大), 小町 守 (一橋大). アライメントが大規模言語モデルの数値バイアスに与える影響. 言語処理学会第31回年次大会発表論文集, pp. 2809--2814. 2025年3月12日. (PDF)
坂部 立 (一橋大), 金 輝燦 (都立大), 小町 守 (一橋大). 人間と LLM の "面白さ" の感性は一致するのか? 言語処理学会第31回年次大会発表論文集, pp. 2815--2820. 2025年3月12日.(博報堂DYホールディングス賞受賞) (PDF)
榎本 大晟, 金 輝燦 (都立大), 陳 宙斯, 小町 守 (一橋大). 多言語大規模言語モデルにおける英語指示文と対象言語指示文の公平な比較. 言語処理学会第31回年次大会発表論文集, pp. 2832--2837. 2025年3月12日. (PDF)
中島 秀太, 欅 惇志, 渡部 敏明, 小町 守. 株式掲示板テキストを活用したリターン予測における独立成分分析を利用した解釈性の向上. 言語処理学会第31回年次大会発表論文集, pp. 2326--2331. 2025年3月. (PDF)
木山朔 (都立大), 相田太一 (都立大), 小町守, 小木曽智信 (国語研), 高村大也 (産総研), 持橋大地 (統数研). 単語の通時的な類似度行列による意味変化パターンの分析. 情報処理学会第262回自然言語処理研究会. 2024年12月12日.(優秀研究賞受賞)
結城 喬 (都立大), 上田 直生也 (都立大), 岡 照晃 (都立大), 小町守. GPT による俳句の自動評価に向けて. 2024年度人工知能学会全国大会論文集, 4Xin2-91, pp. 1-4. 2024年5月. (PDF)
凌志棟, 相田太一, 岡照晃 (都立大), 小町守 (一橋大). 日本語意味変化検出の評価セットの拡張と検出手法の評価. 言語処理学会第30回年次大会. 2024年3月12日. (poster, PDF)
木山朔, 相田太一 (都立大), 小町守 (一橋大), 小木曽智信 (国語研), 高村大也 (産総研), 松井秀俊 (滋賀大), 持橋大地 (統数研). 意味変化分析に向けた単語埋め込みの時系列パターン分析. 言語処理学会第30回年次大会. 2024年3月13日. (oral, PDF)
榎本 大晟 (都立大), 金 輝燦 (都立大), 陳 宙斯 (一橋大), 小町 守 (一橋大). Multilingual LLM への指示文は本当に英語であるべきなのか?. YANS2024. 2024年9月5日.(奨励賞受賞)
坂部 立 (一橋大), 金 輝燦 (都立大), 小町 守 (一橋大). 人間とLLMが考える"面白い”は一致するのか? YANS2024. 2024年9月6日.(奨励賞受賞)
木山 朔 (都立大), 相田 太一 (都立大), 小町 守 (一橋大), 小木曽 智信 (国語研), 高村 大也 (産総研), 持橋 大地 (統数研). 日本語の単語を対象とした複数時期の意味変化パターン分析. YANS2024. 2024年9月6日.(スポンサー賞=フューチャー株式会社賞受賞)
佐藤 郁子 (都立大), 金 輝燦 (都立大), 陳 宙斯 (一橋大), 三田 雅人 (サイバーエージェント/都立大), 小町 守 (一橋大). テキスト評価におけるLLMアライメント手法の影響分析. YANS2024. 2024年9月6日.
中島 京太郎 (都立大), 金 輝燦 (都立大), 平澤 寅庄 (都立大), 榎本 大晟 (都立大), 小町 守 (一橋大). 言語モデルの透明性ごとに適応な可能なチューニング手法の調査. YANS2024. 2024年9月6日.