機械翻訳・翻訳者支援
グローバル化や多言語・多文化社会の拡大の中,緊急時における重要情報の迅速・正確な多言語化や世界全体に向けた情報発信など,言語を超えたコミュニケーションの重要性が高まっています. しかしながら現時点では,翻訳者による文章の多言語化の生産性はボランティアによるものを含めたとしても非常に限られています. 一方,計算機による翻訳(機械翻訳)は,人間よりも高速ではあるものの,人間の翻訳に比べると品質が落ちますし,リアルタイムなコミュニケーションのためにはさらなる高速化も必要です. 我々は,機械翻訳技術の高度化,ならびに翻訳者・翻訳学習者を支援するための技術に関する研究に取り組んでいます.
機械翻訳を含む翻訳関連技術の性能向上
- 教師なし機械翻訳や弱教師あり機械翻訳のための単言語コーパスの活用技術
- 単言語コーパスからの対訳文対の自動獲得 [Marie+, ACL 2017] [Marie+, NAACL 2019]
- 単言語コーパスからの対訳フレーズ対の自動獲得 [Marie+, TACL 2017] [Marie+, TALLIP 2018]
- 教師なし機械翻訳 [Marie+, WMT 2019] [Marie+, TALLIP 2020]
- 少資源言語対・分野のニューラル機械翻訳向けの技術
- 多言語処理と転移学習 [Imankulova+, 2019] [Dabre+, EMNLP 2019] [Dabre+, WMT 2020]
- 教師なし分野適応・スタイル転移 [Marie+, TACL 2020]
- ハイパーパラメタチューニング [Rubino+, MT Journal 2020]
- 機械翻訳の品質推定 [Liu+, TASLP 2017] [Rubino+, Eval4NLP 2021] [Rubino+, WMT 2021]
- 複数のMTシステムのリランキング [Marie+, AMTA 2018]
- ニューラルネットワーク一般技術 [Dabre+, AAAI 2019] [Dabre+, WNGT 2020] [Dabre+, MT Summit 2021]
- 各種データセットの構築
- NICT QE/APE: 話し言葉, 日->英中韓, 品質推定・機械翻訳後編集 [Fujita+, 2017]
- JaRuNC: 書き言葉, ニュース・コメンタリー, 日露英, 機械翻訳 [Imankulova+, 2019]
- Staged PE: 書き言葉, ニュース記事, 英日, 翻訳後編集と誤りのアノテーション [Fujita, MT Summit 2021]
- 機械翻訳研究のメタ分析 [Marie+, ACL 2021]
翻訳者・翻訳学習者支援と翻訳プロセス研究
- 翻訳プロセスについて語るためのメタ言語の設計と構築
[Fujita+, TAUS Asia 2019]
[Yamada+, TT5 2020]
- 翻訳教育向けの校閲カテゴリとその有用性の検証
- 校閲カテゴリの体系化 [豊島+, 2016] [Fujita+, 2017]
- 翻訳学習者の誤り傾向の時系列分析 [山本+, 2016] [田中+, 2018]
- 翻訳方略の体系化 [Yamamoto+, IATIS 2021]
- 翻訳教育向けの校閲カテゴリとその有用性の検証
- 機械翻訳の前編集として有用そうな書き換え操作の俯瞰 [宮田+, 2017] [Miyata+, EACL 2021]
- プロジェクト翻訳を想定した翻訳実習環境 [Kageura+, 2016] [Kageura+, 2017]
翻訳に関わるコミュニティ間の橋渡し
- 言語処理学会テーマセッション
[NLP2016〜NLP2020のテーマセッションの総括]
- NLP2016 『文理・産学を越えた翻訳関連研究』 [E5] [E6] [E7] [山田+, 2016b]
- NLP2017 『翻訳の質と効率: 実社会におけるニーズと工学的実現可能性』 [D6] [D7]
- NLP2018 『翻訳における人間と機械の協働: for what, how, where, when and why?』 [E4]
- NLP2019 『産業翻訳に役立つ自然言語処理技術』 [F4]
- NLP2020 『翻訳とは何か? 何ではないか?』 [G1] [G2] [G3]
- NLP2021 『翻訳プロセスの解剖と翻訳テクノロジー』 [E5] [E6]
- 日本通訳翻訳学会での講演
- 年次大会での講演 [山田+, 2016a] [藤田, 2017b]
- 翻訳通訳テクノロジー研究プロジェクトでの講演 [藤田, 2017a]
- 関東支部例会での講演 [藤田, 2021]