ことばについて研究しています

研究分野:
計算言語学,自然言語処理,知能情報学
研究トピック:
自然言語表現の言い換え翻訳 (機械翻訳,人間の翻訳)その他
関心のあること:
機械学習,データマイニング,教育方法論,言語運用支援など

言語は,計算機が発明される以前から情報の伝達・蓄積やコミュニケーションにおける最も中心的な役割を担ってきました. 近年では,Webと計算機を介した情報発信・受信やコミュニケーションが一般的になり,その中でも,電子メール,ブログ,SNSなど,電子化されたテキストを通じたコミュニケーションの機会が一層増えています. 我々は,自然言語に備わっている様々な特徴や人間の言語の運用メカニズムの解明を目指し,自然言語を計算機で扱うための各種要素技術と,それに基づいてコミュニケーションを円滑化する技術について研究しています.

実施中のプロジェクトと最近の査読付き論文

総務省委託研究: 多言語音声翻訳技術の研究開発と社会実証

NICTは翻訳の性能向上を目指した各種研究開発を担当しています. 私自身は,翻訳品質推定,翻訳後編集,およびそれらの評価用データの構築,翻訳前編集などの研究を手がけています.

  • [Dabre & Fujita, 2019a] AAAI. Recurrent Stacking of Layers for Compact Neural Machine Translation Models.
  • [Imamura+, 2018] WNMT. Enhancement of Encoder and Attention Using Target Monolingual Corpora in Neural Machine Translation.
  • [Marie & Fujita, 2018b] AMTA. A Smorgasbord of Features to Combine Phrase-Based and Neural Machine Translation.

機械翻訳を含む多言語処理

同僚インターンと一緒に,様々な観点から多言語処理に関する研究を進めています. インターン経験者など,所属研究室外の方と連携することもあります.

  • [Dabre+, 2019] EMNLP-IJCNLP. Exploiting Multilingualism through Multistage Fine-Tuning for Low-Resource Neural Machine Translation.
  • [Imankulova+, 2019] MT Summit. Exploiting Out-of-Domain Parallel Data through Multilingual Transfer Learning for Low-Resource Neural Machine Translation.
  • [Marie & Fujita, 2019b] ACL. Unsupervised Joint Training of Bilingual Word Embeddings.
  • [Marie & Fujita, 2019a] NAACL-HLT. Unsupervised Extraction of Partial Translations for Neural Machine Translation.
  • [Marie & Fujita, 2018a] ACM TALLIP. Phrase Table Induction Using Monolingual Data for Low-Resource Statistical Machine Translation.

科研費基盤研究(S): 翻訳プロセス・モデルと統合環境の構築

影浦峡先生が代表者の『翻訳規範とコンピテンスの可操作化を通した翻訳プロセス・モデルと統合環境の構築』という科研費プロジェクトを一緒に進めています. これまで非常に粗い粒度で,かつ翻訳プロセスと関連付けない形でしか語られてこなかった翻訳規範および翻訳に必要なコンピテンスを細粒度で陽に記述,体系化するとともに,それらを翻訳プロセスと関連付けて操作できるようにします. これを通じて理論の精緻化,教育(=技能継承)基盤の確立,有用な技術の実現,さらには,それらを統合した翻訳支援環境を開発し,産業翻訳における品質要求に応じたプロセス管理,さらには社会における翻訳リテラシーの涵養への貢献を目指します.

  • [宮田・藤田, 2017] JAITS. 機械翻訳向けプリエディットの有効性と多様性の調査.
  • [Fujita+, 2017] LAW. Consistent Classification of Translation Revisions: A Case Study of English-Japanese Student Translations.