ことばについて研究しています

研究分野:
計算言語学,自然言語処理,知能情報学
研究トピック:
自然言語表現の言い換え翻訳 (機械翻訳,人間の翻訳)その他
関心のあること:
機械学習,データマイニング,教育方法論,言語運用支援など

言語は,計算機が発明される以前から情報の伝達・蓄積やコミュニケーションにおける最も中心的な役割を担ってきました. 近年では,Webと計算機を介した情報発信・受信やコミュニケーションが一般的になり,その中でも,電子メール,ブログ,SNSなど,電子化されたテキストを通じたコミュニケーションの機会が一層増えています. 我々は,自然言語に備わっている様々な特徴や人間の言語の運用メカニズムの解明を目指し,自然言語を計算機で扱うための各種要素技術と,それに基づいてコミュニケーションを円滑化する技術について研究しています.

実施中のプロジェクトと最近の査読付き論文

総務省委託研究: 多言語音声翻訳技術の研究開発と社会実証

NICTは翻訳の性能向上を目指した各種研究開発を担当しています. 私自身は,翻訳品質推定,翻訳後編集,およびそれらの評価用データの構築,翻訳前編集などの研究を手がけています.

  • [Dabre & Fujita, 2019] AAAI. Recurrent Stacking of Layers for Compact Neural Machine Translation Models
  • [Imamura+, 2018] WNMT. Enhancement of Encoder and Attention Using Target Monolingual Corpora in Neural Machine Translation
  • [Marie & Fujita, 2018b] AMTA. A Smorgasbord of Features to Combine Phrase-Based and Neural Machine Translation

機械翻訳を含む多言語処理

同僚やインターン生と一緒に,様々な観点から多言語処理に関する研究を進めています. インターン経験者など,要望に応じて所属研究室外の方と連携することもあります.

  • [Marie & Fujita, 2019] NAACL-HLT. Unsupervised Extraction of Partial Translations for Neural Machine Translation
  • [Marie & Fujita, 2018a] ACM TALLIP. Phrase Table Induction Using Monolingual Data for Low-Resource Statistical Machine Translation
  • [Fujita & Isabelle, 2018] ACM TALLIP. Expanding Paraphrase Lexicons by Exploiting Generalities

科研費基盤(A): 翻訳知のアーカイヴ化と協調・学習促進型翻訳支援

東京大学の影浦峡先生が代表者の科研費プロジェクトです. 翻訳学習支援環境の開発の補助,蓄積した学習者のデータの分析を手がけています. 科研費の受給は2018年3月に終わりましたが,研究成果は続けて発表する予定です.

  • [大西ら, 2017] JAITS. 翻訳学習者が誤訳をする理由: MNT-TTの校閲カテゴリから見る学習者の訳出プロセスと学習効果
  • [宮田・藤田, 2017] JAITS. 機械翻訳向けプリエディットの有効性と多様性の調査