藤田 篤 (ふじた あつし)

ことばについて研究しています

研究分野:
計算言語学,自然言語処理,知能情報学
研究トピック:
自然言語表現の言い換え翻訳 (機械翻訳,人間の翻訳)その他
関心のあること:
機械学習,データマイニング,教育方法論,言語運用支援など

言語は,計算機が発明される以前から情報の伝達・蓄積やコミュニケーションにおける最も中心的な役割を担ってきました. 近年では,Webと各種電子機器を介した情報発信・受信やコミュニケーションが一般的になり,その中でも,電子メール,ブログ,ソーシャルメディアなど,電子化されたテキストを通じたコミュニケーションの機会が一層増えています. 我々は,自然言語に備わっている様々な特徴や人間の言語の運用メカニズムの解明を目指し,自然言語を計算機で扱うための各種要素技術と,それに基づいてコミュニケーションを円滑化する技術について研究しています.

実施中のプロジェクトと最近の発表論文等

機械翻訳を中心とする多言語処理

同僚インターンと一緒に,様々な観点から多言語処理に関する研究を進めています. インターン経験者など,所属研究室外の方と連携することもあります.

  • [Rubino+, 2021] Eval4NLP. Error Identification for Machine Translation with Metric Embedding and Attention. (Best Overall Approach Award)
  • [Dabre & Fujita, 2021] MT Summit. Investigating Softmax Tempering for Training Neural Machine Translation Models.
  • [Marie+, 2021] ACL-IJCNLP. Scientific Credibility of Machine Translation Research: A Meta-Evaluation of 769 Papers. (Outstanding Paper Award)
  • [Rubino+, 2020] MT Journal. Extremely Low-Resource Neural Machine Translation for Asian Languages.
  • [Dabre & Fujita, 2020] WMT. Combining Sequence Distillation and Transfer Learning for Efficient Low-Resource Neural Machine Translation Models.
  • [Marie & Fujita, 2020] TACL. Synthesizing Parallel Data of User-Generated Texts with Zero-Shot Neural Machine Translation.

科研費基盤研究(S): 翻訳プロセス・モデルと統合環境の構築

影浦峡先生が代表者の『翻訳規範とコンピテンスの可操作化を通した翻訳プロセス・モデルと統合環境の構築』という科研費プロジェクトを一緒に進めています. これまで非常に粗い粒度で,かつ翻訳プロセスと関連付けない形でしか語られてこなかった翻訳規範および翻訳に必要なコンピテンスを細粒度で陽に記述,体系化するとともに,それらを翻訳プロセスと関連付けて操作できるようにします. これを通じて理論の精緻化,教育(=技能継承)基盤の確立,有用な技術の実現,さらには,それらを統合した翻訳支援環境を開発し,産業翻訳における品質要求に応じたプロセス管理,さらには社会における翻訳リテラシの涵養への貢献を目指します.

  • [Yamamoto+, 2021] IATIS. Designing a Metalanguage of Translation Strategies for Translation Training: Demystifying the Art of Translation.
  • [Fujita, 2021] MT Summit. Attainable Text-to-Text Machine Translation vs. Translation: Issues Beyond Linguistic Processing.
  • [Miyata & Fujita, 2021] EACL. Understanding Pre-Editing for Black-Box Neural Machine Translation.