翻訳メモリとフランシール

2020年8月21日

先日の定例会でMemoQの方に講義してもらいましたが、今回はその翻訳メモリ(または翻訳支援ツール、CAT)について。翻訳メモリは以前はTRADOSが主流でしたが、最近ではMemsourceやMemoQなど新しいソフトも出てきています。翻訳メモリと機械翻訳は良く混同されますが、実は違うもので、翻訳メモリは自動的に訳してくれるわけではなく、まずは類似の対訳データをインプットする必要があります。

例えば
■私はりんごは好きだけど、オレンジは嫌いです。
(I like apples but I don’t like oranges.)
という対訳データがあります。
次に、
■私はりんごは好きだけど、なしは嫌いです。
という文章が出てきた場合、違うところは「オレンジ」と「なし」だけ。
翻訳メモリは「メモリにある文章と90%同じです」と教えてくれる、そんな感じが翻訳メモリです。
「I like apples but I don’t like (X) oranges.(90%)のように
違うところにマークがでてきて、「ここだけ変えたらその翻訳ができるますよ。」と教えてくれます。

そして、I like apples but I don’t like pears. とインプットしておけば、これがまた対訳メモリとしてデータ化され、次に「私はりんごは好きだけど、なしは嫌いです。」という文章がえてきたら「100%一致しています。翻訳する必要ありません。」と教えてくれるのです。

「あれ、似たような文章、さっきなかったっけー?」という記憶力が少ない人はこの機能がないと「I like apples, but I dislike pears.」など、意味的にはあってるけれど、違う文章を作ってしまうかもしれない、それを避けるためのソフトです。特にマニュアルなどで「右ボタンを押す」と書いたのに次のページでは「右ボタンを押してください。」と書いたりすると全体の統一感がとれないので大変重宝します。

これに対して、機械翻訳は予め決まった対訳データがあるわけではなく、
「私は」「I」
「りんごが好きです。」「like apples」
と置き換えていくものです。間違えませんが、出来上がった翻訳もどこか不自然でした。

しかし2016年、それまで機械翻訳らしく、不自然な翻訳をしていたGOOGLEがニューラル翻訳を開始しました。世界中の対訳集をかき集めて、AIに読み込ませ、文章を前からだけでなく、後ろからも分析して類似のコーパスを見つけてくる翻訳方法に代わりました(そうやってぐねぐね分析して翻訳するのでニューラル(神経)翻訳と呼ばれています)。出来上がる文章もかなり自然になりました。社内のアメリカ人コーディネータが「うわ!全然違う!」とびっくりしていたのを覚えています。(我々の仕事は終わったのか、とみんな青くもなりました。)

その後上記の翻訳メモリにもそういったAI翻訳機能を搭載することが可能になりました。つまり、対訳コーパスが用意されていなかったら翻訳できなかった翻訳メモリも、今ではゼロからの翻訳でもAI(機械)翻訳が訳文を提案をしてくれる、ということです。

私が学生のころは翻訳家といえば着物で机に向かって万年筆をもって苦悩する、文学者風情のイメージがありました。しかしその後翻訳会社に入り、商業翻訳が「1文字10円」などの内職のような仕事であることに驚き、その厳しさを痛感しました。
そして今、AI翻訳や様々なソフト連携の説明書からみる翻訳フローは、工学部のテキストのようです。商業翻訳はとうとう翻訳工学になりつつあります。

ただ、フランシールが取り扱う翻訳は、翻訳メモリの機能も単語レベルでしか使えない(調査報告書など案件特有の)翻訳や役所から発出される紙ベースの翻訳などのオートクチュール的なものがまだまだ多く、会社もいまだ翻訳工房的な雰囲気です。でも周囲を見渡すと翻訳は翻訳工場で大量生産されつつあり、今日の翻訳はまるでファストファッション。今後は圧倒されないよう奮闘しつつ、いかにAIと協働していくか考える必要があるのかなと思っています。

個人的には早くドラえもんのような優しいAIロボットが現れて、「ねえこの汚いスキャンデータをきれいなワードに訳して」とか「お客の書いてる日本語の意味がわからないから聞いてきて」とか「この名前、なんて読むのか確認お願い!」など、あらゆる要望に応対してくれないかなと思っています。・・・いや、待てよ。よく考えたらその逆で、私たちがAIにそれらの細かい仕事を頼まれる可能性のほうが高いかもしれません。将来私たちはロボットにお茶出しとかしているかもしれませんね!(鍋)

今日のワード
■翻訳支援ツール
英語: computer-assisted translation (CAT) tools
フランス語 : outil d’aide à la traduction
スペイン語 : herramientas de TAC
ロシア語 :Средства автоматизированного перевода
中国語:计算机辅助翻译 または 电脑辅助翻译

■翻訳メモリ(TM)
英語:translation memory (TM)
フランス語 : mémoire de traduction
スペイン語 : memoria de traducción (MT)
ロシア語 :Память переводов
中国語:翻译记忆(库)

■ニューラル機械翻訳
英語: neural machine translation
フランス語 : traduction automatique neuronale
スペイン語 : traducción automática neuronal (NMT)
ロシア語 :Нейронный машинный перевод
中国語:神经机器翻译

■翻訳API(Application Programming Interface)
(最近増えてきた、WEBサイトやアプリを丸ごと翻訳してくれるサービス。
対訳データを預け、AI翻訳を自分好みに大量に作ってくれるサービスです。月額いくら、といった形で契約すると決まったワード数まで翻訳してくれるものが多いようです。)
英語:
translation API (application programming interface)
フランス語 :
API (interface de programmation d’application, 又は interface de programmation applicative)
スペイン語 :
API (Interfaz de Programación de Aplicaciones) de traducción
ロシア語 :
API (программный интерфейс) для машинного перевода
中国語:翻译应用程序接口

<<
>>

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です


カテゴリー

月別アーカイブ

お気軽にご相談ください。 無料お見積
翻訳者・通訳者を募集しています。
翻訳者・通訳者募集
お気軽にお問い合わせください。
お問合せ
サイト内検索
フランシールプライバシーマーク 株式会社フランシールは、プライバシーマークを取得し個人情報保護に努めております。


「金融・経済・法務」分野(日英)
「工業・科学技術」分野(日英)

フランシール公式チャンネル
スペイン語表現対決!
スペイン語の電話の仕方
フランシール・スタッフブログ
<MemoQマニュアル>ユーザー登録の方法(翻訳コーディネーター)
めじろ奇譚
めざせ語学マイスター
SDGs-持続可能な開発目標-
モンゴル語とロシア語の違い、なぜモンゴルではキリル文字を使う?

月別アーカイブ