Google翻訳の精度をあげるアイデア【アプリローカライズへの道】

AIやディープラーニングが騒がれるご時世。以前よりはGoogle翻訳の精度もだいぶ上がってきた。しかし、アプリの紹介ページを完全に任せられるほどの精度ではない。そこである本を読んでいて思いついたのだが、言語系統に分けて翻訳してみてはどうだろうか。たとえば、ゲルマン系言語や、ラテン系言語といったように。

ヨーロッパはインド・ヨーロッパ語族

同じ語族から派生したとされる言語の集まりを語族と言うそうである。ヨーロッパはインド・ヨーロッパ語族になるのだが、そのなかで、とくに多いのがゲルマン系言語、ラテン系言語、スラブ系言語だ。


画像の拡大

ゲルマン系言語には、英語、ドイツ語、オランダ語、デンマーク語、ノルウェー語、スウェーデン語、アイスランド語などがある。ラテン系言語は、フランス語、イタリア語、スペイン語、ポルトガル語、ルーマニア語などがある。そしてスラブ系言語には、ロシア語、ウクライナ語、ポーランド語、チェコ語、スロバキア語、ブルガリア語などがある。

Google翻訳の精度を上げる

つまりGoogle翻訳するときに、これらの言語系統区分を利用する。ドイツ語に翻訳したいのなら日本語を直接翻訳するのではなくて、いったん英語の文章にしてから翻訳できれば精度は高くなりそうだ。また、イタリア語に翻訳したいのなら、日本語や英語から翻訳するのではなく、いったんフランス語にしてから翻訳すれば精度が高まるのではないだろうか。

つまり、代表的な英語やフランス語のみにお金をかけてその他の同種の言語をGoogle翻訳で間に合わせることにより、翻訳コストをぐんと下げることができるはず。もちろん、きめ細かいローカライズには不十分だろうが、試験的なものであれば十分スタート可能となる。

ところで先ほどの言語の分布図は、宗教の分布図とそっくりだ。プロテスタント→ゲルマン系、カトリック→ラテン系、東方正教会→スラブ系


画像の拡大

参考書籍

今回参考にしたのは「中学校の地理が1冊でしっかりわかる本」。中学生と言っても侮ることはできない。かなり密度が高くとても分かりやすい内容となっていた。

中学校の地理が1冊でしっかりわかる本
中学校の地理が1冊でしっかりわかる本

「北海道より北なのに、ロンドンが暖かいのはなぜ?」「インドでIT産業が発達した理由は?」「アメリカがある場所は、日本の“東"じゃない?」地理を知れば、日本と世界が見えてくる!

KindleAmazon

Amazonでお得に購入するなら、Amazonギフト券がオススメ!

\Amazonギフトがお得/

コンビニ・ATM・ネットバンキングで¥5,000以上チャージすると、プライム会員は最大2.5%ポイント、通常会員は最大2%ポイントがもらえます!
Amazonギフト券

\この記事をシェアする/