Google翻訳の精度をあげるアイデア【アプリローカライズへの道】


画像の拡大

AIやディープラーニングが騒がれるご時世。以前よりはGoogle翻訳の精度もだいぶ上がってきた。しかし、アプリの紹介ページを完全に任せられるほどの精度ではない。そこである本を読んでいて思いついたのだが、言語系統に分けて翻訳してみてはどうだろうか。たとえば、ゲルマン系言語や、ラテン系言語といったように。

はじめに

今回「中学校の地理が1冊でしっかりわかる本」という本を参考にしました。中学生と言っても侮ることはできません。かなり密度が高く、とても分かりやすい内容でした。

ヨーロッパはインド・ヨーロッパ語族

同じ語族から派生したとされる言語の集まりを語族と言うそうである。ヨーロッパはインド・ヨーロッパ語族になるのだが、そのなかで、とくに多いのがゲルマン系言語、ラテン系言語、スラブ系言語だ。


画像の拡大

ゲルマン系言語には、英語、ドイツ語、オランダ語、デンマーク語、ノルウェー語、スウェーデン語、アイスランド語などがある。ラテン系言語は、フランス語、イタリア語、スペイン語、ポルトガル語、ルーマニア語などがある。そしてスラブ系言語には、ロシア語、ウクライナ語、ポーランド語、チェコ語、スロバキア語、ブルガリア語などがある。

Google翻訳の精度を上げる

つまりGoogle翻訳するときに、これらの言語系統区分を利用する。ドイツ語に翻訳したいのなら日本語を直接翻訳するのではなくて、いったん英語の文章にしてから翻訳できれば精度は高くなりそうだ。また、イタリア語に翻訳したいのなら、日本語や英語から翻訳するのではなく、いったんフランス語にしてから翻訳すれば精度が高まるのではないだろうか。

つまり、代表的な英語やフランス語のみにお金をかけてその他の同種の言語をGoogle翻訳で間に合わせることにより、翻訳コストをぐんと下げることができるはず。もちろん、きめ細かいローカライズには不十分だろうが、試験的なものであれば十分スタート可能となる。

ところで先ほどの言語の分布図は、宗教の分布図とそっくりだ。プロテスタント→ゲルマン系、カトリック→ラテン系、東方正教会→スラブ系


画像の拡大

記事に関するご質問などがあればTwitterへお返事ください。
この記事で紹介した商品
人気のスマホ
関連記事