前記事では、家電についていた英語の取扱説明書を何とか簡単に日本語に訳せないものかと奮闘したことを書かせていただきました。
詳しいやり方は前記事をご覧ください。
ここでは、その方法を使って様々な言語で手書きされた文章を日本語でデジタル化した結果を紹介しています。
この記事の目次
英語で書かれた手書きの手紙の翻訳
以下は、共和党大統領のブッシュ氏が民主党大統領候補であったクリントン氏に選挙で大敗し、大統領職の退任を余儀なくされた際にオフィスに残していったものです。
今回はgoogleの誇るOCR能力と翻訳の実力を試していきたいと思います。この手描きの英文をどこまで正確に日本語まで変換できるでしょうか?まずやってみましょう。
まずはOCRから始めましょう。
前回取説を翻訳したやり方で同じようにやってみました手描きでも結構判断できるものですね。
画像をクリックで拡大
1月のJanのJが抜けていますね。あと、サインも抜けています。OCRはややこしいものはなかったことにするみたいですね。
次は翻訳です。
意味が少しわからないところもありますが、AIの翻訳は直訳として正しいのだと思います。
まあ文法がおかしかったり表現がおかしいのはAI変換にありがちな間違いでご愛敬ですね。
逆に、映画の翻訳などは意訳であり直訳でないぶん翻訳者の手腕が試される仕事だと思います。
ただOCRの能力に関してはほとんど間違いがないのですがところどころ書き手の癖が原因で誤字になっています。
最後の Good LuchはGood Luckの間違いでhとkは人間だったら最後に来るのはグッドラックだから無意識にそう読みますがgoogleのOCRはそこまでやってはくれません。
韓国語の画像文章をを翻訳してみる
次に韓国語に挑戦してみます。以下の手紙は解散した韓国の人気女性グループ2NE1のダラさんが解散してからの気持ちをインスタグラムで告白したものです。
2NE1
さて、まずOCRです。原文の文字の上手下手はわかりかねますが、全体のバランスとして文字の配置が散漫でgoogleドキュメントがどこまで認識できるか見ものですね。
結果が下の画像です。
翻訳してみなければさっぱりわかりませんね。では翻訳してみましょう。
画像をクリックで拡大
その国ならではの表現があり、それを直訳したものであろう文章も散見できます。しかし、言っている意味は十分に伝わってきますね。
AI翻訳されたものを読むには優しさと想像力が必要です。私なりに解釈してみましょう。
ブラックジャックに。(ブラックジャックは韓国の2NE1ファンクラブの名前らしいです)
このような手紙を書くことになるとは思いもしませんでした。
まず、私たちのファンの心を守れず傷つけてしまって申し訳ありません。
傷つけて申し訳ありません。
(あとは原文でなんとか通じるので省略しますが「アスィムとも申し訳なく」は「惜しくて申し訳ない」という意味のようです。)
韓国ではよく「ご飯をしっかり食べるように」という表現が挨拶に出てくるので「らしいな」と思います。
日本語の手書きで書かれた手紙をOCRしてみた。
日本語の手紙などを文字データにするシーンも結構あるのではないでしょうか。
手書きの案内書を編集して配布するなどというときに便利だと思います。
サンプルとしてこれも韓国のKARAを脱退したジヨンがブログに公開した日本のファンに向けた手紙です。
これでわかったのですがgoogleのOCRはややこしいところは飛ばすんだなということです。
まあ、手書きの文章を活字編集するには問題ないレベルです。
何より無料でしかもオンラインで使えるのはgoogleの素晴らしさではないでしょうか。
日本語の手紙を探していてひとつ気が付いたことがあります。
韓国のアイドル、男性女性を問わず日本語をしっかり勉強しているなと感心しました。
私はあまりKPOPは好きではないのですが、彼らのプロ魂には感心させられました。
「日本語の手紙」で検索すると韓国アイドルの手紙がゴロゴロ出てきます。
日本で儲けるのだから当然だという人もいるでしょう。
しかしテレビで見る韓国アイドルグループは普通に日本語をしゃべっているのをすごいと感じたことはありませんか?
韓国の芸能事情だと思われますが韓国は人口が日本の半分なので内需では限界があるのです。
世界に向けて進出しようという意気込みが感じられます。
思わず韓国の芸能事情の話になってしまいましたが、とにかくgoogleのOCRと翻訳は便利で使えるということをお知らせしました。