Google ドキュメントを OCR ツールとして使う

人気ブログランキング

この前、PDFをGoogle ドキュメントで開いたら、中にある画像の文字がテキストとなっていたので、
ただの画像をGoogle ドキュメントで開いてみると、テキスト化されるのを発見した。

やり方は、
1.Googleドライブに画像をアップロード
2.画像を右クリック、「アプリで開く」から「Google ドキュメント」を選択
これで終わり。
ネットで調べると裏技でも何でも無いようだけど。

他の無料OCRツールの精度が低くて使えないと思っていたら、Google ドキュメントの精度の高い事にビックリ。
使った中では最高です。

ということで、ちょっとしたお試しをしてみた。
歴代アメリカ大統領の署名をどこまで解読できるか?
Business Insiderに全44名の署名があったのでそれを使いました。

一人ずつやろうと思ったら出来ず。
文字数が少ないとテキスト化してくれない模様。
そのため、11個ずつ画像を連結してから実行した(画像連結は「フォトコンバイン」というオンラインサービスを使った)。

結果は以下の通り。
(日本人だからなのか、John Adamsしか読めん。)

完璧


2代 John Adams
02_John_Adams.jpg
10代 John Tyler
10_John_Tyler.jpg
12代 Zachary Taylor
12_Zachary_Taylor.jpg
16代 Abraham Lincoln
16_Abraham_Lincoln.jpg
20代 James. A Garfield
20_James_A_Garfield.jpg

惜しい


39代 Ronald Reagan ⇒ Romald Reagan
39_Ronald_Reagan.jpg

文字として認識してくれない署名の代表


44代 Donald Trump
44_Donald_Trump.jpg

試しに、伊藤博文の手紙でやってみると、さすがに無理でした。
私が読んでも「ビスマルク」しか解読できない。
アメリカのサービスであるのと、アルファベットは文字数が少ないことから、英語の精度は高いのでしょう。


この記事へのコメント