« 陽炎と新幹線と舞雪 | トップページ | KISS 2011年4月日本公演用のポスターを公開 »

2011年3月 2日 (水)

Google DocsのOCR機能が日本語に対応

Googleは昨年の6月にGoogle DocsにOCRの機能を加えていました。この機能は英語にしか対応していませんでしたが、Googleは2月28日に29カ国の言語に対応することを発表しました。もちろん、日本語にも対応しています。なお、日本語は左から右への横書きのみ対応で、縦書きに対応していません。

このOCR機能はGoogle DocsにPDFや画像データ(jpg、gif、png)をアップロードするときに使うことができます。

変換可能なファイルのサイズの上限は2メガバイトです。

さっそく、実際にやってみました。

Google Docsへのファイルのアップロードは次の図の[アップロード]ボタンをクリックします。

Googleocr

[アップロード]をクリックすると、次のようになりますので、アップロードするファイルを選び

□PDFや画像ファイルからテキストをGooleドキュメント・・・

にチェックを入れて、[アップロード]開始ボタンをクリックします。

Googledoc2

ワードなどのソフトウェアからPDFに変換したものでは、かなり精度良くテキスト変換してくれます。

しかし、画像ファイルだといまいちです。

たとえば、次の画像データのOCRを変換してみたところ

2211

次のような読み取り結果になりました。

イオから地域に光がやってくる時間は 登呂よ り含油の方が長く なるo 船.の胆 離の分だけ時刻かすれるo

PDFファイルに関して言えば、無料で利用できるOCR機能としては、十分に使えます。今後のOCRの性能が向上を期待したいと思います。

人気ブログランキングへ

|

« 陽炎と新幹線と舞雪 | トップページ | KISS 2011年4月日本公演用のポスターを公開 »

パソコン・インターネット」カテゴリの記事

コメント

コメントを書く



(ウェブ上には掲載しません)




トラックバック

この記事のトラックバックURL:
http://app.cocolog-nifty.com/t/trackback/203483/51010543

この記事へのトラックバック一覧です: Google DocsのOCR機能が日本語に対応:

« 陽炎と新幹線と舞雪 | トップページ | KISS 2011年4月日本公演用のポスターを公開 »