Googleドキュメントを利用して文字が入った画像を読み取ってみよう(OCR機能の活用)

みなさん、「Googleドキュメント」って使っていますか?
Googleが提供しているブラウザ上で動く「マイクロソフトWord」といった感じですが、Wordの代わりとして利用している方もたくさんいるのではないかと思います。なんと言っても無料で利用できますからね!
そのままワープロアプリとして利用しても、とても優秀で便利なツールなんですが、今回はGoogleドキュメントのOCR機能について取り上げてみたいと思います。
OCR機能とは?
OCR(Optical Character Recognition): 光学文字認識
OCRとは、手書きの文字や印刷された文字を読み取り、データと照らし合わせ文字を判断し、電子テキスト化する装置のこと。画像をスキャナで読み取り、文字を識別して文書にするソフトもある。
最近では、家計簿アプリの機能として「レシート読み取り機能」がありますが、これもOCRの技術を使った便利機能ですね。
このOCR機能がGoogleドキュメントとどう繋がるのか、確認してみましょう。
GoogleドキュメントのOCR機能を使う
ホワイトボードの内容をカメラで撮影する
今回は、ホワイトボードに書かれた内容をGoogleドキュメントのOCR機能を利用して文字に変換してみましょう。
まずは、ホワイトボードに書かれた文字をカメラで撮影してみます。
(下手くそな字ですみません…)
画像データをGoogleドライブにアップロードする
さっき撮影したホワイトボードの画像データを、Googleドライブにアップロードします。この時点ではまだ画像データ(今回はPNGファイル)としてアップされています。
Googleドキュメントで画像データを開く
Googleドライブ上で先ほどの画像データを右クリックします。
「アプリで開く」―「Googleドキュメント」で画像データをGoogleドキュメントで開いてみます。
Googleドキュメントとして開くまで少し時間がかかりますが、ゆっくり待ちましょう。GoogleドキュメントがOCR機能で画像から文字に変換しています。
さて、先ほどの画像データがどのようになったのでしょうか。
「あー、、惜しいですね」
「しすたま」が「しすたき」になってしまいました。でもこれは、私の書いた字が悪かったですね。「き」に見えなくもないです・・・
カッコやエクスクラメーションも上手く変換できませんでしたが、それ以外は正確に読み取ることができました。
手書きの文字だと、どうしても読み取り精度が落ちてしまうかと思いますが、本の内容などを撮影したデータであれば、もっと正確に変換してくれますよ。
まとめ
今回はGoogleドキュメントのOCR機能について確認してみました。今回のケースみたいな文字数であれば、あまりOCR機能のメリットが享受できないとは思いますが、もっとたくさんの文字数の場合であれば、多少の変換ミスがあったとしても大きなメリットを感じることができるのではないでしょうか。
GoogleはAIを活用した画像認識技術に多額の投資をしているので、今後ますます精度は上がっていくものと思われます。
ちなみに、画像ファイルだけではなく、PDFファイルも変換してくれるので是非お試しください。
ではでは!
ディスカッション
コメント一覧
まだ、コメントがありません