AIを用いて写真からテキストデータを抽出できる軽量ツール「NDLOCR-Lite」が2月24日、国会図書館の実験的なサービスを提供する「NDLラボ」の公式「GitHub」サイトで公開された。ライセンスは「CC BY 4.0」で、ソースコードも公開済み。適切なクレジット表示さえあれば商用を含め自由に利用できる。
This repository contains instructions to get 2 stages of OCR detector from edge impulse for your target platform, as well as a python script that runs both models and displays the result on the screen ...
Tesseract OCRの「easyocr」というライブラリを用いて、画像(PNG形式)の文字抽出を今回はやっていく知識のシェアです。 最近MENTAで学んだことをとりまとめました。 今回のテーマ ①コマンドプロンプトやVSCODEでの設定方法 ②画像から文字抽出して、ExcelのCSV ...
OCRはどんな時に役立つの? みなさんは「画像の中の文字をテキスト化したい」と思ったことはありませんか? • PDFやスクリーンショットから文字をコピーしたい • レシートや領収書を自動でデータ化したい • ホワイトボードに書いた内容を文字として ...
This is a python-replacement of the previous Tika-service in an attempt to resolve scalability and performance issues. It also relies on tesseract ocr but without the ambiguities of the Tika framework ...
古典籍資料の写真からテキストデータを抽出できるツール「NDL古典籍OCR-Lite」が11月26日、国会図書館の実験的なサービスを提供する「NDLラボ」の公式「GitHub」サイトで公開された。