スキャンしたPDFをExcel(.xlsx)形式に変換したいと考えたことはありませんか?
スキャナーでPDF化した書類から文字を取り出そうという試みを、時々端折りながら、最初から最後までその経緯をダラダラと書いた記事でございます。 溜め込んだ書類をドキュメントスキャナーでPDF化した。 さて、ファイル名をどうしようか。 書類の内容 ...
ペーパーレス化やDX(デジタルトランスフォーメーション)が進む現代において、紙書類を効率よくデータ化する技術として OCR(光学文字認識) が広く利用されています。 近年では、従来のOCRを進化させた AI OCR ...
ドキュメント理解に特化したマルチモーダルOCRモデル「GLM-OCR」を中国のAI企業であるZ.aiが公開しました。GLM-OCRは0.9B(9億)という極めて軽量なパラメータ数でありながら、複雑なドキュメントレイアウトを高精度に解析・抽出することを ...
紙の書類をスキャンして電子化するときに、テキストや数字を読み取ってデータを抽出する技術がOCR(Optical Character Recognition、光学式文字認識)だ。さまざまな種類の書類が電子保存されるようになったことで、その活用範囲は広がっている。特に経理部門 ...
製品が160カ国以上の個人や企業に利用されているソフト開発会社Cisdemは令和7年3月3日(月)より、PDF変換ソフトPDF Converter OCR(Mac版)の最新バージョンをリリースしました。この新バージョンでは、特別なリンクを含んだPDFによるクラッシュを修正し ...
ソフト開発会社Cisdemは令和7年6月26日(木)より、Cisdem PDF Converter OCRの最新バージョンを発表しました。 ★Cisdem PDF Converter ...
株式会社Kdan Japan(日本本社:東京都千代田区、代表取締役社長:ケニー・スー、以下 Kdan)が提供する、ドキュメントの編集・管理など生産性を向上させるPDFアプリ「PDF Reader」が、Windows版にOCR機能を追加しました。従来のOCR機能とは異なり、ソフトウェア ...
AI開発企業のMistral AIが、画像に含まれるテキストを認識してテキストデータに変換できるAIモデル「Mistral OCR」を発表しました。Mistral OCRはLaTeXで書かれた複雑な数式も認識できるのに加え、文書に含まれる図や表の位置関係を崩さずマークダウン形式で出力 ...