コロナショックの暴落から株など取引を始めた初心者です。 今は先物について勉強をしています。 投資活動日記は勉強なども含めて投稿しています。コロナショックである程度まとまった額購入しているので今は勉強が中心になりそうです。 先物・OPの ...
今回はOCR(PDFや画像データの文字認識)用ライブラリを紹介します。OCR用のサンプルデータは下記の通りです。 シンプルな読み込みはtabula.read_pdf(filepath, pages='all')とします。またfilepathにurlを指定すればweb経由で取得も可能です。 下記の通り戻り値はリスト ...
PDFを`Python`で解析するためのライブラリです。`pip`でインストールできます。 公式ドキュメントに`pdfminer`のチュートリアル ...