PDFの目次をコピーアンドペーストしたらぐちゃぐちゃになってしまって LibreOffice のプログラムで処理したという先日の話の続き。 実は、目次ではなく「しおり」を利用すれば良いのだった。 目次と言っているのは、ページに表示される目次。しおりとは ...
PythonでPDFのテキストを手っ取り早く抽出してCSV化する方法です。 tabulaモジュールを利用すると、簡単にできます。 Javaが必須 tabulaを利用するにはJavaが必須なので先にインストールしておく。 tabulaのインストール pipでtabulaをインストールします。Jupyter ...
現在アクセス不可の可能性がある結果が表示されています。
アクセス不可の結果を非表示にする