Anacondaでインストールできないパッケージをpipを使ってAnacondaで作った仮想環境にインストールした
結構うまくいったので書いておきます。Windows10の環境で行っています。
Anacondaで仮想環境を作ってJupyterNotebookを使っている。condaにないパッケージはpipでインストールすることになるのだが、これが結構気を使う。以前再インストールの経験がある。でも今回は簡単にできた。
PDFの中の表をエクセルに取り込みたい。tabulaを使うとできることが下に書いてあった。
ここにはpipでインストールすることが書いてある。Anacondaを立ち上げて、仮想環境にインストールしてみようかと思って、検索してみるとやっぱり出てこない。Anaconda環境にインストールしてあるpipを使ってインストールするしかない。そこで、
まず、Windows10のスタートボタンから、Anaconda Promptを起動
conda info -e
で、作ってある仮想環境を確認する。その中から、インストールしたい仮想環境を選んでアクティベート
conda activate 環境名
で、仮想環境がアクティベートされる。(condaをつけなくて仮想環境には入れなかった。つまらないミスで引っかかった。)
conda list
とするとアクティベートした仮想環境にインストールしてあるパッケージが全部表示される。
tabulaをインストールするには
pip install tabula-py
で、2.2.0がインストールされた。
conda listで確かめてみるとしっかり入っている。
Anacondaを立ち上げて、Environmentsからインストールした仮想環境を選んで、インストールしてあるか探すと、ちゃんと「tabula-py」が入っていた。成功!
さっそく試しに使ってみる
import pandas as pd
import tabula
dfs = tabula.read_pdf("gaiyo.pdf", stream=True , pages = '8')
for df in dfs:
display(df)
これだけ?と思ったが、やはり、最初は、Javaがインストールしてなくてエラーがどっと出た。でも、Javaをインストールすると、あっという間に表が出てきた。少し調整する必要があるが簡単だ。すばらしいPython!