Anacondaでインストールできないパッケージをpipを使ってAnacondaで作った仮想環境にインストールした

結構うまくいったので書いておきます。Windows10の環境で行っています。

Anacondaで仮想環境を作ってJupyterNotebookを使っている。condaにないパッケージはpipでインストールすることになるのだが、これが結構気を使う。以前再インストールの経験がある。でも今回は簡単にできた。

PDFの中の表をエクセルに取り込みたい。tabulaを使うとできることが下に書いてあった。

bunkyudo.co.jp

ここにはpipでインストールすることが書いてある。Anacondaを立ち上げて、仮想環境にインストールしてみようかと思って、検索してみるとやっぱり出てこない。Anaconda環境にインストールしてあるpipを使ってインストールするしかない。そこで、

まず、Windows10のスタートボタンから、Anaconda Promptを起動

conda info -e

で、作ってある仮想環境を確認する。その中から、インストールしたい仮想環境を選んでアクティベート

conda activate 環境名 

で、仮想環境がアクティベートされる。(condaをつけなくて仮想環境には入れなかった。つまらないミスで引っかかった。)

conda list

とするとアクティベートした仮想環境にインストールしてあるパッケージが全部表示される。

tabulaをインストールするには

pip install tabula-py

で、2.2.0がインストールされた。

conda listで確かめてみるとしっかり入っている。

Anacondaを立ち上げて、Environmentsからインストールした仮想環境を選んで、インストールしてあるか探すと、ちゃんと「tabula-py」が入っていた。成功!

さっそく試しに使ってみる

import pandas as pd
import tabula

dfs = tabula.read_pdf("gaiyo.pdf", stream=True , pages = '8')
for df in dfs:

    display(df)

これだけ?と思ったが、やはり、最初は、Javaがインストールしてなくてエラーがどっと出た。でも、Javaをインストールすると、あっという間に表が出てきた。少し調整する必要があるが簡単だ。すばらしいPython