Python環境 for 集合知プログラミング
※前サイトからの移行です.
常日頃からデータマイニングを勉強したいという方にはO’REILLYの「集合知プログラミング」をオススメしていた私ですが,色々あってこの本を参考書にデータマイニング勉強会を開くことになりました.
この本はPythonをベースとして書かれているのですが,勉強会向けにVPS上にPython環境 for 集合知プログラミングを構築しましたのでまとめます.
必要ライブラリのリストは,「付録A サードパーティによるライブラリたち」を参考にしました(導入にはpipを利用しています).
Python 2.7.x の導入
CentOS 6.3に2.7系を導入する(標準は2.6系).
インストールに必要なものたちを導入
1
|
|
Pythonをダウンロードして解凍
1 2 |
|
インストール
1 2 3 |
|
これでOK!
正常にインストールされているかどうかは以下のコマンドで確認できる.
1 2 |
|
ここでもし下記のメッセージ
1
|
|
が表示された場合は,.bashrcなどにLD_LIBRARY_PATH
を追加
1 2 |
|
Pythonパッケージ管理システムの導入
easy_installおよびpipを導入.
setuptoolsではなくdistributeから入れます.
1 2 3 |
|
必要ライブラリの導入
導入したライブラリ群は以下のコマンドで確かめられる.
1
|
|
A.1 Universal Feed Parser
1
|
|
A.2 PIL(Python Image Library)
1
|
|
A.3 Beautiful Soup
1
|
|
A4 pysqlite
1
|
|
※標準で入っているsqlite3でも良いと思います.
A.5 Numpy(ついでにScipy)
NumPyおよびSciPyを導入するために,以下の3つを導入
1 2 3 |
|
NumPyおよびSciPyのインストール
1 2 |
|
A.6 matplotlib
matplotlibを導入するために,以下を導入
1
|
|
matplotlibのインストール
1
|
|
A.7 pydelicious
1
|
|
以上で環境構築は終了(だと思われます)!