Advent Calendar 2013 - 10
Python で解析! - DataFrame 6
今回は DataFrame の join について。 join は merge のお手軽版といったところのようだ。インデックスがあって、カラムが重複していない場合には、merge よりもお手軽なので、使いやすいと思われる。
Advent Calendar 2013 - 9
Python で解析! - DataFrame 6
今回は DataFrame のマージについて。マージとは、二つのデータフレームを結合することで、SQL で言うところの join と同等のもので、数学的には集合演算とかベン図とか…を思い出してもらえればいいだろう。
Advent Calendar 2013 - 7
Python で解析! - matplotlib - 2
Notebook を使いたいところだが、ブログにコードを書くのにスクリーンショットでは都合が悪いので、ターミナルの ipython を使う。起動時に '--pylab=inline' を付けておくと、'show()' を実行しなくてもチャートが表示されて便利。
$ ipython --pylab=inline
Advent Calendar 2013 - 5
Python で解析! - DataFrame 3
今回は、任意の行を抽出する方法について。 SQL だと where で指定するフィルターのようなものかな。
Advent Calendar 2013 - 4
Python で解析! - matplotlib 1
せっかく matplotlib をインストールしたので、そろそろ活用してみる。なお、今回は、notebook も使ってみることにする。
Advent Calendar 2013 - 3
Python で解析! - DataFrame - 2
Pandas は CSV (カンマ区切り), TSV (タブ区切り), Excel ファイルなどを読みこんで、 DataFrame を作ることができる。
Advent Calendar 2013 - 2
Python で解析! - DataFrame - 1
環境構築はできたということで、 Pandas の中心となる DataFrame を取り上げる。
Advent Calendar 2013 - 1
Python で解析! - 環境構築
「Pythonista なら解析も python でやりたい!」
日本では、解析ツールというと R が一般的なようだが [1]、世界的には Python も標準的に使われているようだ。アドホックな解析なら R でかまわないのだが、Web システムの構築という観点からは、できれば Python を使いたいところ。
Python の方が動作が速いらしいし、Pandas と matplotlib と ipython を組み合わせれば、RStudio のような作業環境も作れるし…。という訳で、そのあたりのことを Advent Calendar のネタとして書いてみる次第。