Python データサイエンス講座 vol.6
〜〜〜〜〜〜〜〜〜〜〜〜
レクチャー29「データのマージ」
レクチャー30「indexを使ったマージ」
レクチャー31「データの連結」
レクチャー32「DataFrameを組み合わせる」
→pd.mergeやnp.concatenate、pd.concatなどのメソッドを使って、ArrayやSeries、DataFrameなどの2つのデータを組み合わせる方法を学んだ。
レクチャー33「SeriesとDataFrameの変換」
→stackというメソッドを使ってDataFrameをSeriesに、unstackでSeriesをDataFrameに変換する方法を学んだ。
レクチャー34「ピボットテーブルの作り方」
→DataFrame内のデータを、dframe.pivotというメソッドを使って集計するやり方を学んだ。
レクチャー35「重複したデータの処理」
→DataFrame内の重複したデータを、dframe.drop_duplicateというメソッドを使って削除する方法を学んだ。
レクチャー36「マッピングを使った列の追加」
→DataFrameにmapというメソッドを使って列を追加する方法を学んだ。
レクチャー37「置換」
→Series内のデータを、replaceというメソッドを使って別の数値に置き換える方法を学んだ。
レクチャー38「indexの変更」
→DataFrame内のindex(各行のタイトル)を、renameというメソッドをstr.lowerやstr.letterなどと一緒に使って変更する方法を学んだ。
レクチャー39「ビニング(Binning)」
→任意のデータを、pd.cutというメソッドを使ってカテゴリー分けする方法を学んだ。
レクチャー40「外れ値」
→DataFrame内の数値から、ある特定の要素を取り出す方法を学んだ。例えば、100行4列のDataFrameにランダムな数値があって、100×4=4000個の数値の中から3より大きい数値はどの行と列にあるのかを判別する方法など。
レクチャー41「Permutation」
→Permutationの日本語訳は順列。任意のDataFrameやArray内の数値の順列をランダムに並び替える方法を学んだ。これは何らかのシュミレーションにおいて、ランダムな数値がほしい時に使える模様。
〜〜〜〜〜〜〜〜〜〜〜
最近いいペースで進んでいるんではなかろうか。この調子で続けていきたい。