↧
scikit-learnメモ:サンプルデータセットの読み込み方
機械学習を使うための処理の書き方を勉強する上でお世話になるのがサンプルデータセットですが,scikit-learnはRとは読み込み方が異なって面倒くさかったため,メモしておきます。iris データセット定番のirisデータを例にしてみます。Rだとdata(iris)あるいは単にirisで済みますが,sklearnでは以下のように書きます。from sklearn import datasets...
View Article[Python]予測モデル作成の一連の流れのメモ
Pythonで予測モデルを作るときの大まかな流れの雛形みたいなやつ(自己流なので正しいかはわかりませんが…)をメモしていきます。1. データの読み込みと確認データの確認データ間の関係を確認データの可視化(単変量)データの可視化(多変量)相関行列・ヒートマップ等グラフ2. 前処理ドメイン知識の収集・整理特徴量エンジニアリングデータのクリーニングデータの分割3....
View Articlescikit-learn Pipelineの基本の使い方
個人的に業務ではよく使うのでもっと多くの人に認知されてほしいという想いを込めてメモPipelineとはscikit-learnにはPipelineというclassがある。これは複数の前処理用クラスと予測モデルをまとめて一つのオブジェクトにすることができるもの。例えば、StandardScalerで特徴量の標準化を行って線形回帰で学習/予測を行う場合、Pipelineを使わない場合は以下のようにSta...
View Article