すべてGoogle Colabで実行し、提出ファイルと同じファイルが作成できることを確認済みです。
purpose
フォルダー内で、purpose
の欠損値を補完したCSVファイルを作成します。
-
./purpose/
フォルダーにあるpurposeの欠損値補完1.ipynb
からpurposeの欠損値補完5.ipynb
までを順次実行し、以下のファイルをダウンロードしてください。notebook1_test.csv
notebook1_train.csv
-
各ノートブックで
train
とtest
用のファイルが出力されるため、計10個のCSVファイルが得られます。
これらのファイルを、purposeの欠損値補完(アンサンブル).ipynb
と同じパスに置いてください。その後、purposeの欠損値補完(アンサンブル).ipynb
を実行することで、purpose
が補完された以下の2つのファイルが生成されます。
completed_train.csv
completed_test.csv
./学習/
ディレクトリ内にある 欠損値あり2.ipynb
、欠損値あり4.ipynb
、欠損値あり7.ipynb
を実行して、予測値を算出します。
注意: seed
値は固定しましたが、random_state
を固定し忘れたため、モデルを読み込む必要があります。実行ファイルと同じパスに以下のモデルファイルを置いてください。
欠損値あり2_0.pkl
から欠損値あり2_9.pkl
これらを実行することで、各ノートブックで train
と test
の2つのファイルが出力されるため、計6個のCSVファイルが得られます。
./学習/
ディレクトリ内にある 欠損値なし2.ipynb
、欠損値なし3.ipynb
、欠損値なし4.ipynb
を実行して予測値を算出します。
注意: これらのノートブックでは、1で作成した completed_train.csv
と completed_test.csv
を読み込みます。
これらを実行することで、計6個のCSVファイルが得られます。
2と3で出力された合計12個のCSVファイルを、アンサンブル用のノートブックと同じパスに置いてください。その後、アンサンブル.ipynb
を実行します。
出力として3つのファイルが生成され、そのうち last_submissionfile.csv
が、コンペで最終的に選択した提出ファイルです。