Skip to content

kabetani-yusei/mufg2024basic

Repository files navigation

mufg 2024 1位解法

すべてGoogle Colabで実行し、提出ファイルと同じファイルが作成できることを確認済みです。

1. 欠損値補完

purpose フォルダー内で、purpose の欠損値を補完したCSVファイルを作成します。

  • ./purpose/ フォルダーにある purposeの欠損値補完1.ipynb から purposeの欠損値補完5.ipynb までを順次実行し、以下のファイルをダウンロードしてください。

    • notebook1_test.csv
    • notebook1_train.csv
  • 各ノートブックで traintest 用のファイルが出力されるため、計10個のCSVファイルが得られます。

これらのファイルを、purposeの欠損値補完(アンサンブル).ipynb と同じパスに置いてください。その後、purposeの欠損値補完(アンサンブル).ipynb を実行することで、purpose が補完された以下の2つのファイルが生成されます。

  • completed_train.csv
  • completed_test.csv

2. 学習 (欠損値あり: 2, 4, 7)

./学習/ ディレクトリ内にある 欠損値あり2.ipynb欠損値あり4.ipynb欠損値あり7.ipynb を実行して、予測値を算出します。

注意: seed 値は固定しましたが、random_state を固定し忘れたため、モデルを読み込む必要があります。実行ファイルと同じパスに以下のモデルファイルを置いてください。

  • 欠損値あり2_0.pkl から 欠損値あり2_9.pkl

これらを実行することで、各ノートブックで traintest の2つのファイルが出力されるため、計6個のCSVファイルが得られます。

3. 学習 (欠損値なし: 2, 3, 4)

./学習/ ディレクトリ内にある 欠損値なし2.ipynb欠損値なし3.ipynb欠損値なし4.ipynb を実行して予測値を算出します。

注意: これらのノートブックでは、1で作成した completed_train.csvcompleted_test.csv を読み込みます。

これらを実行することで、計6個のCSVファイルが得られます。

4. アンサンブル

2と3で出力された合計12個のCSVファイルを、アンサンブル用のノートブックと同じパスに置いてください。その後、アンサンブル.ipynb を実行します。

出力として3つのファイルが生成され、そのうち last_submissionfile.csv が、コンペで最終的に選択した提出ファイルです。

About

MUFG Data ScienceBasic Camp 2024

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published