- batch.evaluate_model -> modelの評価
- batch.make_data -> trainデータ作成
- batch.make_model -> model作成 & local(docker container)へ保存
- batch.upload_model -> GCSへmodelアップロード
- batch.download_model -> GCSからmodelダウンロード
- api.load_model & predict -> 推論api起動
*作成済みモデル使用する際は4から実行
*0,1,3,4実行時は引数に日付を指定(e.g. 2022-10-26)
*0~3は日付を統一(データセットの作成日)
/tmp/data/data.txt -> local data (batch.make_modelで使用)
/train.txt -> local train data (batch.evaluate_modelで使用)
/valid.txt -> local valid data (batch.evaluate_modelで使用)
/model/ft_model.bin -> local model (apiで使用)
/log
/app/ft_api.py -> api実行用
/ft_batch.py -> batch実行用
/util/* -> util系
/model/ftmodel.py -> fasttext用
/resources
/.env -> 環境変数ファイル
/credential.json -> GCPへの認証ファイル
*/tmp/data, /tmp/model配下は使用後に都度削除する -> ft_xx_clear_tmp.sh
resources配下をdockerの/app/resources配下にマウント
以下gitignoreのため必要に応じて手動で配置
- .env
- credential.json
resources配下に必要なファイルが配備されている前提
git clone [email protected]:bass-bass/fastapi_starter.git
cd fastapi_starter
- (
systemctl start docker
) docker-compose up -d --build
- (
sh sh/batch/ft_04_download_model.sh 2022-10-26
) sh sh/api/ft_api_start.sh