训练的模型如何在实际生产中使用呢 #152

weiwenwang · 2020-06-18T03:21:58Z

大佬们好，
比如，通过doudizhu_dqn训练的模型已经保存，我理解生产中，可能需要把模型加载，然后把场上的情况转换成state，输入模型，然后模型输出最好的action，这样对吗，这个怎么操作呢，能出一个demo吗，我看了leduc_holdem_nfsp_load_model.py这个应该是快速对局，测试模型优劣的，生产中如何操作呢， dqn_load_model的demo吗
多谢，祝好

daochenzha · 2020-06-18T03:36:38Z

你好，

我们只提供训练环境和基础算法，以方便测试。实际应用还需要很多工程的东西。比如把state和action和真实游戏中对接起来。state和action都是numpy向量，可以参考https://github.com/datamllab/rlcard/blob/master/rlcard/envs/doudizhu.py

实际应用中可能还需要其他的一些工程性的东西来提高效果。比如调整reward，以及尝试不同的特征。我们的目标是提供最基本框架和和基本的算法，方便后续开发。谢谢。

weiwenwang · 2020-06-18T06:48:35Z

明白您的意思，我可能需要补充点tf1的知识，来解决剩下的问题
我们是国内做棋牌的，你这套环境已经帮助我们很多了，非常感谢并持续关注

wearetvxq · 2020-09-25T06:42:30Z

@weiwenwang 请问您有了进一步的进展吗? 不是python 方向, 想了解更多一点来, 看是否深入学习

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

训练的模型如何在实际生产中使用呢 #152

训练的模型如何在实际生产中使用呢 #152

weiwenwang commented Jun 18, 2020

daochenzha commented Jun 18, 2020 •

edited

Loading

weiwenwang commented Jun 18, 2020

wearetvxq commented Sep 25, 2020

训练的模型如何在实际生产中使用呢 #152

训练的模型如何在实际生产中使用呢 #152

Comments

weiwenwang commented Jun 18, 2020

daochenzha commented Jun 18, 2020 • edited Loading

weiwenwang commented Jun 18, 2020

wearetvxq commented Sep 25, 2020

daochenzha commented Jun 18, 2020 •

edited

Loading