看了下您的项目,我觉得这份数据可以用于保险领域的中文问答研究,对于较短的问题翻译很准确,长度较长的答案翻译就有些不连贯的问题,大体上关键词信息和一些上下文信息都有,我觉得是份很好的中文语料。 - fssqawj, East China Normal University
Excellent work! - rgtjf, East China Normal University
Baseline model for insuranceqa-corpus-zh
mini-batch size = 100, hidden_layers = [100, 50], lr = 0.0001.
Epoch 25, total step 36400, accuracy 0.9031, cost 1.056221.
Python3+
pip install -r Requirements.txt
A very simple network as baseline model.
python3 deep_qa_1/network.py
python3 visual/accuracy.py
python3 visual/loss.py
下载文档了解更多关于DeepQA-1的实现和Baseline。
声明1 : insuranceqa-corpus-zh
本数据集使用翻译 insuranceQA而生成,代码发布证书 GPL 3.0。数据仅限于研究用途,如果在发布的任何媒体、期刊、杂志或博客等内容时,必须注明引用和地址。
InsuranceQA Corpus, Hai Liang Wang, https://github.com/Samurais/insuranceqa-corpus-zh, 07 27, 2017
任何基于insuranceqa-corpus衍生的数据也需要开放并需要声明和“声明1”和“声明2”一致的内容。
声明2 : insuranceQA
此数据集仅作为研究目的提供。如果您使用这些数据发表任何内容,请引用我们的论文:Applying Deep Learning to Answer Selection: A Study and An Open Task。Minwei Feng, Bing Xiang, Michael R. Glass, Lidan Wang, Bowen Zhou @ 2015