Skip to content

Latest commit

 

History

History
34 lines (19 loc) · 1.51 KB

README.md

File metadata and controls

34 lines (19 loc) · 1.51 KB

基于bert4keras的抽取式MRC基准代码

简介

本仓库是基于roberta的抽取式问答基础代码。

文件介绍

datasets

该文件夹存放的是抽取式数据集,分为训练集(train.json)、验证集(dev.json)以及测试集(test.json)。训练集和验证集是对模型在 下游任务中进行微调,使其可以学习到该领域的数据特征,模型在训练集和验证集上训练完成后,会生成一个模型的权重信息即xxx.weights。然后通过使用模型生成的权重信息,在测试集上进行相应的测试。

训练集的格式如下图所示:

model

该文件存放的是预训练模型,可根据自己需要选择相应的预训练模型。

使用步骤