Skip to content

Latest commit

 

History

History
45 lines (32 loc) · 1.54 KB

STRUCT.md

File metadata and controls

45 lines (32 loc) · 1.54 KB

输入输出结构/格式

gBuilder Endpoint 的全部数据都以 JSONL (JSON Line) 形式存储,即一行一个标准 JSON 对象。

在一行内,JSON 对象包括的键值与具体任务相关,具体如下所示:

1. NER 模型

输入:

{"data": "我是待抽取的语料"}

输出:

{"data": "我是待抽取的语料", "entity": ["实体1", "实体2"], "entity_type": ["实体1的类型", "实体2的类型"]}

2. RE 模型

输入:

{"data": "我是待抽取的语料", "entity_pair": [["头实体1", "尾实体2"], ["头实体2", "尾实体2"]], "entity_type_pair": [["头实体1的类型", "尾实体2的类型"], ["头实体2的类型", "尾实体2的类型"]]}

输出:

{"data": "我是待抽取的语料", "entity_pair": [["头实体1", "尾实体2"], ["头实体2", "尾实体2"]], "entity_type_pair": [["头实体1的类型", "尾实体2的类型"], ["头实体2的类型", "尾实体2的类型"]], "relation": ["第一个实体对之间的关系", "第二个实体对之间的关系"]}

entity_type_pair 可选

3. JE 模型

输入:

{"data": "我是待抽取的语料"}

输出:

{"data": "我是待抽取的语料", "entity_pair": [["头实体1", "尾实体2"], ["头实体2", "尾实体2"]], "entity_type_pair": [["头实体1的类型", "尾实体2的类型"], ["头实体2的类型", "尾实体2的类型"]], "relation": ["第一个实体对之间的关系", "第二个实体对之间的关系"]}

entity_type_pair 可选