1. 数据处理->dataM

pretrained model + preprocessed data

1. 数据处理->dataM

将pro之外的5种零元素都改为[MASK]，并且6种类型全部去掉‘-d’(即后面的数字，如：-1)

留着pro

sed -i "s/-NONE- *pro*/-NULL- pro/g" grep "\-NONE\- \*pro\*" -rl ./data/zp_data

5种零元素都改为[MASK]

sed -i "s/*PRO*/[MASK]/g" grep \*PRO\* -rl ./data/zp_data sed -i "s/*OP*/[MASK]/g" grep \*OP\* -rl ./data/zp_data sed -i "s/*T*/[MASK]/g" grep \*T\* -rl ./data/zp_data sed -i "s/*RNR*/[MASK]/g" grep \*RNR\* -rl ./data/zp_data sed -i "s/\s*-/ [MASK]-/g" grep \s\*\- -rl ./data/zp_data sed -i "s/\s*)/ [MASK])/g" grep \s\* -rl ./data/zp_data

去掉数字

sed -i "s/*pro*-./pro/g" grep "\*pro\*-" -rl ./data/zp_data sed -i "s/[MASK]-./[MASK]/g" grep "\[MASK\]-" -rl ./data/zp_data

去掉5种零元素，用黄亮的代码 https://github.com/lianghuang3/lineardpparser/blob/master/code/tree.py

2. 模型

1）ZP

[MASK]

2）NP

不使用RNN了，直接利用BERT的输出，原因有二：1、BERT中有position信息，不存在无序问题；2、而且存在上下文信息运行: python main.py --do_train >./results/result_zp_mask_np_pretrained_1214 2> logs/log_zp_mask_np_pretrained_1214 结果： dev: 0.4383157894736842 test: 0.5539988324576766（差两个点） Attention result： dev: 0.5346921075455334 test: 0.5732632807939287

3. 存在问题

Dev和test的结果相差12个点，跟目标函数有关？算不算过拟合？

Name		Name	Last commit message	Last commit date
Latest commit History 12 Commits
bin		bin
delNoneOfTree		delNoneOfTree
examples		examples
notebooks		notebooks
properties		properties
pytorch_pretrained_bert		pytorch_pretrained_bert
samples		samples
tests		tests
.gitignore		.gitignore
LICENSE		LICENSE
README.md		README.md
buildTree.py		buildTree.py
conf.py		conf.py
data_builder.py		data_builder.py
data_generater.py		data_generater.py
data_preprocess.sh		data_preprocess.sh
main.py		main.py
net.py		net.py
net_with_bert.py		net_with_bert.py
net_with_pretrained_bert.py		net_with_pretrained_bert.py
parse_analysis.py		parse_analysis.py
properties_loader.py		properties_loader.py
requirements.txt		requirements.txt
setup.py		setup.py
setup.sh		setup.sh
start.sh		start.sh
t.py		t.py
utils.py		utils.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

1. 数据处理->dataM

留着pro

5种零元素都改为[MASK]

去掉数字

2. 模型

1）ZP

2）NP

3. 存在问题

About

Releases

Packages

Languages

License

mjj1094/Attention_BERT_62

Folders and files

Latest commit

History

Repository files navigation

1. 数据处理->dataM

留着pro

5种零元素都改为[MASK]

去掉数字

2. 模型

1）ZP

2）NP

3. 存在问题

About

Resources

License

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages