Skip to content

Commit

Permalink
release v2.0 (#5)
Browse files Browse the repository at this point in the history
  • Loading branch information
awxiaoxian2020 authored Jun 12, 2023
1 parent 4ded224 commit ea4b056
Show file tree
Hide file tree
Showing 9 changed files with 3,789 additions and 5,848 deletions.
2 changes: 2 additions & 0 deletions .gitignore
Original file line number Diff line number Diff line change
@@ -0,0 +1,2 @@
*.docx
.vscode/
10 changes: 5 additions & 5 deletions README.md
Original file line number Diff line number Diff line change
@@ -1,16 +1,16 @@
# 考研词汇词频排序数据

经统计,在《2023年全国硕士研究生招生考试英语(一)考试大纲词汇表》中要求掌握的词汇共 5530 个,根据四六级、考研英语、专四专八约 200 套试卷文本,按照出现的词频对词汇表进行排序
经统计,在《2023年全国硕士研究生招生考试英语(一)考试大纲词汇表》中要求掌握的词汇共 5530 个,根据四六级、考研英语、专四专八约 200 套试卷文本,按照**试卷文本中**出现的词频对词汇表进行排序

排序使用了词形还原策略,所以与实际试卷呈现略有差异。

单词释义未经人工校对,略有瑕疵
[vocabulary.json](https://github.com/awxiaoxian2020/NETEMVocabulary/blob/master/vocabulary.json) 里面存储了所有的数据

前 2444 个单词出现 40 次以上,即平均每做 5 套试卷就能遇到一次的这些单词即为真正的**高频词汇**
**2444** 个单词出现 **40** 次以上,即平均每做 **5** 套试卷就能遇到一次的这些单词即为真正的**高频词汇**。这些单词的释义经过了人工校对,可以保证准确性

异形词(即对考纲当中有多种写法的单词)由于数量庞大,尚未有意愿更新
其余单词释义未经人工校对,略有瑕疵

[vocabulary.json](https://github.com/awxiaoxian2020/NETEMVocabulary/blob/master/vocabulary.json) 中的词义来自百度翻译 API
异形词(即对考纲当中有多种写法的单词)由于数量庞大,尚未有意愿更新

本仓库数据基于 [CC BY-NC-SA 4.0](https://creativecommons.org/licenses/by-nc-sa/4.0/) 共享,程序基于 [MIT License](https://github.com/awxiaoxian2020/NETEMVocabulary/blob/master/LICENSE).

Expand Down
62 changes: 0 additions & 62 deletions new_translator.py

This file was deleted.

Loading

0 comments on commit ea4b056

Please sign in to comment.