自制专有领域词汇表

最近在用不背单词app背单词（🤣），里面的词汇书是四六级高考、雅思托福，有自制词汇书的选项，于是我想试试用平时工作涉及的文档（比如临床试验领域的sdtmIG或者ADaMIG）做一个自制词汇书，以后专门背这里面的单词，或许有助于工作的时候阅读文档。

主要思路

把牛津词典的单词取出来；
把我平时工作常用的文档里面的英文单词取出来；
两边一匹配，留下来的英文单词刚好就是app官网里的自制词汇书。

涉及细节

我能找到的牛津词典是txt格式，处理后存在一些全大写英文缩写和词缀等解释，没有处理的非常细，后续匹配过程中不符合的自然匹不上。

同样的涉及我目标领域的比如像sdtmIG等文档，里面也包含一些不是英文单词的东西，同样做了简单的处理，但也没有处理的非常细，后续匹配过程中不符合的自然匹不上。

项目架构

项目文件夹/
├── target        # 存放目标文档的文件夹
├── oxford_dictionary # 存放牛津词典词汇的文件夹
├── function.py      # 功能函数模块
├── main.py          # 主程序执行入口
├── config.py        # 配置文件
├── requirements.txt # 项目依赖文件

如何运行

把目标文档的pdf格式文件放进target文件夹，解压一下oxford_dictionary文件夹里面的文件；

在requirements里面把包装好，在config.py里面填写两个文件夹的路径，然后运行main.py即可。

Name		Name	Last commit message	Last commit date
Latest commit History 16 Commits
oxford_dictionary		oxford_dictionary
target		target
.gitignore		.gitignore
LICENSE		LICENSE
README.md		README.md
config.py		config.py
functions.py		functions.py
main.py		main.py
requirements.txt		requirements.txt

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

自制专有领域词汇表

主要思路

涉及细节

项目架构

如何运行

About

Releases

Packages

Languages

License

allensrj/Targeted_Vocabulary_Generator

Folders and files

Latest commit

History

Repository files navigation

自制专有领域词汇表

主要思路

涉及细节

项目架构

如何运行

About

Resources

License

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages