Releases: HIT-SCIR/ltp
Releases · HIT-SCIR/ltp
LTP4 v4.0.4
LTP v4.0.3-post1
- 加入 split sent 功能
- 可载入 URL,TGZ/ZIP,DIR 模型文件
- 可使用 LTP 进行开发
LTP v4.0 发布
LTP v4.0 发布
- [修改] 基于Pytorch 开发,原生 Python 接口
- [优化] 可根据需要自由选择不同速度和指标的模型
- [增加] 分词、词性、命名实体、依存句法、语义角色、语义依存6大任务
语言技术平台 3.4.0 版发布
语言技术平台3.4.0版 发布
- [增加] 新的基于Bi-LSTM的SRL模型
- [增加] 增加了SRL的多线程命令行程序
srl_cmdline
- [修改] SRL相关的编程接口已经改变,修复了之前内存泄露的相关问题。
语言技术平台 3.3.2 版发布
- [修复] 修复了 3.3.1 版本的一些 bug
语言技术平台 3.3.1版
语言技术平台 3.3.1 版 发布
- [修复] 修复了 3.3.0 版本模型加载的 bug
- [修复] 修复了 gcc5、mingw、VS2015 下的编译问题
- [增加] 提供 Windows 下的
ltp_test
和xxx_cmdline
二进制下载
语言技术平台3.3.1-beta版
语言技术平台 3.3.1-beta 版 发布
- [修复] 修复了 3.3.0 版本模型加载的 bug
- [增加] 提供 Windows 下的
ltp_test
和xxx_cmdline
二进制下载,无需再手工编译
MD5 (ltp-win-3.3.1-beta.zip) = da59e5c2981b9380869e5ba626032028
语言技术平台3.3.0版
- [增加] 词性标注模型加入微博数据,使得在开放域上的词性标注性能更好(+3.3 precision)
- [增加] 依存句法分析模型加入微博数据,使得在开放域上的句法分析性能更好(+3 UAS)
- [增加] 依存句法分析算法切换到transition-based neural network parser,速度从250 tokens/s提升到8000 tokens/s。同时通过加入聚类特征以及优化训练算法,(在新闻领域)准确率也得到小幅提升(+0.2 UAS)
- [增加]
ltp_test
默认支持多线程,线程数可配置。 - [增加] 新加入子模块命令行程序,
cws_cmdline
,pos_cmdline
,par_cmdline
,ner_cmdline
,使用户可以很容易替换中间模块,从而实现语言分析的组合。 - [修改] 优化了训练套件的交互方式
- [增加] 添加模型验证,单元测试模块。
语言技术平台3.2.0版
- [增加] 分词模块增量模型训练工具。使用户可以在语言技术平台基线模型的基础之上增加训练数据,从而获得特定领域性能更好的模型。
- [修改] Boost.Regex到1.56.0,由于旧版本Boost.Regex的
match_results
类存在竞争问题,这一修改修复了multi_cws_cmdline
随机出错的问题。 - [修改] 使自动化测试脚本支持Windows运行以及多线程测试
- [修改] 将原
examples
文件夹下的示例文件转移到test
文件夹下并纳入语言技术平台的编译链 - [测试] 新版语言技术平台通过
cygwin
编译测试 - [测试] 多线程程序
multi_ltp_test
,multi_cws_cmdline
以及multi_pos_cmdline
在Windows通过测试
语言技术平台3.1.2版
- [修改] 修改
utils/template.hpp
的实现,提高40%的速度性能 - [修改] 修改
_WIN32
宏在mingw下的歧义,使得LTP在Codeblocks - Mingw Makefile
模式下正常编译 - [修改] 修改非unix系统的编译目标,使得win32与win64都不进行ltp_server以及unittest的编译
- [增加] 自动化测试脚本