Skip to content

Commit

Permalink
Merge branch 'customized-cws'
Browse files Browse the repository at this point in the history
  • Loading branch information
Oneplus committed Nov 17, 2014
2 parents c123d3a + d815d56 commit 89465ae
Show file tree
Hide file tree
Showing 3,027 changed files with 222,551 additions and 224,621 deletions.
The diff you're trying to view is too large. We only load the first 3000 changed files.
9 changes: 1 addition & 8 deletions .gitignore
Original file line number Diff line number Diff line change
Expand Up @@ -27,17 +27,10 @@ bin/
tools/train/lgdpj
tools/train/lgsrl
tools/train/otcws
tools/train/otcws-customized
tools/train/otpos
tools/train/otner
tools/train/maxent
examples/cws
examples/cws_cmdline
examples/multi_cws_cmdline
examples/pos
examples/pos_cmdline
examples/multi_pos_cmdline
examples/par
examples/ner

###############
# data file #
Expand Down
16 changes: 16 additions & 0 deletions ChangeLog.md
Original file line number Diff line number Diff line change
@@ -1,3 +1,19 @@
2014-11-16
----------
* [增加] 分词模块增量模型训练工具。使用户可以在语言技术平台基线模型的基础之上增加训练数据,从而获得特定领域性能更好的模型。
* [修改] Boost.Regex到1.56.0,由于旧版本Boost.Regex的`match_results`类存在竞争问题,这一修改修复了`multi_cws_cmdline`随机出错的问题。
* [修改] 使自动化测试脚本支持Windows运行以及多线程测试
* [修改] 将原`examples`文件夹下的示例文件转移到`test`文件夹下并纳入语言技术平台的编译链
* [测试] 新版语言技术平台通过`cygwin`编译测试
* [测试] 多线程程序`multi_ltp_test``multi_cws_cmdline`以及`multi_pos_cmdline`在Windows通过测试

2014-10-11
----------
* [修改] 修改`utils/template.hpp`的实现,提高40%的速度性能
* [修改] 修改`_WIN32`宏在mingw下的歧义,使得LTP在`Codeblocks - Mingw Makefile`模式下正常编译
* [修改] 修改非unix系统的编译目标,使得win32与win64都不进行ltp_server以及unittest的编译
* [增加] 自动化测试脚本

2014-01-20
----------
* 在分词、词性标注和依存句法分析模块中加入模型裁剪功能,减少了模型大小。用户可以通过配置文件里的rare-feature-threshold参数配置裁剪力度,如果rare-feature-threshold为0,则只去掉为0的特征;rare-feature-threshold大于0时将一步去掉更新次数低于阈值的特征。这一优化方法主要参考[Learning Sparser Perceptron Models](http://www.cs.bgu.ac.il/~yoavg/publications/acl2011sparse.pdf)
Expand Down
4 changes: 2 additions & 2 deletions Doxyfile
Original file line number Diff line number Diff line change
Expand Up @@ -32,7 +32,7 @@ PROJECT_NAME = "LTP - Language Technology Platform"
# This could be handy for archiving the generated documentation or
# if some version control system is used.

PROJECT_NUMBER = 3.1.1
PROJECT_NUMBER = 3.2.0

# Using the PROJECT_BRIEF tag one can provide an optional one line description
# for a project that appears at the top of each page and should give viewer
Expand Down Expand Up @@ -365,7 +365,7 @@ LOOKUP_CACHE_SIZE = 0
# Private class members and static file members will be hidden unless
# the EXTRACT_PRIVATE and EXTRACT_STATIC tags are set to YES

EXTRACT_ALL = NO
EXTRACT_ALL = YES

# If the EXTRACT_PRIVATE tag is set to YES all private members of a class
# will be included in the documentation.
Expand Down
10 changes: 10 additions & 0 deletions NEWS.md
Original file line number Diff line number Diff line change
@@ -1,3 +1,13 @@
2014-11-16
----------
语言技术平台3.2.0版 发布
* [增加] 分词模块增量模型训练工具。使用户可以在语言技术平台基线模型的基础之上增加训练数据,从而获得特定领域性能更好的模型。
* [修改] Boost.Regex到1.56.0,由于旧版本Boost.Regex的`match_results`类存在竞争问题,这一修改修复了`multi_cws_cmdline`随机出错的问题。
* [修改] 使自动化测试脚本支持Windows运行以及多线程测试
* [修改] 将原`examples`文件夹下的示例文件转移到`test`文件夹下并纳入语言技术平台的编译链
* [测试] 新版语言技术平台通过`cygwin`编译测试
* [测试] 多线程程序`multi_ltp_test``multi_cws_cmdline`以及`multi_pos_cmdline`在Windows通过测试

2014-10-16
----------
第一届语言技术平台(LTP)用户大会将于2014年10月31日上午在北京召开,欢迎大家参加!会议详细信息见http://ir.hit.edu.cn/ltp-2014/,有意者请于10月20日之前填写在线会议注册表。
Expand Down
10 changes: 8 additions & 2 deletions README.md
Original file line number Diff line number Diff line change
Expand Up @@ -5,7 +5,13 @@
新闻
----

第一届语言技术平台(LTP)用户大会将于2014年10月31日上午在北京召开,欢迎大家参加!会议详细信息见[http://ir.hit.edu.cn/ltp-2014/](http://ir.hit.edu.cn/ltp-2014/),有意者请于10月20日之前填写[在线会议注册表](http://www.mikecrm.com/f.php?t=emJ0fp)
语言技术平台3.2.0版 发布
* [增加] 分词模块增量模型训练工具。使用户可以在语言技术平台基线模型的基础之上增加训练数据,从而获得特定领域性能更好的模型。
* [修改] Boost.Regex到1.56.0,由于旧版本Boost.Regex的`match_results`类存在竞争问题,这一修改修复了`multi_cws_cmdline`随机出错的问题。
* [修改] 使自动化测试脚本支持Windows运行以及多线程测试
* [修改] 将原`examples`文件夹下的示例文件转移到`test`文件夹下并纳入语言技术平台的编译链
* [测试] 新版语言技术平台通过`cygwin`编译测试
* [测试] 多线程程序`multi_ltp_test``multi_cws_cmdline`以及`multi_pos_cmdline`在Windows通过测试


简介
Expand All @@ -30,7 +36,7 @@
---

* [百度云](http://pan.baidu.com/share/link?shareid=1988562907&uk=2738088569)
* 当前模型版本3.1.2
* 当前模型版本3.2.0

开源协议
-------
Expand Down
Loading

0 comments on commit 89465ae

Please sign in to comment.