推荐系统
scala
-
feature部分
a. 重写spark ml word2vec, 修复了并行化中参数更新问题,拓展CBOW模型 拓展H-softmax训练方法(原模型只包含用 负采样优化的skip-gram) -
optimize部分
a. 将优化训练模块化分成计算梯度与更新参数,实现梯度下降类,牛顿法类; -
tree部分
a. 梯度提升树的实现 -
classfication部分
a. FM实现
java
- 基于java实现simrank的mr分布式版本
python
- 实现一些基于tensorflow的模型