forked from apachecn/ailearning
-
Notifications
You must be signed in to change notification settings - Fork 0
Commit
This commit does not belong to any branch on this repository, and may belong to a fork outside of the repository.
- Loading branch information
1 parent
92ef9ed
commit f08083f
Showing
5 changed files
with
102 additions
and
104 deletions.
There are no files selected for viewing
This file contains bidirectional Unicode text that may be interpreted or compiled differently than what appears below. To review, open the file in an editor that reveals hidden Unicode characters.
Learn more about bidirectional Unicode characters
Original file line number | Diff line number | Diff line change |
---|---|---|
|
@@ -3,19 +3,11 @@ | |
<img width="200" src="http://data.apachecn.org/img/logo/GreenHat.jpg"> | ||
</a> | ||
<br > | ||
<a href="https://www.apachecn.org/"><img src="https://img.shields.io/badge/%3E-www.apachecn.com-green.svg"></a> | ||
<a href="mailto:[email protected]"><img src="https://img.shields.io/badge/%3E-[email protected]-green.svg"></a> | ||
|
||
首页: <a href="https://www.apachecn.org/"><img src="https://img.shields.io/badge/%3E-www.apachecn.com-green.svg"></a> | ||
关于: <a href="https://www.apachecn.org/"><img src="https://img.shields.io/badge/%3E-about-green.svg"></a> | ||
合作or侵权: <a href="mailto:[email protected]"><img src="https://img.shields.io/badge/%[email protected]"></a> | ||
</p> | ||
|
||
> ApacheCN 中文开源组织 | ||
* 关于我们: <http://www.apachecn.org/about> | ||
* 我们不是 Apache 的官方组织/机构/团体,只是 Apache 技术栈(以及 AI)的爱好者! | ||
* 合作or侵权,请联系: [email protected] | ||
|
||
> **欢迎任何人参与和完善:一个人可以走的很快,但是一群人却可以走的更远** | ||
<h2 align="center">Special Sponsors</h2> | ||
<table> | ||
<tbody> | ||
|
@@ -28,17 +20,27 @@ | |
</tbody> | ||
</table> | ||
|
||
# AI Learning | ||
> ApacheCN 中文开源组织 | ||
* 我们不是 Apache 的官方组织/机构/团体,只是 Apache 技术栈(以及 AI)的爱好者! | ||
* 合作or侵权,请联系: [email protected] | ||
* **ApacheCN - 学习机器学习群【629470233】<a target="_blank" href="//shang.qq.com/wpa/qunwpa?idkey=30e5f1123a79867570f665aa3a483ca404b1c3f77737bc01ec520ed5f078ddef"><img border="0" src="img/MainPage/ApacheCN-group.png" alt="ApacheCN - 学习机器学习群[629470233]" title="ApacheCN - 学习机器学习群[629470233]"></a>** | ||
|
||
> **欢迎任何人参与和完善:一个人可以走的很快,但是一群人却可以走的更远** | ||
# AI learning | ||
|
||
按照步骤: 1 => 2 => 3,你可以当大牛! | ||
|
||
## 1.机器学习 - 基础 | ||
|
||
* **Machine Learning in Action (机器学习实战) | [ApacheCN(apache中文网)](http://cwiki.apachecn.org/)** | ||
* 电子版书籍:[【机器学习实战-中文版-带目录版.pdf】](https://github.com/apachecn/AiLearning/tree/master/books) | ||
* 电子版书籍:[【机器学习实战-中文版-带目录版.pdf】](https://github.com/apachecn/AiLearning/tree/master/books) | ||
* -- 感谢 [飞龙小哥哥](https://github.com/wizardforcel) 生成的电子书[《机器学习实战-ApacheCN.pdf》](https://github.com/apachecn/AiLearning/blob/master/books/机器学习实战-ApacheCN.pdf) | ||
* **视频已更新完成,如果你觉得有价值,请帮忙点 Star【后续组织学习活动:sklearn、kaggle、 Pytorch 和 tensorflow】** | ||
* -- 视频网站:优酷 /bilibili / Acfun / 网易云课堂,可直接在线播放。(最下方有相应链接) | ||
* -- [群小哥哥:红色石头](https://github.com/RedstoneWill): [台湾大学林轩田机器学习笔记](https://github.com/apachecn/ntu-hsuantienlin-ml) | ||
* 推荐一个[机器学习笔记](https://feisky.xyz/machine-learning): https://feisky.xyz/machine-learning | ||
* 推荐一个[liuhuanyong大佬](https://github.com/liuhuanyong)整理的nlp全面知识体系: <https://liuhuanyong.github.io> | ||
|
||
<table> | ||
<tr> | ||
|
@@ -169,35 +171,66 @@ | |
</tr> | ||
</table> | ||
|
||
# 深度学习 DeepLearning | ||
|
||
* 1.) [入门介绍](/blog/dl/1.入门介绍.md) | ||
* 2.) 代码位置:src/py2.x or py3.x/DL | ||
### 网站视频 | ||
|
||
# 自然语言处理 NLP 学习 | ||
> [知乎问答-爆炸啦-机器学习该怎么入门?](https://www.zhihu.com/question/20691338/answer/248678328) | ||
## 1.使用场景 (百度公开课) | ||
当然我知道,第一句就会被吐槽,因为科班出身的人,不屑的吐了一口唾沫,说傻X,还评论 Andrew Ng 的视频。。 | ||
|
||
> 第一部分 入门介绍 | ||
我还知道还有一部分人,看 Andrew Ng 的视频就是看不懂,那神秘的数学推导,那迷之微笑的英文版的教学,我何尝又不是这样走过来的?? 我的心可能比你们都痛,因为我在网上收藏过上10部《机器学习》相关视频,外加国内本土风格的教程:7月+小象 等等,我都很难去听懂,直到有一天,被一个百度的高级算法分析师推荐说:《机器学习实战》还不错,通俗易懂,你去试试?? | ||
|
||
* 1.) [自然语言处理入门介绍](/blog/nlp/1.自然语言处理入门介绍.md) | ||
我试了试,还好我的Python基础和调试能力还不错,基本上代码都调试过一遍,很多高大上的 "理论+推导",在我眼中变成了几个 "加减乘除+循环",我想这不就是像我这样的程序员想要的入门教程么? | ||
|
||
> 第二部分 机器翻译 | ||
很多程序员说机器学习 TM 太难学了,是的,真 TM 难学,我想最难的是:没有一本像《机器学习实战》那样的作者愿意以程序员 Coding 角度去给大家讲解!! | ||
|
||
* 2.) [机器翻译](/blog/nlp/2.机器翻译.md) | ||
最近几天,GitHub 涨了 300颗 star,加群的200人, 现在还在不断的增加++,我想大家可能都是感同身受吧! | ||
|
||
> 第三部分 篇章分析 | ||
很多想入门新手就是被忽悠着收藏收藏再收藏,但是最后还是什么都没有学到,也就是"资源收藏家",也许新手要的就是 [MachineLearning(机器学习) 学习路线图](http://www.apachecn.org/map/145.html)。没错,我可以给你们的一份,因为我们还通过视频记录下来我们的学习过程。水平当然也有限,不过对于新手入门,绝对没问题,如果你还不会,那算我输!! | ||
|
||
* 3.1.) [篇章分析-内容概述](/blog/nlp/3.1.篇章分析-内容概述.md) | ||
* 3.2.) [篇章分析-内容标签](/blog/nlp/3.2.篇章分析-内容标签.md) | ||
* 3.3.) [篇章分析-情感分析](/blog/nlp/3.3.篇章分析-情感分析.md) | ||
* 3.4.) [篇章分析-自动摘要](/blog/nlp/3.4.篇章分析-自动摘要.md) | ||
> 视频怎么看? | ||
> 第四部分 UNIT-语言理解与交互技术 | ||
 | ||
|
||
* 4.) [UNIT-语言理解与交互技术](/blog/nlp/4.UNIT-语言理解与交互技术.md) | ||
1. 理论科班出身-建议去学习 Andrew Ng 的视频(Ng 的视频绝对是权威,这个毋庸置疑) | ||
2. 编码能力强 - 建议看我们的[《机器学习实战-教学版》](https://space.bilibili.com/97678687/#!/channel/detail?cid=22486) | ||
3. 编码能力弱 - 建议看我们的[《机器学习实战-讨论版》](https://space.bilibili.com/97678687/#!/channel/detail?cid=13045),不过在看理论的时候,看 教学版-理论部分;讨论版的废话太多,不过在讲解代码的时候是一行一行讲解的;所以,根据自己的需求,自由的组合。 | ||
|
||
> 【免费】数学教学视频 - 可汗学院 入门篇 | ||
* [@于振梓]() 推荐: 可汗学院-网易公开课 | ||
|
||
| 概率 | 统计 | 线性代数 | | ||
| - | - | - | | ||
| [可汗学院(概率)](http://open.163.com/special/Khan/probability.html) | [可汗学院(统计学)](http://open.163.com/special/Khan/khstatistics.html)| [可汗学院(线性代数)](http://open.163.com/special/Khan/linearalgebra.html) | ||
|
||
> 机器学习视频 - ApacheCN 教学版 | ||
||| | ||
| - | - | | ||
| AcFun | B站 | | ||
| <a title="AcFun(机器学习视频)" href="http://www.acfun.cn/u/12540256.aspx#page=1" target="_blank"><img width="290" src="img/MainPage/ApacheCN-ML-AcFun.jpg"></a> | <a title="bilibili(机器学习视频)" href="https://space.bilibili.com/97678687/#!/channel/index" target="_blank"><img width="290" src="img/MainPage/ApacheCN-ML-bilibili.jpg"></a> | | ||
| 优酷 | 网易云课堂 | | ||
| <a title="YouKu(机器学习视频)" href="http://i.youku.com/apachecn" target="_blank"><img width="290" src="img/MainPage/ApacheCM-ML-youku.jpg"></a> | <a title="WangYiYunKeTang(机器学习视频)" href="http://study.163.com/course/courseMain.htm?courseId=1004582003" target="_blank"><img width="290" src="img/MainPage/ApacheCM-ML-WangYiYunKeTang.png"></a> | | ||
|
||
> 【免费】机器/深度学习视频 - 吴恩达 | ||
| 机器学习 | 深度学习 | | ||
| - | - | | ||
| [吴恩达机器学习](http://study.163.com/course/courseMain.htm?courseId=1004570029) | [神经网络和深度学习](http://mooc.study.163.com/course/2001281002?tid=2001392029) | | ||
|
||
## 2.相关结构 | ||
|
||
## 2.深度学习 - 基础 | ||
|
||
> 深度学习必学 | ||
1. 反向传递: https://www.cnblogs.com/charlotte77/p/5629865.html | ||
2. CNN原理: http://www.cnblogs.com/charlotte77/p/7759802.html | ||
3. RNN原理: https://blog.csdn.net/qq_39422642/article/details/78676567 | ||
4. LSTM深入浅出的好文: https://blog.csdn.net/roslei/article/details/61912618 | ||
|
||
|
||
## 3.自然语言处理 | ||
|
||
学习过程中-内心复杂的变化!!! | ||
|
||
|
@@ -220,16 +253,40 @@ | |
|
||
 | ||
|
||
* 入门教程需看资料【添加比赛链接】: https://github.com/apachecn/AiLearning/tree/dev/blog/nlp | ||
* **入门教程需看资料【添加比赛链接】: https://github.com/apachecn/AiLearning/tree/dev/blog/nlp** | ||
* Python 自然语言处理 第二版: https://usyiyi.github.io/nlp-py-2e-zh | ||
* 推荐一个[liuhuanyong大佬](https://github.com/liuhuanyong)整理的nlp全面知识体系: <https://liuhuanyong.github.io> | ||
|
||
### 1.使用场景 (百度公开课) | ||
|
||
### 中文分词: | ||
> 第一部分 入门介绍 | ||
* 1.) [自然语言处理入门介绍](/blog/nlp/1.自然语言处理入门介绍.md) | ||
|
||
> 第二部分 机器翻译 | ||
* 2.) [机器翻译](/blog/nlp/2.机器翻译.md) | ||
|
||
> 第三部分 篇章分析 | ||
* 3.1.) [篇章分析-内容概述](/blog/nlp/3.1.篇章分析-内容概述.md) | ||
* 3.2.) [篇章分析-内容标签](/blog/nlp/3.2.篇章分析-内容标签.md) | ||
* 3.3.) [篇章分析-情感分析](/blog/nlp/3.3.篇章分析-情感分析.md) | ||
* 3.4.) [篇章分析-自动摘要](/blog/nlp/3.4.篇章分析-自动摘要.md) | ||
|
||
> 第四部分 UNIT-语言理解与交互技术 | ||
* 4.) [UNIT-语言理解与交互技术](/blog/nlp/4.UNIT-语言理解与交互技术.md) | ||
|
||
### 应用领域 | ||
|
||
#### 中文分词: | ||
|
||
* 构建DAG图 | ||
* 动态规划查找,综合正反向(正向加权反向输出)求得DAG最大概率路径 | ||
* 使用了SBME语料训练了一套 HMM + Viterbi 模型,解决未登录词问题 | ||
|
||
### 1.文本分类(Text Classification) | ||
#### 1.文本分类(Text Classification) | ||
|
||
文本分类是指标记句子或文档,例如电子邮件垃圾邮件分类和情感分析。 | ||
|
||
|
@@ -255,7 +312,7 @@ | |
|
||
**通过AUC 来评估模型的效果** | ||
|
||
### 2.语言模型(Language Modeling) | ||
#### 2.语言模型(Language Modeling) | ||
|
||
语言建模涉及开发一种统计模型,用于预测句子中的下一个单词或一个单词中的下一个单词。它是语音识别和机器翻译等任务中的前置任务。 | ||
|
||
|
@@ -283,7 +340,7 @@ | |
* bi-gram + levenshtein | ||
|
||
### 3.图像字幕(Image Captioning) | ||
#### 3.图像字幕(Image Captioning) | ||
|
||
mage字幕是为给定图像生成文本描述的任务。 | ||
|
||
|
@@ -296,7 +353,7 @@ mage字幕是为给定图像生成文本描述的任务。 | |
|
||
[探索图像字幕数据集,2016年](http://sidgan.me/technical/2016/01/09/Exploring-Datasets) | ||
|
||
### 4.机器翻译(Machine Translation) | ||
#### 4.机器翻译(Machine Translation) | ||
|
||
机器翻译是将文本从一种语言翻译成另一种语言的任务。 | ||
|
||
|
@@ -313,7 +370,7 @@ mage字幕是为给定图像生成文本描述的任务。 | |
* Encoder + Decoder(Attention) | ||
* 参考案例: http://pytorch.apachecn.org/cn/tutorials/intermediate/seq2seq_translation_tutorial.html | ||
|
||
### 5.问答系统(Question Answering) | ||
#### 5.问答系统(Question Answering) | ||
|
||
问答是一项任务,其中提供了一个句子或文本样本,从中提出问题并且必须回答问题。 | ||
|
||
|
@@ -326,7 +383,7 @@ mage字幕是为给定图像生成文本描述的任务。 | |
|
||
[数据集:我如何获得问答网站的语料库,如Quora或Yahoo Answers或Stack Overflow来分析答案质量?](https://www.quora.com/Datasets-How-can-I-get-corpus-of-a-question-answering-website-like-Quora-or-Yahoo-Answers-or-Stack-Overflow-for-analyzing-answer-quality) | ||
|
||
### 6.语音识别(Speech Recognition) | ||
#### 6.语音识别(Speech Recognition) | ||
|
||
语音识别是将口语的音频转换为人类可读文本的任务。 | ||
|
||
|
@@ -336,7 +393,7 @@ mage字幕是为给定图像生成文本描述的任务。 | |
2. [VoxForge](http://voxforge.org/)。用于构建用于语音识别的开源数据库的项目。 | ||
3. [LibriSpeech ASR语料库](http://www.openslr.org/12/)。从LibriVox收集的大量英语有声读物。 | ||
|
||
### 7.自动文摘(Document Summarization) | ||
#### 7.自动文摘(Document Summarization) | ||
|
||
文档摘要是创建较大文档的简短有意义描述的任务。 | ||
|
||
|
@@ -363,6 +420,7 @@ mage字幕是为给定图像生成文本描述的任务。 | |
* word2vec推荐文档: https://www.zhihu.com/question/44832436/answer/266068967 | ||
* textrank推荐文档: https://blog.csdn.net/BaiHuaXiu123/article/details/77847232 | ||
|
||
|
||
## Graph图计算【慢慢更新】 | ||
|
||
* 数据集: [data/nlp/graph](data/nlp/graph) | ||
|
@@ -381,57 +439,6 @@ mage字幕是为给定图像生成文本描述的任务。 | |
7. [NLP数据集](https://github.com/caesar0301/awesome-public-datasets#natural-language) | ||
8. 国内开放数据集: https://bosonnlp.com/dev/resource | ||
|
||
## 网站视频 | ||
|
||
> [知乎问答-爆炸啦-机器学习该怎么入门?](https://www.zhihu.com/question/20691338/answer/248678328) | ||
当然我知道,第一句就会被吐槽,因为科班出身的人,不屑的吐了一口唾沫,说傻X,还评论 Andrew Ng 的视频。。 | ||
|
||
我还知道还有一部分人,看 Andrew Ng 的视频就是看不懂,那神秘的数学推导,那迷之微笑的英文版的教学,我何尝又不是这样走过来的?? 我的心可能比你们都痛,因为我在网上收藏过上10部《机器学习》相关视频,外加国内本土风格的教程:7月+小象 等等,我都很难去听懂,直到有一天,被一个百度的高级算法分析师推荐说:《机器学习实战》还不错,通俗易懂,你去试试?? | ||
|
||
我试了试,还好我的Python基础和调试能力还不错,基本上代码都调试过一遍,很多高大上的 "理论+推导",在我眼中变成了几个 "加减乘除+循环",我想这不就是像我这样的程序员想要的入门教程么? | ||
|
||
很多程序员说机器学习 TM 太难学了,是的,真 TM 难学,我想最难的是:没有一本像《机器学习实战》那样的作者愿意以程序员 Coding 角度去给大家讲解!! | ||
|
||
最近几天,GitHub 涨了 300颗 star,加群的200人, 现在还在不断的增加++,我想大家可能都是感同身受吧! | ||
|
||
很多想入门新手就是被忽悠着收藏收藏再收藏,但是最后还是什么都没有学到,也就是"资源收藏家",也许新手要的就是 [MachineLearning(机器学习) 学习路线图](http://www.apachecn.org/map/145.html)。没错,我可以给你们的一份,因为我们还通过视频记录下来我们的学习过程。水平当然也有限,不过对于新手入门,绝对没问题,如果你还不会,那算我输!! | ||
|
||
> 视频怎么看? | ||
 | ||
|
||
1. 理论科班出身-建议去学习 Andrew Ng 的视频(Ng 的视频绝对是权威,这个毋庸置疑) | ||
2. 编码能力强 - 建议看我们的[《机器学习实战-教学版》](https://space.bilibili.com/97678687/#!/channel/detail?cid=22486) | ||
3. 编码能力弱 - 建议看我们的[《机器学习实战-讨论版》](https://space.bilibili.com/97678687/#!/channel/detail?cid=13045),不过在看理论的时候,看 教学版-理论部分;讨论版的废话太多,不过在讲解代码的时候是一行一行讲解的;所以,根据自己的需求,自由的组合。 | ||
|
||
循序渐进大体介绍:[机器学习初学者建议 | ApacheCN](http://www.apachecn.org/map/179.html) | ||
|
||
干货内容实际操作:[MachineLearning(机器学习) 学习路线图](http://www.apachecn.org/map/145.html) | ||
|
||
> 【免费】数学教学视频 - 可汗学院 入门篇 | ||
* [@于振梓]() 推荐: 可汗学院-网易公开课 | ||
|
||
| 概率 | 统计 | 线性代数 | | ||
| - | - | - | | ||
| [可汗学院(概率)](http://open.163.com/special/Khan/probability.html) | [可汗学院(统计学)](http://open.163.com/special/Khan/khstatistics.html)| [可汗学院(线性代数)](http://open.163.com/special/Khan/linearalgebra.html) | ||
|
||
> 机器学习视频 - ApacheCN 教学版 | ||
||| | ||
| - | - | | ||
| AcFun | B站 | | ||
| <a title="AcFun(机器学习视频)" href="http://www.acfun.cn/u/12540256.aspx#page=1" target="_blank"><img width="290" src="img/MainPage/ApacheCN-ML-AcFun.jpg"></a> | <a title="bilibili(机器学习视频)" href="https://space.bilibili.com/97678687/#!/channel/index" target="_blank"><img width="290" src="img/MainPage/ApacheCN-ML-bilibili.jpg"></a> | | ||
| 优酷 | 网易云课堂 | | ||
| <a title="YouKu(机器学习视频)" href="http://i.youku.com/apachecn" target="_blank"><img width="290" src="img/MainPage/ApacheCM-ML-youku.jpg"></a> | <a title="WangYiYunKeTang(机器学习视频)" href="http://study.163.com/course/courseMain.htm?courseId=1004582003" target="_blank"><img width="290" src="img/MainPage/ApacheCM-ML-WangYiYunKeTang.png"></a> | | ||
|
||
> 【免费】机器/深度学习视频 - 吴恩达 | ||
| 机器学习 | 深度学习 | | ||
| - | - | | ||
| [吴恩达机器学习](http://study.163.com/course/courseMain.htm?courseId=1004570029) | [神经网络和深度学习](http://mooc.study.163.com/course/2001281002?tid=2001392029) | | ||
|
||
## 项目负责人 | ||
|
||
> Ml 第一期 (2017-02-27) | ||
|
@@ -527,11 +534,6 @@ mage字幕是为给定图像生成文本描述的任务。 | |
|
||
**欢迎贡献者不断的追加** | ||
|
||
> 加入方式 | ||
* 企鹅: 529815144(片刻) 1042658081(那伊抹微笑) 190442212(瑶妹) | ||
* [ApacheCN(apache中文网) 维护更新](http://www.apachecn.org) : [关于我们](http://cwiki.apachecn.org/pages/viewpage.action?pageId=2887240) && [加入我们](http://cwiki.apachecn.org/pages/viewpage.action?pageId=2887239) | ||
|
||
## 免责声明 - 【只供学习参考】 | ||
|
||
* ApacheCN 纯粹出于学习目的与个人兴趣翻译本书 | ||
|
@@ -554,9 +556,3 @@ mage字幕是为给定图像生成文本描述的任务。 | |
以各项目协议为准。 | ||
|
||
ApacheCN 账号下没有协议的项目,一律视为 [CC BY-NC-SA 4.0](https://creativecommons.org/licenses/by-nc-sa/4.0/deed.zh)。 | ||
|
||
## Organization | ||
|
||
* ApacheCN 组织资源: <https://github.com/apachecn/home> | ||
|
||
> 欢迎任何人参与和完善:一个人可以走的很快,但是一群人却可以走的更远 |
Empty file.
Empty file.
This file contains bidirectional Unicode text that may be interpreted or compiled differently than what appears below. To review, open the file in an editor that reveals hidden Unicode characters.
Learn more about bidirectional Unicode characters
File renamed without changes.