Skip to content

Commit

Permalink
Update analyse
Browse files Browse the repository at this point in the history
  • Loading branch information
pengshiqi committed May 16, 2018
1 parent 3a1ea5f commit a011564
Show file tree
Hide file tree
Showing 4 changed files with 2,888 additions and 79 deletions.
62 changes: 37 additions & 25 deletions README.md
Original file line number Diff line number Diff line change
Expand Up @@ -16,19 +16,19 @@

2. 近期的文章列表。

~~- 一共提取了最近 20 页的 **2000** 篇文章。~~
- ~~一共提取了最近 20 页的 **2000** 篇文章。~~

- 一共提取了最近 5000 页的 **99889** 篇文章。

3. 用户id列表。

~~- 2000 篇文章下的 **249685** 个评论用户(未去重),存储在 article_comment_user 表。~~
- ~~2000 篇文章下的 **249685** 个评论用户(未去重),存储在 article_comment_user 表。~~

- 99889 篇文章下的(约) **5891037** 个评论用户(未去重),存储在 article_comment_user 表。

4. 用户信息。

~~- 去重后共 **103300** 个用户,存储在 user 表。~~
- ~~去重后共 **103300** 个用户,存储在 user 表。~~

- 去重后共 **610803** 个用户,存储在 user 表。 (去重去掉了90%...)

Expand All @@ -46,31 +46,43 @@

| Region | Count |
| :----: | :---: |
| 广东 广州 | 2089 |
| 四川 成都 | 1735 |
| 海外 其他 | 1602 |
| 陕西 西安 | 1369 |
| 江苏 南京 | 1310 |
| 北京 东城区 | 1265 |
| 辽宁 大连 | 1100 |
| 山东 济南 | 1090 |
| 广东 深圳 | 1017 |
| 海外 西班牙 | 1002 |

3. Top 10 team:
| 广东 广州 | 10287 |
| 四川 成都 | 8446 |
| 北京 东城区 | 6960 |
| 海外 其他 | 6866 |
| 陕西 西安 | 6469 |
| 江苏 南京 | 6452 |
| 辽宁 大连 | 5662 |
| 北京 海淀区 | 5163 |
| 山东 济南 | 4884 |
| 广东 深圳 | 4827 |
| 湖北 武汉 | 4566 |

3. Top 10 club team:

| Team | Count |
| :----: | :---: |
| 巴塞罗那 | 17104 |
| 皇家马德里 | 16575 |
| 曼联 | 6278 |
| 拜仁慕尼黑 | 6106 |
| 利物浦 | 3779 |
| 中国 | 3646 |
| 阿森纳 | 3644 |
| AC米兰 | 3540 |
| 广州恒大淘宝 | 3031 |
| 国际米兰 | 2797 |
| 巴塞罗那 | 87400 |
| 皇家马德里 | 86600 |
| 曼联 | 41716 |
| 拜仁慕尼黑 | 29428 |
| 阿森纳 | 19728 |
| AC米兰 | 19373 |
| 广州恒大淘宝 | 18762 |
| 利物浦 | 15589 |
| 切尔西 | 14601 |
| 国际米兰 | 12332 |


4. Top 5 national team:

| Team | Count |
| :----: | :---: |
| 中国 | 24134 |
| 德国 | 3655 |
| 阿根廷 | 2354 |
| 意大利 | 1723 |
| 巴西 | 1617 |

----

Expand Down
Loading

0 comments on commit a011564

Please sign in to comment.