Crawler-Douban-Book

使用NodeJs+express+MongoDB实现的简单爬虫系统，用来爬取豆瓣读书的书籍数据，并保存进MongoDB数据库。

通过本项目能学到什么？

通过本项目能够学到以下知识。

环境

NodeJs：6.10.0

express：4.15.2

mongoDB：3.4.2

插件

cheerio：0.22.0

主要用来生成DOM树，方便操作页面。

log4js：1.1.1

主要用来代替express的默认日志系统，用来记录日志。

mongolass：2.4.2

用来连接mongoDB数据库的驱动。

request：2.80.0

用来发送请求，获取页面内容。

其他插件

下列插件为开发测试使用，推荐安装。

node-dev：3.1.3

用来测试自动重启服务，方便修改代码后及时测试。相应的也可以使用supervisor、nodemon等插件代替。

Dev

下载项目

git clone https://github.com/BingKui/Crawler-Douban-Book.git

进入目录安装相应依赖

cd Crawler-Douban-Book && npm install

修改配置

修改项目配置项，打开config目录下的config.js文件，修改数据库连接的配置和端口。

修改下列的数据库地址为自己的数据库地址

mongodb://localhost/splider

运行项目

npm run start

注意：如果没有安装node-dev需要修改package.json中的script。

测试效果

打开浏览器，或者请求发送工具（如：Postman），打开http://localhost:3000/tag获取标签相应的数据，并保存进mongoDB数据库。

目录说明

项目根目录/
    ├── common //公共方法定义目录，修改代码后没用到
    ├── config //配置文件目录，所有的配置文件都在这里
    ├── controller //控制层目录，所有数据库的基础操作都在这里定义
    ├── docs //文档目录，存放文档
    ├── lib	//库文件目录
    ├── logs //日执行信息目录
    ├── models //模型，定义数据模型
    └── router //路由目录，控制所有的路由

路由说明

http://localhost:3000/tag：获取标签，并保存进数据库。

http://localhost:3000/tag/update：获取每个标签的页码总数，并对数据库中的数据进行更新。

http://localhost:3000/tagList：获取每个标签包含的所有书籍数据，并保存进数据库。

http://localhost:3000/books：获取书籍详细信息并保存进book表

更新日志

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Crawler-Douban-Book

通过本项目能学到什么？

环境

插件

其他插件

Dev

目录说明

路由说明

更新日志

About

Releases

Packages

Languages

Name		Name	Last commit message	Last commit date
Latest commit History 10 Commits
common		common
config		config
controller		controller
docs		docs
lib		lib
models		models
router		router
.gitignore		.gitignore
LICENSE		LICENSE
README.md		README.md
index.js		index.js
package.json		package.json

License

BingKui/Crawler-Douban-Book

Folders and files

Latest commit

History

Repository files navigation

Crawler-Douban-Book

通过本项目能学到什么？

环境

插件

其他插件

Dev

目录说明

路由说明

更新日志

About

Topics

Resources

License

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages