- 突然看到四年前写的小工具,今天顺手重构了一下,想去快速抓一些问题配图的,可以拿去玩玩,请勿用于商业/非法场景(应该也不可能)。
- 只是重构了 zhihu_question_pic_crawler.py 这一个脚本,另一个已经作废,也懒得重构了,有兴趣自己来搞吧。
- 该爬虫对图片的解析获取与下载采用了多线程处理,一边解析问题答案,一边下载其中的图片,整体速度还可以,需要更快速度,可以自行改写
- 命令行运行 python3 zhihu_question_pic_crawler.py
- 输入要抓取的questionid,也就是知乎链接中question/后面的数字,图片会存储在脚本所在文件夹的storage/下对应以questionid为名的文件夹下。最后