Skip to content

Navigation Menu

Sign in
Appearance settings

Search code, repositories, users, issues, pull requests...

Provide feedback

We read every piece of feedback, and take your input very seriously.

Saved searches

Use saved searches to filter your results more quickly

Sign up
Appearance settings

chimingdd/novel_crawler

Folders and files

NameName
Last commit message
Last commit date

Latest commit

History

22 Commits

Repository files navigation

免责声明

1.本项目的目的是学习和练习爬虫技术,本项目提供的爬虫源代码仅用学习,请勿用于商业盈利。

2.用户使用本系统从事任何违法违规的事情,一切后果由用户自行承担,作者不承担任何责任。

3.如有侵犯权利,请联系作者删除,邮箱:daluan2000@qq.com

4.下载本站源码则代表你同意上述的免责声明协议

功能

爬取网站上小说章节的内容,并以txt形式保存在本地。

程序运行需要的参数如下:

参数名 参数值 样例
-f 保存在本地的文件名 斗破苍穹
-u 小说章节列表的url链接 https://www.52bqg.org/book_361/

使用样例如下:

novel_crawler.exe -f 斗破苍穹 -u https://www.52bqg.org/book_361/

已支持网站

本爬虫的适应性非常强,只需经过简易的拓展,便基本能够爬取所有的公开小说网站(指那些不需要登陆就能阅读小说的网站)。

我这里只随便弄了几个网站作为样例,如果需要爬更多的网站那么告诉我网址就好,我这边稍微修改下程序就可以了。

第一类网站

  1. www.2biqu.com 笔趣阁,使用样例如下:
.\novel_crawler.exe -f 择日飞升 -u https://www.2biqu.com/biqu5396/
  1. www.bige3.cc 笔趣阁,使用样例如下:
.\novel_crawler.exe -f 神秘复苏 -u https://www.bige3.cc/book/66/
  1. www.52bqg.org 笔趣阁,使用样例如下:
.\novel_crawler.exe -f 深空彼岸 -u https://www.52bqg.org/book_99524/
  1. www.ujxsw.net 悠久小说网,使用样例如下:
.\novel_crawler.exe -f 我的26岁女房客 -u http://www.ujxsw.net/read/15871/ 
  1. www.tianyabook.com 天涯书库,使用样例如下:
.\novel_crawler.exe -f 终极斗罗 -u https://www.tianyabook.com/shu/40027.html
  1. www.trxs.cc 同人小说网,二次元比较多,使用样例如下:
.\novel_crawler.exe -f 我的后桌居然是珈百璃 -u http://www.trxs.cc/tongren/3650.html
  1. www.00txt.com 科幻小说网,出版科幻小说
.\novel_crawler.exe -u http://www.00txt.com/santi/ -f 三体
  1. www.1688by.com 好笔阁
.\novel_crawler.exe -f 我真不是邪神走狗 -u https://www.1688by.com/book/203501本章未

第二类网站

  1. www.xbiqugeo.com 新笔趣阁,使用样例如下:
.\novel_crawler.exe -f 少年歌行 -u https://www.xbiqugeo.com/shu/6420/ 
  1. www.zrfsxs.com 择日小说网,使用样例如下:
.\novel_crawler.exe -f 深空彼岸 -u https://www.zrfsxs.com/xiaoshuo/42/
  1. youyouxs.com 友友小说网

ps:这个网站限制ip访问频次,我没钱买ip池,所以只能限制程序的并发量,爬取速度会比较慢一些 ps:这个网站会封ip,建议连接手机热点

.\novel_crawler.exe -u https://youyouxs.com/xs_350417/zjml_1 -f 超能力者不想受欢迎

About

爬取网站上小说章节的内容,并以txt形式保存在本地。 本爬虫的适应性非常强,只需经过简易的拓展,便基本能够爬取所有的公开小说网站(指那些不需要登陆就能阅读小说的网站)。 我这里只随便弄了几个网站作为样例,如果需要爬更多的网站那么告诉我网址就好,我这边稍微修改下程序就可以了。

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

Contributors

Languages

AltStyle によって変換されたページ (->オリジナル) /