Skip to content

Navigation Menu

Sign in
Appearance settings

Search code, repositories, users, issues, pull requests...

Provide feedback

We read every piece of feedback, and take your input very seriously.

Saved searches

Use saved searches to filter your results more quickly

Sign up
Appearance settings

Annihilater/novel

Folders and files

NameName
Last commit message
Last commit date

Latest commit

History

32 Commits

Repository files navigation

爬笔趣阁小说

爬趣笔阁的小说,采用 scrapy 框架。

思路

  1. 访问笔趣阁首页获取所有小说网址和专栏页网址
  2. 遍历网址,对两种类型的网址进行区分
    • 小说网址:在小说目录页面获取所有章节网址,抓取未下载的章节
    • 专栏网址:同第一步

反爬措施

  • 每次请求生成随机 UserAgent
  • 限制请求最大并发数为 5
  • 禁止失败请求重试

数据储存

  1. 小说简介数据存放在本机 MongoDB ;
  2. 小说章节数据也存放在本机 MongoDB 。

image-20191126184735401

image-20191126185734162

image-20191126184437589

About

爬笔趣阁小说

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages

AltStyle によって変換されたページ (->オリジナル) /