Skip to content

Navigation Menu

Sign in
Appearance settings

Search code, repositories, users, issues, pull requests...

Provide feedback

We read every piece of feedback, and take your input very seriously.

Saved searches

Use saved searches to filter your results more quickly

Sign up
Appearance settings

Python-jmtt爬虫,可下载每个分类下的所有漫画,已经打包成EXE文件并放入Releases里,喜欢就点个Watched和Star.

License

Notifications You must be signed in to change notification settings

AndreDommond/Python-jmtt

Folders and files

NameName
Last commit message
Last commit date

Latest commit

History

65 Commits

Repository files navigation

Python-jmtt爬虫

Python-jmtt爬虫已经打包成exe文件

使用时需自备代理

最终结果展示:

新增功能:

1.可下载单本漫画及其目录

方法如下:(想要爬取的页数输入1即可)

2.对反扒处理辨别更加准确(基本100%了)

3.修复爬取量过大时,exe自动闪退(只要你梯子不断连20s以上,就保证能完成任务)

这里推荐使用Clash代理,会自动测试url连通性并切换到最快的那个

4.增加随机useragent功能

5.爬取完成后exe文件自动关闭

6.链接通用性增加

只要是使用jmtt右上角搜索到的然后复制上面的链接都可以

主要功能如下:

1.可爬取每个分类里的所有漫画

2.可自己控制所爬的页数(也可控制想爬的分类)

连接类型

类似于这种,去掉后面的(&page=2)的链接类型也可以

3.有分类的会自动爬取

4.直接下载到所指定目录

5.对网站新出的反扒机制进行判断:

哪些漫画被进行了反爬处理,哪些没有被进行反扒处理

6.对新的反扒图片进行处理,使其更改为正常图片

7.可指定对需要反扒处理的漫画保存路径(与不需要处理的是分开的)

8.此代码为本人一时兴起所写并且本人为新手,代码有很多不足,许多方面没有处理好,有需要的可自己进行优化使用

9.没有加入多线程、多进程、随机user-agent、代理ip池等功能(后续可能会更新也可能不会)

10.使用时需要自行安装模块

11.代码讲解放在注释里了自行查看

使用步骤

注意:复制后需要将符号' \ '改为' / '再进行输入,变成D:/Adults/漫画/

----------------图中忘记加/了,切记切记切记!(最后面不加/保存会有点问题。。)

就是变成这样

输入四个变量后按回车即可,exe没有东西出现是正常现象,漫画会自动放到输入的路径里

最后enjoy!

使用此代码即默认同意不可用于商业用途,如果过度使用出现追责与刑事纠纷本人不负任何责任。

About

Python-jmtt爬虫,可下载每个分类下的所有漫画,已经打包成EXE文件并放入Releases里,喜欢就点个Watched和Star.

Resources

License

Stars

Watchers

Forks

Packages

No packages published

Languages

AltStyle によって変換されたページ (->オリジナル) /