Skip to content

Navigation Menu

Sign in
Appearance settings

Search code, repositories, users, issues, pull requests...

Provide feedback

We read every piece of feedback, and take your input very seriously.

Saved searches

Use saved searches to filter your results more quickly

Sign up
Appearance settings

sys0613/utilTools

Folders and files

NameName
Last commit message
Last commit date

Latest commit

History

13 Commits

Repository files navigation

utilTools

开发、整理常用工具模块

一、获取可用的代理IP列表(proxyutil.py)

进行爬虫操作时,使用代理IP可以规避反爬首手段

1、从代理IP网站获取代理ip列表
2、过滤代理IP:用代理IP访问IP138网站,判断当前代理IP是否生效,5秒内连接成功的认为有效,其他无效
3、将可用的代理IP保存到列表中返回
4、进行其他爬虫操作时,可以使用列表中的代理IP

使用方法:

(n为从多少页代理ip中进行筛选,是一个int型数字,iptype代表想要获取的代理IP类型,支持HTTP和HTTPS):
proxyutil=Proxyutil(n,iptype="HTTPS")
available_ip=proxyutil.get_available_iplist()

返回的列表格式如:

[('115.46.97.161', '8123', '高匿', 'HTTP'),('106.56.102.161', '8070', '高匿', 'HTTP')]

About

开发收集常用工具模块

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages

AltStyle によって変換されたページ (->オリジナル) /