Jueee/PythonWebCrawlers

Folders and files

Name		Name	Last commit message	Last commit date
Latest commit History 40 Commits
Scrapy		Scrapy
__pycache__		__pycache__
.gitattributes		.gitattributes
.gitignore		.gitignore
01-URL.py		01-URL.py
02-BFS.py		02-BFS.py
03-Chrome.py		03-Chrome.py
04-Login.py		04-Login.py
05-tieba.py		05-tieba.py
06-JDprice.py		06-JDprice.py
07-BaiduLenovo.py		07-BaiduLenovo.py
08-IdentifyingCode.py		08-IdentifyingCode.py
09-downPicture.py		09-downPicture.py
10-zhihuLogin.py		10-zhihuLogin.py
11-CSDNBlogList.py		11-CSDNBlogList.py
12-ChromeCookie1.py		12-ChromeCookie1.py
12-ChromeCookie2.py		12-ChromeCookie2.py
13-CookieDeciphering.py		13-CookieDeciphering.py
14-ChromePassword.py		14-ChromePassword.py
15-ZhihuAnswerList.py		15-ZhihuAnswerList.py
16-selenium.py		16-selenium.py
17-Phantomjs.py		17-Phantomjs.py
18-WeiboAnalbum.py		18-WeiboAnalbum.py
19-BeautifulSoup.py		19-BeautifulSoup.py
20-DoubanMovieTop250.py		20-DoubanMovieTop250.py
21-DoubanMovieTypeTop.py		21-DoubanMovieTypeTop.py
22-PyQuery.py		22-PyQuery.py
23-C315Check.py		23-C315Check.py
24-FilesDownload.py		24-FilesDownload.py
ChromeCookies.py		ChromeCookies.py
README.md		README.md

Repository files navigation

05-WebCrawlers

网络爬虫(Web Crawlers)学习笔记。

内容说明:

1、Scrapy文件夹:

web抓取框架Scrapy学习笔记。

2、其他:

01-URL.py:用Python抓取指定URL页面。
02-BFS.py:使用队列来实现爬虫的广度优先搜索(BFS)算法。
03-Chrome.py:伪装浏览器来访问网站。
04-Login.py:模拟用户登录(以登录 CSDN 网站为例)。
05-tieba.py:爬取百度贴吧的HTML网页到本地。
06-JDprice.py:爬虫获取京东的商品价格,并把爬取结果保存至Excel。
07-BaiduLenovo.py:百度搜索框联想词的获取。
08-IdentifyingCode.py:读取验证码图片。
09-downPicture.py:爬取某个网页上的所有图片资源。
10-zhihuLogin.py:知乎网的登录。
11-CSDNBlogList.py:根据用户名,获取该用户的CSDN的博客列表。
12-ChromeCookie.py:在Python中使用Chrome浏览器已有的Cookies发起HTTP请求。
13-CookieDeciphering.py:Chrome 33+浏览器 Cookies encrypted_value 解密。
14-ChromePassword.py:获取Chrome浏览器已保存的账号和密码。
15-ZhihuAnswerList.py:获取某个用户的知乎回答列表及赞同数(静态网页爬虫)。
16-selenium.py:动态爬虫工具 selenium 的安装与使用(通过控制浏览器实现)。
17-Phantomjs.py:动态爬虫工具 Phantomjs 的安装与使用(通过JS渲染实现)。
18-WeiboAnalbum.py:爬取新浪微博某个用户的头像相册(通过分析API JSON)。
19-BeautifulSoup.py:Beautiful Soup 学习笔记(python3中的爬虫匹配神器)。
20-DoubanMovieTop250.py:爬取豆瓣评分最高的250部电影(使用Beautiful Soup)。
21-DoubanMovieTypeTop.py:按类别爬取豆瓣评分最高的电影(使用Beautiful Soup)。
22-PyQuery.py:Python中PyQuery库的使用总结。
23-C315Check.py:根据物流防伪码,查询所购商品是否正品。

About

Python 网络爬虫(Web Crawlers)学习笔记。

Releases

No releases published

Packages

No packages published

Languages

Python 100.0%

Navigation Menu

Search code, repositories, users, issues, pull requests...

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Jueee/PythonWebCrawlers

Folders and files

Latest commit

History

Repository files navigation

05-WebCrawlers

内容说明:

1、Scrapy文件夹:

2、其他:

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages

Languages

Jueee/PythonWebCrawlers

Folders and files

Latest commit

History

Repository files navigation

05-WebCrawlers

内容说明:

1、Scrapy文件夹:

2、其他:

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages