搜索
系统检测到您的用户名不符合规范:

百度云盘搜索引擎【升级版】

浏览:4061 发布日期:2015年10月11日 分类:用法示例 关键字: 百度云盘 爬虫 搜索引擎
自主开发的百度云盘搜索引擎。
之前我也做过百度云盘搜索功能,使用的是搜索引擎的的站内搜索功能site:pan.baidu.com,看了现在绝大大多数的网盘搜索都是使用的这个技巧。这次升级的版本是自己独立开发的网盘爬虫,2天爬取了60W搜索(实际上还可以能多,因为瞬时爬取频率太高,百度会封IP,考虑分布式的爬虫或代理IP能很好解决这个问题)。

使用到的技术:前台:PHP(thinkphp框架),后台爬虫:Python,前端界面bootstrap框架

程序部分截图
首页


结果页

后台爬虫管理,还在开发中。。。


爬虫做好了,搜索功能还没做好,只能精确搜索,所以大家注意下关键词。
演示网址:http://pan.whatsoo.com

http://www.wendang1.com
评论() 相关
后面还有条评论,
评论支持使用[code][/code]标签添加代码
您需要登录后才可以评论 登录 | 立即注册
收藏
yuking
积分:761 等级:LV2
热点推荐
(追記) (追記ここまで)
最新更新

我们

合作

网站

信息

ThinkPHP 是一个免费开源的,快速、简单的面向对象的 轻量级PHP开发框架 ,创立于2006年初,遵循Apache2开源协议发布,是为了敏捷WEB应用开发和简化企业应用开发而诞生的。ThinkPHP从诞生以来一直秉承简洁实用的设计原则,在保持出色的性能和至简的代码的同时,也注重易用性。并且拥有众多的原创功能和特性,在社区团队的积极参与下,在易用性、扩展性和性能方面不断优化和改进,已经成长为国内最领先和最具影响力的WEB应用开发框架,众多的典型案例确保可以稳定用于商业以及门户级的开发。

AltStyle によって変換されたページ (->オリジナル) /