Skip to content

Navigation Menu

Sign in
Appearance settings

Search code, repositories, users, issues, pull requests...

Provide feedback

We read every piece of feedback, and take your input very seriously.

Saved searches

Use saved searches to filter your results more quickly

Sign up
Appearance settings

king1348/livetv_mining

Folders and files

NameName
Last commit message
Last commit date

Latest commit

History

238 Commits

Repository files navigation

关于项目


介绍

项目实现爬虫数据挖掘/分析等功能。目前主要是扫描直播站点收集数据,后续会开发相关数据分析模块。

架构采用前后端分离,通过RESTFul API通信。前端Vue+Webpack,后端Flask。

文件结构分为三部分,每个部分可以单独提供服务:

  • frontend 前端代码,使用Vue+Webpack开发管理。
  • server 后端RESTFul服务,使用Flask搭建提供API。
  • crawler 爬虫服务,使用框架scrapy对直播站点爬取数据。

使用中有问题或更新建议,欢迎提issue或用以下联系方式跟我交流:

历程

  • 2017年05月10日 开发新爬虫火猫。
  • 2017年04月24日 全民收集开发完成。
  • 2017年04月22日 熊猫收集开发完成。
  • 2017年04月20日 斗鱼收集开发完成。
  • 2017年04月15日 准备开发收集站点房间:关注数、公告、上一次开播时间、打赏值、开播当天人气中位数。
  • 2017年04月01日 变更LICENSE:GPL -> Apache。
  • 2017年03月20日 开发新爬虫全民。
  • 2017年03月03日 开发新爬虫龙珠。
  • 2017年03月01日 恢复爬虫熊猫、战旗。
  • 2017年01月07日 完成全部功能迁移,前后端分离完成。
  • 2016年12月24日 引入vuex进行state和权限管理。
  • 2016年12月15日 引入vue-resource,主模块(Main)完成分离。
  • 2016年11月25日 研究流行前端框架和开发方式,确定使用webpack开发。
  • 2016年11月20日 重新设计结构,进行前后端分离。
  • 2016年11月01日 修正改造搜索功能,需要登录后才能使用。
  • 2016年10月29日 完成渲染初步改造,已实现调用REST API进行访问读取。爬虫运行间隔20分钟。
  • 2016年10月20日 引入Vue.js,改造前端渲染方式,减轻服务器压力。开发完成简单 Flask-Vue 插件。
  • 2016年10月15日 引入Scrapy重构爬虫,精简爬虫步骤。仅保留斗鱼、BiliBli爬虫。
2016年08月15日 v1.0版本开发结束,代码保存在分支v1.0

捐助开发者


如果你喜欢我的作品 or 站点对你有所帮助,希望能支持我一下。

微信 支付宝
alipay

About

直播网站数据采集

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages

  • Python 72.6%
  • Vue 19.3%
  • JavaScript 6.7%
  • HTML 1.1%
  • CSS 0.3%

AltStyle によって変換されたページ (->オリジナル) /