learn-thread.py · yt/python-learn

代码拉取完成,页面将自动刷新

扫描微信二维码支付

取消

支付完成

richgiteeai

Watch

不关注关注所有动态仅关注版本发行动态关注但不提醒动态

1 Star 0 Fork 265

yt/python-learn

forked from mktime/python-learn

代码 Issues 0 Pull Requests 0 Wiki 统计流水线

服务

加入 Gitee

与超过 1400万开发者一起发现、参与优秀开源项目,私有仓库也完全免费 :)

免费加入

已有帐号? 立即登录

文件

master

分支 (1)

管理

master

克隆/下载

HTTPS SSH SVN SVN+SSH 下载ZIP

提示

下载代码请复制以下命令到终端执行

为确保你提交的代码身份被 Gitee 正确识别,请执行以下命令完成配置

git config --global user.name userName 
git config --global user.email userEmail

初次使用 SSH 协议进行代码克隆、推送等操作时,需按下述提示完成 SSH 配置

1 生成 RSA 密钥

2 获取 RSA 公钥内容,并配置到 SSH公钥中

在 Gitee 上使用 SVN,请访问使用指南

使用 HTTPS 协议时,命令行会出现如下账号密码验证步骤。基于安全考虑,Gitee 建议配置并使用私人令牌替代登录密码进行克隆、推送等操作

Username for 'https://gitee.com': userName

Password for 'https://userName@gitee.com': # 私人令牌

分支 1

标签 0

python-learn

learn-thread.py

learn-thread.py 2.91 KB

from threading import Thread
from Queue import Queue
import random, time
from bs4 import BeautifulSoup
import os, sys, urllib2
import urllib2,os,socket
import thread

'''
 date: 2014年03月07日 20:50:15
 url: http://www.dbmeizi.com
 desc: using mulitithreading download pictures from dbmeizi.com
 email: withfaker@gmail.com
'''

queue = Queue()
pic_path = os.path.join(os.curdir, "images")

class ProducerThread(Thread):
 def run(self):
 page_loop()

class ConsumerThread(Thread):
 def run(self):
 while True:
 if queue.empty():
 thread.exit()
 url = queue.get()
 queue.task_done()
 fetch(url)

def page_loop(page=0):
 url = 'http://www.dbmeizi.com/?p=%s' % page
 try:
 content = urllib2.urlopen(url)
 soup = BeautifulSoup(content)
 except:
 print "internal error:[%s]" % url
 page_loop(int(page)+1)

my_girl = soup.find_all('img')
 if my_girl == []:
 print 'finished!'
 sys.exit(0)
 #print "BEGIN TO FETCH PAGE:[%s]" % page
 for girl in my_girl:
 link = girl.get('src')
 flink = 'http:' + link
 queue.put(flink)
 page = int(page) + 1
 page_loop(page)

#fetch pictures
def fetch(url):
 print "url:[%s]" % url
 p = os.path.join(os.curdir, pic_path, url[-11:])
 if os.path.isfile(p):
 st = os.stat(p)
 if st.st_size > 0:
 print "file[%s] is already exists." % url[-11:]
 return
 else:
 print "file[%s] exists. but size is too small." % url[-11:]
 req = urllib2.Request(url)
 req.add_header('Accept','text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,*/*;q=0.8')
 req.add_header('Accept-Encoding','gzip,deflate,sdch')
 req.add_header('Accept-Language','zh-CN,zh;q=0.8,en;q=0.6')
 req.add_header('Cache-Control','max-age=0')
 req.add_header('Connection','keep-alive')
 req.add_header('Referer','https://www.dbmeizi.com')
 req.add_header('User-Agent','Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/32.0.1660.0 Safari/537.36')
 try:
 resp = urllib2.urlopen(req)
 except:
 print "internal error:[%s]" % url
 return
 f = open(p, 'wb')
 f.write(resp.read())
 f.close()
 resp.close()
 #print "fetch url done.[%s]" % url

if __name__ == '__main__':
 if not os.path.isdir(pic_path):
 os.mkdir(pic_path)
 ProducerThread(name="Producer1").start()
 ConsumerThread(name="Consumer1").start()
 ConsumerThread(name="Consumer2").start()
 ConsumerThread(name="Consumer3").start()
 ConsumerThread(name="Consumer4").start()
 ConsumerThread(name="Consumer5").start()
 #ConsumerThread(name="Consumer6").start()
 #ConsumerThread(name="Consumer7").start()
 #ConsumerThread(name="Consumer8").start()
 #ConsumerThread(name="Consumer9").start()
 #ConsumerThread(name="Consumer10").start()

一键复制编辑原始数据按行查看历史

faker 提交于 2014年04月15日 00:08 +08:00 . thread fetch

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97

from threading import Thread
from Queue import Queue
import random, time
from bs4 import BeautifulSoup
import os, sys, urllib2
import urllib2,os,socket
import thread


'''
 date: 2014年03月07日 20:50:15
 url: http://www.dbmeizi.com
 desc: using mulitithreading download pictures from dbmeizi.com
 email: withfaker@gmail.com
'''

queue = Queue()
pic_path = os.path.join(os.curdir, "images")

class ProducerThread(Thread):
 def run(self):
 page_loop()

class ConsumerThread(Thread):
 def run(self):
 while True:
 if queue.empty():
 thread.exit()
 url = queue.get()
 queue.task_done()
 fetch(url) 

def page_loop(page=0):
 url = 'http://www.dbmeizi.com/?p=%s' % page
 try:
 content = urllib2.urlopen(url)
 soup = BeautifulSoup(content)
 except:
 print "internal error:[%s]" % url
 page_loop(int(page)+1)

 my_girl = soup.find_all('img')
 if my_girl == []:
 print 'finished!'
 sys.exit(0)
 #print "BEGIN TO FETCH PAGE:[%s]" % page
 for girl in my_girl:
 link = girl.get('src')
 flink = 'http:' + link
 queue.put(flink)
 page = int(page) + 1
 page_loop(page)

#fetch pictures
def fetch(url):
 print "url:[%s]" % url
 p = os.path.join(os.curdir, pic_path, url[-11:])
 if os.path.isfile(p):
 st = os.stat(p)
 if st.st_size > 0:
 print "file[%s] is already exists." % url[-11:]
 return
 else:
 print "file[%s] exists. but size is too small." % url[-11:]
 req = urllib2.Request(url)
 req.add_header('Accept','text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,*/*;q=0.8')
 req.add_header('Accept-Encoding','gzip,deflate,sdch')
 req.add_header('Accept-Language','zh-CN,zh;q=0.8,en;q=0.6')
 req.add_header('Cache-Control','max-age=0')
 req.add_header('Connection','keep-alive')
 req.add_header('Referer','https://www.dbmeizi.com')
 req.add_header('User-Agent','Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/32.0.1660.0 Safari/537.36')
 try:
 resp = urllib2.urlopen(req)
 except:
 print "internal error:[%s]" % url
 return
 f = open(p, 'wb')
 f.write(resp.read())
 f.close()
 resp.close()
 #print "fetch url done.[%s]" % url

if __name__ == '__main__':
 if not os.path.isdir(pic_path):
 os.mkdir(pic_path)
 ProducerThread(name="Producer1").start()
 ConsumerThread(name="Consumer1").start()
 ConsumerThread(name="Consumer2").start()
 ConsumerThread(name="Consumer3").start()
 ConsumerThread(name="Consumer4").start()
 ConsumerThread(name="Consumer5").start()
 #ConsumerThread(name="Consumer6").start()
 #ConsumerThread(name="Consumer7").start()
 #ConsumerThread(name="Consumer8").start()
 #ConsumerThread(name="Consumer9").start()
 #ConsumerThread(name="Consumer10").start()

误判申诉

此处可能存在不合适展示的内容,页面不予展示。您可通过相关编辑功能自查并修改。

如您确认内容无涉及不当用语 / 纯广告导流 / 暴力 / 低俗色情 / 侵权 / 盗版 / 虚假 / 无价值内容或违法国家有关法律法规的内容,可点击提交进行申诉,我们将尽快为您处理。

取消

提交

简介

deepseek 多轮对话,人脸检测及特征提取,个人AI助理,音频实时监听,opencv获取摄像头视频截图;Python基础编程示例:Excel读写追加处理,XML解析、JSON解析、FLV与MP4转换,PyQT界面应用程序开发示例等,https证书到期检测,糗百爬虫,pdf和图片互相转换,socket使用,百度OCR调用例子,IP及端口快速扫描。

暂无标签

https://gitee.com/mktime

使用 MIT 开源许可协议

0 Stars

1 Watching

265 Forks

取消