分享
  1. 首页
  2. 文章

Golang的坑之http读取大文件必须读完

Wendal Chen · · 3601 次点击 · · 开始浏览
这是一个创建于 的文章,其中的信息可能已经有所发展或是发生改变。

先上代码

package main
import (
 "fmt"
 "net/http"
)
func main() {
 resp, err := http.Get("http://mirrors.ustc.edu.cn/opensuse/distribution/12.3/iso/openSUSE-12.3-GNOME-Live-i686.iso")
 if err != nil {
 panic(err)
 }
 fmt.Println("Resp code", resp.StatusCode)
 resp.Body.Close() // 注意,这里并不读取resp.Body, 而resp.Body有大概700mb未读取
}

你猜会怎样呢? 卡住了?!

如果你的网速够快,你会发现, 几十秒之后, 程序自动退出了,但如果你很不幸是小水管,你会发现一直卡住...

原因是啥呢?

http包默认会重用连接,重用连接就需要先把前一个连接的数据读完

代码片段(net/http/transfer.go)

func (b *body) Close() error {
 if b.closed {
 return nil
 }
 defer func() {
 b.closed = true
 }()
 if b.hdr == nil && b.closing {
 return nil
 }
 
 if b.res != nil && b.res.requestBodyLimitHit {
 return nil
 }
 // 操,问题就在这了,读完整个body!!
 if _, err := io.Copy(ioutil.Discard, b); err != nil {
 return err
 }
 return nil
}

怎么解决呢?

按上面代码片段的逻辑, 需要提前返回nil,从而避免被读取

 // b.hdr 总是为nil,因为从不设置
 // 那b.closing什么时候为true呢?
 if b.hdr == nil && b.closing {
 return nil
 }

读源码可知, b.closing依赖于transferReader的Close值

而transferReader的Close值, 是根据shouldClose方法判断的

// 这里的header是resp的
func shouldClose(major, minor int, header Header) bool {
 if major < 1 { return true } else if major == 1 && minor == 0 { if !strings.Contains(strings.ToLower(header.Get("Connection")), "keep-alive") { return true } return false } else { // TODO: Should split on commas, toss surrounding white space, // and check each field. if strings.ToLower(header.Get("Connection")) == "close" { header.Del("Connection") return true } } return false } 

由于没法在这些代码之前修改resp的header,所以修改req的header,使服务器总是返回Connection: close

最终代码

package main
import (
 "fmt"
 "net/http"
)
func main() {
 req, _ := http.NewRequest("GET", "http://mirrors.ustc.edu.cn/opensuse/distribution/12.3/iso/openSUSE-12.3-GNOME-Live-i686.iso", nil)
 req.Header.Set("Connection", "close")
 resp, err := http.DefaultClient.Do(req)
 if err != nil {
 panic(err)
 }
 fmt.Println("Resp code", resp.StatusCode)
 resp.Body.Close()
}

一个月没写blog了, 心情欠佳+身体抱恙 ~_~ 哎,多事的3月

2013年4月5号更新

coocood提醒到, go1.1有个新的API来完成这个蛋碎的东西

http.DefaultTransport.(*http.Transport).CancelRequest(req)

如果不是默认的DefaultTransport,就找你自己set的Transport吧


有疑问加站长微信联系(非本文作者)

本文来自:Wendal 随笔

感谢作者:Wendal Chen

查看原文:Golang的坑之http读取大文件必须读完

入群交流(和以上内容无关):加入Go大咖交流群,或添加微信:liuxiaoyan-s 备注:入群;或加QQ群:692541889

关注微信
3601 次点击 ∙ 1 赞
暂无回复
添加一条新回复 (您需要 后才能回复 没有账号 ?)
  • 请尽量让自己的回复能够对别人有帮助
  • 支持 Markdown 格式, **粗体**、~~删除线~~、`单行代码`
  • 支持 @ 本站用户;支持表情(输入 : 提示),见 Emoji cheat sheet
  • 图片支持拖拽、截图粘贴等方式上传

用户登录

没有账号?注册
(追記) (追記ここまで)

今日阅读排行

    加载中
(追記) (追記ここまで)

一周阅读排行

    加载中

关注我

  • 扫码关注领全套学习资料 关注微信公众号
  • 加入 QQ 群:
    • 192706294(已满)
    • 731990104(已满)
    • 798786647(已满)
    • 729884609(已满)
    • 977810755(已满)
    • 815126783(已满)
    • 812540095(已满)
    • 1006366459(已满)
    • 692541889

  • 关注微信公众号
  • 加入微信群:liuxiaoyan-s,备注入群
  • 也欢迎加入知识星球 Go粉丝们(免费)

给该专栏投稿 写篇新文章

每篇文章有总共有 5 次投稿机会

收入到我管理的专栏 新建专栏