clickhouse 导出CSV时遇到双引号的问题
helloGlobal · · 4408 次点击 · · 开始浏览背景:从clickhouse中导出CSV文件,然后将此文件保存到另一个表中,发现保存的内容包含双引号 "XXXX"
导致匹配不上
查clickhose 文档,在生成CSV时,字符串中的双引号会以两个双引号输出,除此之外没有其他规则来做字符转义了
而代码解析CSV时,没有使用 golang 自带的CSV包,而是自己解析的
r := bytes.NewReader(fileStream)
bufioreader := bufio.NewReader(r)
isFirstLine :=true
line,err := bufioreader.ReadBytes('\n')
iferr != nil || io.EOF == err {
break
}
line = bytes.TrimRight(line,"\r\n")
ifisFirstLine {
line = bytes.TrimPrefix(line,[]byte("\xef\xbb\xbf"))
}
columns := bytes.Split(line,[]byte{','})
这样就没有兼容到 双引号的情况
查看源码 encoding\csv\reader.go,发现其兼容了字符串含有双引号和不含双引号的情况
func(r *Reader)readRecord(dst []string) ([]string,error)
暂时解决方案:
clickhouse-client --query=" select member from test format CSV" sed 's/"//g'> test.csv
参考文档:https://clickhouse.yandex/docs/zh/interfaces/formats/#csv
有疑问加站长微信联系(非本文作者)
入群交流(和以上内容无关):加入Go大咖交流群,或添加微信:liuxiaoyan-s 备注:入群;或加QQ群:692541889
关注微信- 请尽量让自己的回复能够对别人有帮助
- 支持 Markdown 格式, **粗体**、~~删除线~~、
`单行代码` - 支持 @ 本站用户;支持表情(输入 : 提示),见 Emoji cheat sheet
- 图片支持拖拽、截图粘贴等方式上传
收入到我管理的专栏 新建专栏
背景:从clickhouse中导出CSV文件,然后将此文件保存到另一个表中,发现保存的内容包含双引号 "XXXX"
导致匹配不上
查clickhose 文档,在生成CSV时,字符串中的双引号会以两个双引号输出,除此之外没有其他规则来做字符转义了
而代码解析CSV时,没有使用 golang 自带的CSV包,而是自己解析的
r := bytes.NewReader(fileStream)
bufioreader := bufio.NewReader(r)
isFirstLine :=true
line,err := bufioreader.ReadBytes('\n')
iferr != nil || io.EOF == err {
break
}
line = bytes.TrimRight(line,"\r\n")
ifisFirstLine {
line = bytes.TrimPrefix(line,[]byte("\xef\xbb\xbf"))
}
columns := bytes.Split(line,[]byte{','})
这样就没有兼容到 双引号的情况
查看源码 encoding\csv\reader.go,发现其兼容了字符串含有双引号和不含双引号的情况
func(r *Reader)readRecord(dst []string) ([]string,error)
暂时解决方案:
clickhouse-client --query=" select member from test format CSV" sed 's/"//g'> test.csv
参考文档:https://clickhouse.yandex/docs/zh/interfaces/formats/#csv