2018年08月16日-string rune byte 的关系
ihujian · · 1242 次点击 · · 开始浏览在Go语言中string 底层是用byte数组存储的,并且是不可以改变的
例如 s:="Go编程" fmt.Println(len(s))输出结果应该是8因为中文字符是用3个字节存的。
len(string(rune('编')))的结果是3
如果想要获得我们想要的情况的话,需要先转换为rune切片再使用内置的len函数fmt.Println(len([]rune(s)))结果就是4了。
所以用string存储unicode的话,如果有中文,按下标是访问不到的,因为你只能得到一个byte。 要想访问中文的话,还是要用rune切片,这样就能按下表访问。
rune在golang 中是int32 的别名,被用来区分字符值和整数值。通过上述例子可以将rune理解为一个可以表示unicode 编码的值int 的值,称为码点(code point)。只不过go语言把这个码点抽象为rune。
有疑问加站长微信联系(非本文作者)
入群交流(和以上内容无关):加入Go大咖交流群,或添加微信:liuxiaoyan-s 备注:入群;或加QQ群:692541889
关注微信- 请尽量让自己的回复能够对别人有帮助
- 支持 Markdown 格式, **粗体**、~~删除线~~、
`单行代码` - 支持 @ 本站用户;支持表情(输入 : 提示),见 Emoji cheat sheet
- 图片支持拖拽、截图粘贴等方式上传
收入到我管理的专栏 新建专栏
在Go语言中string 底层是用byte数组存储的,并且是不可以改变的
例如 s:="Go编程" fmt.Println(len(s))输出结果应该是8因为中文字符是用3个字节存的。
len(string(rune('编')))的结果是3
如果想要获得我们想要的情况的话,需要先转换为rune切片再使用内置的len函数fmt.Println(len([]rune(s)))结果就是4了。
所以用string存储unicode的话,如果有中文,按下标是访问不到的,因为你只能得到一个byte。 要想访问中文的话,还是要用rune切片,这样就能按下表访问。
rune在golang 中是int32 的别名,被用来区分字符值和整数值。通过上述例子可以将rune理解为一个可以表示unicode 编码的值int 的值,称为码点(code point)。只不过go语言把这个码点抽象为rune。