Golang 的字符串(string)是合法的 UTF-8 序列,这就涉及到了两种不同的遍历方式,一种是按照 Unicode 的 codepoint 遍历,另一种是把 string 视为 []byte,按照字节遍历。
s是UTF-8 序列,所以在相同字符个数下,字节数不固定。s[0]是byte类型,固定1个字节。
golang代码如下:
package main
import "fmt"
func main() {
s := "我爱福大大fdd"
//Unicode 的 codepoint 遍历
fmt.Println("Unicode 的 codepoint 遍历")
for i, r := range s {
fmt.Printf("%v:0x%x,%T\r\n", i, r, r)
}
fmt.Println("---------")
//字节遍历
fmt.Println("字节遍历")
for i := 0; i < len(s); i++ {
b := s[i]
fmt.Printf("%v:0x%x,%T\r\n", i, b, b)
}
}
执行结果如下: