python字符编码

ASCII编码1个字节(8个比特位)

中文已经超出ASCII的编码范围,使用ASCII出现乱码问题

Unicode编码2个字节(16个比特位)--标准还在发展

可以解决乱码问题,但用Unicode编码比ASCII编码需要多一倍的存储空间

UTF8(把Unicode编码转化为"可变长编码")

UTF-8编码把一个Unicode字符根据不同的数字大小编码成1-6个字节,
常用的英文字母被编码成1个字节,汉字通常是3个字节,只有很生僻的字符才会被编码成4-6个字节。
如果你要传输的文本包含大量英文字符,用UTF-8编码就能节省空间

在计算机内存中,统一使用Unicode编码,当需要保存到硬盘或者需要传输的时候,就转换为UTF-8编码