云计算开发学习笔记:Python3编码

  • 来源:网络
  • 更新日期:2020-06-01

摘要:关于Python3的编码类型是怎样的,首先我们需要明白的是计算机只能识别0、1这种二进制的信息。Python3默认编码为Unicode,由str类型进行表示,二进制数据使用byte类型表示。 Pytho

关于Python3的编码类型是怎样的,首先我们需要明白的是计算机只能识别0、1这种二进制的信息。Python3默认编码为Unicode,由str类型进行表示,二进制数据使用byte类型表示。

Python3编码类型

关于各种编码类型,目前的文字编码标准主要有 ASCII、GB2312、GBK、Unicode等。ASCII 编码是最简单的西文编码方案。GB2312、GBK、GB18030 是汉字字符编码方案的国家标准。ISO/IEC 10646 和 Unicode 都是全球字符编码的国际标准 。Python3默认编码为Unicode。

Python3编码转换

Python3中文本字符串str和字节字符串是严格区分的

编码(encode):将Unicode字符串(中的代码点)转换特定字符编码对应的字节串的过程和规则

解码(decode):将特定字符编码的字节串转换为对应的Unicode字符串(中的代码点)的过程和规则

encode:str -->; bytes

decode:bytes -->; str

举例:

输出的结果:

总结: Python2中编码默认使用的Ascii, Python3中编码默认使用的utf-8; 在Windows终端编码为gbk,Linux是utf-8。 Windows系统下,无论是Python还是其他默认保存与读取为gbk格式,除非在保存时指定编码方式,encoding=utf8。

新网箭头云服务器