贝利信息

Python3编码类型有哪些?怎么转换?

日期:2025-12-01 00:00 / 作者:冷漠man
Python3中str为Unicode字符串,bytes为字节序列,通过encode和decode方法按UTF-8等编码规则相互转换,文件读写和网络传输时需注意模式与编码一致性。

Python3 中主要涉及的编码类型是字符串(str)和字节(bytes),它们之间的转换依赖于字符编码规则,如 UTF-8、ASCII、GBK 等。理解这两类数据类型及其转换方式对处理文本和网络传输非常重要。

1. Python3 中的两种核心类型

str:表示 Unicode 字符串,用于存储人类可读的文本。所有字符串在 Python3 中默认就是 str 类型,使用 Unicode 编码。

bytes:表示原始的字节序列,用于存储二进制数据或在网络中传输的数据。

例如:

2. str 和 bytes 的相互转换

转换需要指定具体的编码格式,常用的是 UTF-8。

str 转 bytes(编码)

bytes 转 str(解码)

3. 常见问题与注意事项

4. 实用转换示例

将中文字符串转为 UTF-8 字节再还原:

text = "Python编程"
data = text.encode("utf-8")     # str → bytes
print(data)                     # b'...'
recovered = data.decode("utf-8") # bytes → str
print(recovered)                # 输出:Python编程

处理 GBK 编码的旧数据:

gbk_bytes = "你好".encode("gbk")
text = gbk_bytes.decode("gbk")

基本上就这些,掌握 encode 和 decode,明确 str 和 bytes 的区别,就能应对大多数编码问题。