Python字节串＂b＂前缀案例_F11 - 专业站长和开发者的学习网站

APP正在开发中...

返回顶部

分享到

Python字节串＂b＂前缀案例

python 来源：互联网作者：佚名发布时间：2026-02-24 20:54:31 人浏览

摘要

核心结论：前缀b用于创建字节串对象，它以二进制形式存储数据，是Python处理文件I/O、网络通信等底层操作的基石。一、基础定义官方名称：字节串核心功能：表示不可变的二进制数据序列

核心结论：前缀"b"用于创建字节串对象，它以二进制形式存储数据，是Python处理文件I/O、网络通信等底层操作的基石。

一、基础定义

官方名称：字节串

核心功能：表示不可变的二进制数据序列（0-255的整数序列）。

语法形式：在字符串引号前加"b"或"B"

b'hello' # 字节串

b"world" # 同上

B'test' # 同上

二、数据类型特性对比

维度	普通字符串 (str)	字节串
存储内容	Unicode字符	原始字节数据（0-255）
长度单位	字符数	字节数
编码	已经解码，无需编码	需要指定编码才能转为文本
可打印性	直接显示字符	显示转义形式（如b'\xe4\xb8\xad'）
不可变性	不可变	不可变
类型检查	type('') is str	type(b'') is bytes

本质区别示例：

s = '中' # 长度1，包含一个Unicode字符

b = b'\xe4\xb8\xad' # 长度3，包含3个字节（UTF-8编码）

print(len(s)) # 1

print(len(b)) # 3

三、必须使用字节串的三大典型场景

1.文件I/O（二进制模式）

读写图片、音频、视频、压缩文件等非文本文件时，必须用字节串：

with open('image.jpg', 'rb') as f: # 注意'rb'表示二进制读

data = f.read() # 返回bytes对象

with open('copy.jpg', 'wb') as f:

f.write(data)

2.网络通信（socket编程）

网络协议传输的是原始字节流，而非文本：

import socket

sock = socket.socket()

sock.connect(('example.com', 80))

request = b'GET / HTTP/1.1\r\nHost: example.com\r\n\r\n'

sock.sendall(request) # 必须发送bytes

response = sock.recv(4096) # 返回bytes

3.加密与哈希运算

加密算法处理的是二进制数据：

import hashlib

md5 = hashlib.md5()

md5.update(b'secret') # 必须传入bytes

print(md5.hexdigest())

四、语法规则

正确声明方式

b'hello' # 单引号

b"world" # 双引号

b'''multi''' # 三单引号

B"""multi""" # 三双引号

b'\xe4\xb8\xad' # 转义序列

常见错误写法

混合使用编码字符

1 2	b'中文字符' # ? SyntaxError: bytes can only contain ASCII literal b'\xe4\xb8\xad' # ? 正确：用十六进制表示UTF-8编码

字符串拼接错误

1 2	'text' + b'bytes' # ? TypeError: can't concat str to bytes b'text' + b'bytes' # ? 正确

格式化不支持

1	b'hello {}'.format('world') # ? 字节串不支持.format()

五、类型转换方法

str → bytes（编码）

# 方法1：encode()

text = '你好世界'

byte_data = text.encode('utf-8') # b'\xe4\xbd\xa0\xe5\xa5\xbd\xe4\xb8\x96\xe7\x95\x8c'

# 方法2：bytes构造函数

byte_data = bytes(text, 'utf-8')

byte_data = bytes(text, encoding='utf-8')

# 方法3：bytes字面量（仅限ASCII）

byte_data = b'hello'

bytes → str（解码

# 方法1：decode()

text = byte_data.decode('utf-8') # '你好世界'

# 方法2：str构造函数

text = str(byte_data, 'utf-8')

text = str(byte_data, encoding='utf-8')

# 处理解码错误

text = byte_data.decode('utf-8', errors='ignore') # 忽略错误字符

text = byte_data.decode('utf-8', errors='replace') # 用?替换

六、操作限制与替代方案

字节串不支持的字符串操作

b'hello'.upper() # ? 支持（仅ASCII）

b'hello'.lower() # ? 支持（仅ASCII）

b'hello'.strip() # ? 支持

# ? 以下操作不支持或不按预期工作：

b'hello {}'.format('world') # 不支持格式化

b'hello' + 'world' # 不能与str拼接

b'hello'.isalpha() # 非ASCII字符行为不同

替代方案

需要高级字符串操作？先解码

byte_data = b'hello \xe4\xb8\xad'

text = byte_data.decode('utf-8')

text = text.upper() # 使用str的方法

byte_result = text.encode('utf-8')

字节串专用方法

b'hello'.find(b'e') # ? 支持

b'hello'.replace(b'l', b'x') # ? 支持

b'hello'.split(b'e') # ? 支持

b'abc'.hex() # ? 转为十六进制字符串

bytes.fromhex('616263') # ? 从十六进制创建

七、实际应用案例

案例1：二进制文件复制器

def copy_binary_file(src, dst, chunk_size=8192):

"""高效复制二进制文件"""

with open(src, 'rb') as f_src, open(dst, 'wb') as f_dst:

while True:

chunk = f_src.read(chunk_size) # 读取bytes块

if not chunk:

break

f_dst.write(chunk)

# 使用示例

copy_binary_file('original.jpg', 'backup.jpg')

案例2：HTTP请求客户端

import socket

def simple_http_request(host, path='/'):

"""发送简单的HTTP GET请求"""

# 构建HTTP请求（必须是bytes）

request = f"GET {path} HTTP/1.1\r\nHost: {host}\r\n\r\n"

request_bytes = request.encode('utf-8')

sock = socket.socket(socket.AF_INET, socket.SOCK_STREAM)

sock.connect((host, 80))

try:

sock.sendall(request_bytes)

response = b''

while True:

chunk = sock.recv(4096)

if not chunk:

break

response += chunk

# 分离头部和主体

header, _, body = response.partition(b'\r\n\r\n')

print("Response Header:")

print(header.decode('utf-8', errors='ignore'))

return body

finally:

sock.close()

# 使用示例

content = simple_http_request('example.com', '/')

案例3：文件哈希校验工具

import hashlib

def calculate_file_hash(filepath, algorithm='md5'):

"""计算文件的哈希值"""

hash_func = hashlib.new(algorithm)

with open(filepath, 'rb') as f: # 二进制模式读取

while True:

chunk = f.read(8192) # 分块读取bytes

if not chunk:

break

hash_func.update(chunk)

return hash_func.hexdigest()

# 使用示例

print(f"MD5: {calculate_file_hash('document.pdf', 'md5')}")

print(f"SHA256: {calculate_file_hash('document.pdf', 'sha256')}")

关键要点总结

记住黄金法则：涉及二进制数据（文件/网络/加密）时，用bytes；涉及文本处理时，用str
编码解码桥梁：.encode() 将 str 转为 bytes，.decode() 将 bytes 转为 str
错误处理：解码时始终考虑 errors 参数（ignore/replace）
性能考虑：大文件操作时，分块读写bytes更高效

您可能感兴趣的文章 :

原文链接 :

Tag : 前缀(3)

Python字节串＂b＂前缀案例

核心结论：前缀b用于创建字节串对象，它以二进制形式存储数据，是Python处理文件I/O、网络通信等底层操作的基石。一、基础定义官方名
Python中的垃圾回收gc.collect()详细指南

Python中的垃圾回收gc.collect() gc.collect()是 Python 中gc（Garbage Collector，垃圾回收）模块里的一个非常重要的函数。它的主要作用是手动触发 Py
Python使用VSCode+Anaconda+DeepSeek开发软件并打包为e

本文面向Python新手，全程实操无冗余理论，基于VSCode+Anaconda Prompt环境，完成从DeepSeek辅助生成Python代码、调试运行，到最终打包为可双击运
vscode+anaconda搭建python虚拟环境全攻略

在当今数字化时代，Python 作为一种功能强大且易于学习的编程语言，被广泛应用于数据科学、人工智能、Web 开发等众多领域。为了顺利开启
AI对话中的“停止生成”与“重新回答”交互逻辑

在当前的AI应用开发浪潮中，很多从传统Web转型AI的开发者（包括曾经的我）容易陷入一个误区：认为只要调通了LLM的API，把文本渲染到页面
Python中dict与set的实现原理

前言：Python中的高效数据结构在Python的世界里，dict（字典）和set（集合）是两种极其重要且高效的数据结构。它们不仅在日常编程中被广泛
Python利用正则提取字符串中数字的方法

方法1：最简单直接的方法（推荐） 1 2 3 4 5 6 7 8 9 10 11 12 import re text = cn_000858 # 提取所有数字 numbers = re.findall(r\d+, text) print(numbers) # [000858]
python实现PDF文档提取,分割与合并操作

一、PDF提取文字/转图片提取文字和转图片使用的是fitz模块，模块安装： 1 pip install PyMuPDF 提取文字 1 2 3 4 5 6 7 8 9 10 11 12 13 import fitz pdf = f
Python中enumerate函数的巧妙用法

在算法题目中，处理数组（List）、字符串、矩阵等可迭代对象时，同时获取索引和元素值是高频需求比如找目标元素的位置、双指针遍历
Python中的断言机制的介绍

想象你正在开发一个电商系统，有个计算商品折扣的函数。正常情况下，折扣率应该在0到1之间，但某天测试时发现某个商品折扣变成了1.

Python字节串＂b＂前缀案例

一、基础定义

二、数据类型特性对比

三、必须使用字节串的三大典型场景

1.文件I/O（二进制模式）

2.网络通信（socket编程）

3.加密与哈希运算

四、语法规则

正确声明方式

常见错误写法

五、类型转换方法

str → bytes（编码）

bytes → str（解码

六、操作限制与替代方案

字节串不支持的字符串操作

替代方案

七、实际应用案例

案例1：二进制文件复制器

案例2：HTTP请求客户端

案例3：文件哈希校验工具

关键要点总结

您可能感兴趣的文章 :

Python字节串＂b＂前缀案例

Python中的垃圾回收gc.collect()详细指南

Python使用VSCode+Anaconda+DeepSeek开发软件并打包为e

vscode+anaconda搭建python虚拟环境全攻略

AI对话中的“停止生成”与“重新回答”交互逻辑

Python中dict与set的实现原理

Python利用正则提取字符串中数字的方法

python实现PDF文档提取,分割与合并操作

Python中enumerate函数的巧妙用法

Python中的断言机制的介绍

python批量下载抖音视频

利用Pyecharts可视化微信好友的方法

python爬取豆瓣电影TOP250数据

基于tensorflow权重文件的解读

解决Python字典查找报Keyerror的问题