贝利信息

Python3的URL解析库urlparse

日期:2025-12-04 00:00 / 作者:冷漠man
Python 3 中 urlparse 模块已移至 urllib.parse,需用 from urllib.parse import urlparse 等;核心函数包括 urlparse() 解析 URL、parse_qs()/parse_qsl() 处理查询参数、urlunparse()/urljoin() 构造 URL、quote()/unquote() 编解码。

Python 3 中的 urlparse 模块已重命名并整合进 urllib.parse,不再是独立模块。直接导入 urlparse 会报错(ModuleNotFoundError),正确用法是导入 urllib.parse 下的对应函数。

核心函数:urlparse()

用于将 URL 字符串拆解为结构化对象(ParseResult),包含 scheme、netloc、path、params、query、fragment 六个属性。

解析查询参数:parse_qs() 和 parse_qsl()

专门处理 URL 中的 query 部分(?key=value&key2=value2)。

构造与拼接 URL:urlunparse() 和 urljoin()

反向操作:从部件组装 URL,或基于 base URL 补全相对路径。

编码与解码:quote()、unquote()、quote_plus()、unquote_plus()

处理 URL 中的非 ASCII 或特殊字符(如空格、中文、符号)。

基本上就这些。日常使用中,urlparseparse_qsurljoinquote 是最常调用的几个工具,记住模块位置和基本行为就能覆盖绝大多数 URL 处理场景。