

新闻资讯
技术学院ElementTree 的 findall() 处理带命名空间 XML 时必须显式传入 namespaces 参数,命名空间映射需为字典格式,键为 XPath 中使用的前缀(不可为空字符串),值为完整且大小写敏感的 URI;漏传或映射错误将导致查不到元素。
ElementTree 处理带命名空间的 XML 时,findall() 默认不识别命名空间前缀,必须显式传入命名空间映射(namespace map),否则查不到元素。
XML 中像 这样的命名空间,需用字典把前缀和 URI 关联起来:
"ns"),不是 URIns,你字典里写 "x" 也行,只要 XPath 里同步用 "x:book")不能只写 root.findall("ns:book"),得加上 namespaces=ns_map:
ns_map = {"ns": "http://example.com/ns"}
books = root.findall("ns:book", namespaces=ns_map)
漏掉 namespaces=... 参数,ElementTree 就当没命名空间处理,结果为空列表。
如果只想快速匹配所有同名元素,不管命名空间,可用星号通配:
root.findall("{*}book") —— 匹配任意命名空间下的 book
root.findall(".//{*}book") —— 深度查找所有 book
{http://example.com/ns}book 写死完整 URI(省去字典,但可读性差)XML 中若写 (没有前缀),这个叫“默认命名空间”,ElementTree 不会自动把它映射到空字符串 ""。你得在字典中显式指定一个前缀来代表它:
ns_map = {"d": "http://example.co
m/ns"} # 不能用 "" 作键
books = root.findall("d:book", namespaces=ns_map)
空字符串键("")在 ElementTree 中会被忽略,所以必须选个非空前缀代替。
基本上就这些。核心就两点:字典映射写对、调用时别忘传 namespaces=。不复杂但容易忽略。