Crossin的编程教室

标题: 使用minidom来解析xml, 无法得到属性, 元素的xml也只显示结束... [打印本页]

作者: anyone    时间: 2022-6-24 00:10
标题: 使用minidom来解析xml, 无法得到属性, 元素的xml也只显示结束...
我有一段非常简单的xml, 想尝试获得元素的属性值.

testing.xml代码如下:
  1. <?xml version="1.0" encoding="UTF-8" ?>
  2. <catalog>
  3.    <aa value="first">this is the 1st.</aa>
  4.    <aa value="second">this is the 2nd.</aa>
  5. </catalog>
复制代码
用来解析的python代码如下, 我在其中做了结果标记:
  1. from xml.dom import minidom


  2. with minidom.parse('c:/desktop/testing.xml') as dom:
  3.     elements = dom.getElementsByTagName('aa')      

  4. print(f'There are {len(elements)} items')                    # 这个能正确的获得元素的数量

  5. print(elements[1])                                                   # 这个能打印类似这样的元素内存值: <DOM Element: aa at 0x2c864d264c0>
  6. print(elements[1].nodeType)                                     # 这个结果是1, 应该是element node
  7. print(elements[1].toprettyxml(encoding='utf-8'))         # 这个结果是b'<aa/>\n', 按理说是应该显示<aa value="second">this is the 2nd.</aa>
  8. print(elements[1].attributes['value'].value)                 # 这个提示是 error, KeyError 'value', 照理说应该是显示 second?
复制代码
我也查找了相关指引, 比如: https://stackoverflow.com/a/1912516/3127293, 我几乎是原样按照这里介绍的方式做的, 但是在我这里就是错误的.

我的环境是 windows + python3.9.10 + VScode

不知我的代码哪里出错了? 如何才能获得xml元素的某个属性的值呢?

作者: crossin先生    时间: 2022-6-24 01:05
这个问题很有意思,我也是查了半天才发现问题:

你这里用了 with 打开,with结束之后文件就被关闭了,相关的元素还没有被读取
所以,要么你把后面的代码缩进一层,全放在with里
要么不要用with语句,就正常parse后并赋值
作者: anyone    时间: 2022-6-24 18:39
恩, 放到with里面就对了. 真是感谢先生.

不过..

> 你这里用了 with 打开,with结束之后文件就被关闭了,相关的元素还没有被读取

如果with缩进的语句完成后就被关闭了
那为什么在缩进之外的 print(f'There are {len(elements)} items')   这个语句能读出正确的元素数量呢?

抱歉我基础知识不扎实,
盲点太多了, 希望先生能点拨一下.

感谢.


作者: crossin先生    时间: 2022-6-24 22:23
具体它这里的实现机制我没有深入了解
有可能它这里是一个引用,引用还是在的,但是引用对应的对象被关闭了,所以数量是对的,但要访问具体的值就拿不到了





欢迎光临 Crossin的编程教室 (https://bbs.crossincode.com/) Powered by Discuz! X2.5