yafeilinux 发表于 2017-8-16 23:47:07

第27篇 Qt5之XML(一)使用DOM读取XML文档


版权声明该文章原创于Qt开源社区(www.qter.org),作者yafeilinux,转载请注明出处!

导语
XML(ExtensibleMarkup Language,可扩展标记语言),是一种类似于HTML的标记语言,但它的设计目的是用来传输数据,而不是显示数据。XML的标签没有被预定义,用户需要在使用时自行进行定义。XML是W3C(万维网联盟)的推荐标准。相对于数据库表格的二维表示,XML使用的树形结构更能表现出数据的包含关系,作为一种文本文件格式,XML简单明了的特性使得它在信息存储和描述领域非常流行。       在Qt中提供了Qt XML模块来进行XML文档的处理,这里主要提供了两种解析方法: DOM方法,可以进行读写;SAX方法,可以进行读取。从Qt 5开始,Qt XML模块不再进行维护,而是推荐使用Qt Core模块中基于流的方法,分别使用QXmlStreamReader和QXmlStreamWriter进行读取和写入。这一节我们先来讲解一下DOM的方法。要在项目中使用Qt XML模块,需要在项目文件(.pro文件)中添加QT += xml一行代码。

环境:Windows 7 + Qt 5.8.0(包含Qt Creator 4.2.1)


目录一、XML文档示例二、使用DOM读取XML文档内容



正文
一、XML文档示例
下面是一个规范的XML文档:

<?xml version="1.0"encoding="UTF-8"?>
<library>
   <book id="01">
       <title>Qt</title>
       <author>shiming</author>
   </book>
   <book id="02">
       <title>Linux</title>
       <author>yafei</author>
   </book>
</library>


每个XML文档都由XML说明(或者称为XML序言)开始,它是对XML文档处理的环境和要求的说明,比如这里的<?xmlversion="1.0" encoding="UTF-8"?>,其中xml version=“1.0”,表明使用的XML版本号,这里字母是区分大小写的;encoding=“UTF-8”是使用的编码,指出文档是使用何种字符集建立的,默认值为Unicode编码。XML文档内容由多个元素组成,一个元素由起始标签<标签名>和终止标签</标签名>以及两个标签之间的内容组成,而文档中第一个元素被称为根元素,比如这里的<library></library>,XML文档必须有且只有一个根元素。元素的名称是区分大小写的,元素还可以嵌套,比如这里的library、book、title和author等都是元素。元素可以包含属性,用来描述元素的相关信息,属性名和属性值在元素的起始标签中给出,格式为<元素名 属性名=“属性值”>,如<book id=“01”>,属性值必须在单引号或者双引号中。在元素中可以包含子元素,也可以只包含文本内容,比如这里的<title>Qt</title>中的Qt就是文本内容。

二、使用DOM读取XML文档内容
Dom(Document Object Model,即文档对象模型)把XML文档转换成应用程序可以遍历的树形结构,这样便可以随机访问其中的节点。它的缺点是需要将整个XML文档读入内存,消耗内存较多。在Qt中使用QDomProcessingInstruction类来表示XML说明,元素对应QDomElement类,属性对应QDomAttr类,文本内容由QDomText类表示。所有的DOM节点,比如这里的说明、元素、属性和文本等,都使用QDomNode来表示,然后使用对应的isProcessingInstruction()、isElement()、isAttr()和isText()等函数来判断是否是该类型的元素,如果是,那么就可以使用toProcessingInstruction()、toElement()、toAttr()和toText()等函数转换为具体的节点类型。       下面来看一个例子,将读取前面介绍的XML文档的内容。
1.新建Qt控制台应用QtConsole Application,项目名称为mydom。
2.完成后打开mydom.pro项目文件,将第一行代码更改为:
QT       += core xml
       然后保存该文件。
3.打开main.cpp文件,更改内容如下:#include <QCoreApplication>
#include <QtXml>

int main(int argc, char *argv[])
{
    QCoreApplication a(argc, argv);
   
    // 新建QDomDocument类对象,它代表一个XML文档
    QDomDocument doc;
    // 建立指向“my.xml”文件的QFile对象
    QFile file("my.xml");
    // 以只读方式打开
    if (!file.open(QIODevice::ReadOnly)) return 0;
    // 将文件内容读到doc中
    if (!doc.setContent(&file)) { file.close(); return 0; }
    // 关闭文件
    file.close();
    // 获得doc的第一个节点,即XML说明
    QDomNode firstNode = doc.firstChild();
    // 输出XML说明
    qDebug() << firstNode.nodeName()
             << firstNode.nodeValue();
   
    return a.exec();
}


4.然后先点击一下Qt Creator左下角的锤子图标来构建项目,这样会在源码目录旁生成构建目录,比如这里是build-mydom-Desktop_Qt_5_8_0_MinGW_32bit-Debug,我们进入该目录,然后新建一个文本文档,如下图所示。

       下面将其文件名更改为my.xml,注意一定要更改扩展名,一些电脑中扩展名可能自动隐藏了,可以去“工具→文件夹选项→查看”中修改。提示信息选择“是”即可。如下图所示。

       更改完成后使用记事本打开my.xml文件,然后将前面的xml文档内容添加进去,保存退出即可。如下图所示。



5.现在运行程序,效果如下图所示。

       如果大家不愿意看到字符串两边的引号,可以将源码中得qDebug()语句更改如下:
qDebug() << qPrintable(firstNode.nodeName())             << qPrintable(firstNode.nodeValue());
       运行程序,效果如下图所示。


6.下面在main()函数的return a.exec();一行代码前继续添加如下代码:

QDomElement docElem = doc.documentElement();//返回根元素
QDomNode n = docElem.firstChild();   //返回根节点的第一个子节点
//如果节点不为空
while(!n.isNull())
{
   if (n.isElement())//如果节点是元素
   {
      QDomElement e = n.toElement();//将其转换为元素
      qDebug() << qPrintable(e.tagName())   //返回元素标记
         << qPrintable(e.attribute("id"));//返回元素id属性的值
    }
      n = n.nextSibling();//下一个兄弟节点
}

这里使用了firstChild()函数和nextSibling()函数,然后利用while()循环来实现对所有子元素的遍历。运行程序,效果如下图所示。



7.下面更改源码中得if()语句的内容,输出所有子节点的内容:
if (n.isElement())//如果节点是元素
{
    QDomElement e = n.toElement();
    qDebug() << qPrintable(e.tagName())
            << qPrintable(e.attribute("id"));
    // 获得元素e的所有子节点的列表
    QDomNodeList list = e.childNodes();
    // 遍历该列表
    for(int i=0; i<list.count(); i++)
    {
       QDomNode node = list.at(i);
       if(node.isElement())
         qDebug() << "   " << qPrintable(node.toElement().tagName())
                           <<qPrintable(node.toElement().text());
    }
}

这里使用了childNodes()函数获得了元素所有子节点的列表,然后通过遍历这个列表实现了遍历其所有子元素。运行程序,效果如下图所示。



结语
通过上面的例子,我们实现了对一个XML文档的读取。可以看到,在QDom中,是将整个XML文件读到内存中的doc对象中的。然后使用节点(QDomNode )操作doc对象,像XML说明、元素、属性、文本等等都被看做是节点,这样就使得操作XML文档变得很简单,我们只需通过转换函数将节点转换成相应的类型,如:QDomElement e =n.toElement();在下一节我们将讲述XML文件的创建和写入。


源码下载:
返回主目录


kangyang94 发表于 2017-8-31 22:01:49

firstchild那部分,我的qt读取不到<?xml version="1.0"encoding="UTF-8"?>,屏幕无显示。
删除这一行后,可以读到library

yafeilinux 发表于 2017-8-31 22:24:07

kangyang94 发表于 2017-8-31 22:01
firstchild那部分,我的qt读取不到,屏幕无显示。
删除这一行后,可以读到library ...

下载源码试试。

kangyang94 发表于 2017-9-1 10:34:24

yafeilinux 发表于 2017-8-31 22:24
下载源码试试。

源码也是无法读取<?xml version="1.0"encoding="UTF-8"?>这一行

yafeilinux 发表于 2017-9-4 21:11:00

kangyang94 发表于 2017-9-1 10:34
源码也是无法读取这一行

你是不是xml文件有问题,试试这个吧

咸鱼不是雨 发表于 2017-9-29 10:02:38

<?xml version="1.0"encoding="UTF-8"?>
少了个空格 <?xml version="1.0" encoding="UTF-8"?>
1.0 和enconding之间要有个空格不然读不出来

yafeilinux 发表于 2017-10-9 23:10:00

咸鱼不是雨 发表于 2017-9-29 10:02
少了个空格
1.0 和enconding之间要有个空格不然读不出来

嗯。本来有的,发帖的时候消失了。
页: [1]
查看完整版本: 第27篇 Qt5之XML(一)使用DOM读取XML文档