什么是XML?
XML(eXtensible Markup Language)是国际标准化组织的标准通用标记语言SGML的子集。由以下规范组成:
可扩展样式语言(eXtensible Sytle Language , XSL)
XML链接语言(XML Linking Language,包括Xpath、Xlink和Xpointer)
XML名称空间(XML Namespace)
在PHP5之前的版本对XML的处理存在很多的问题,例如XML工具之间只具有简单的关联、每个工具不能一起协同工作等,PHP5中的新XML扩展具有下列特点:
能够像一个整体一样协调工作
是一个标准化的XML库:libxml2
完全遵循W3C规范
更有效地处理数据
是你工作中合适的XML工具
HTML和XML区别与联系?
HTML和XML都是SGML的子集,所以他们有很大的相似性。下面是XML相对于HTML具有的独特性:
可扩展性,用以定义需要的新标记。这对于今天的web是很有意义的
结构,用于表示任意复杂程度的数据。从某种意义上说是一个小型的关系数据库
校验,用以检查数据的结构正确性。通过DTD约束可以达到这一目的。
媒体无关性,以多种格式发布内容。网页、手机显示的wml、其他媒体终端的显示等
厂商和平台中立
数据的表示与内容分离(这是与html本质区别,但现在流行的DIV+CSS设计思路与这种近似)
XML的元素区分大小写
任何元素都需要有结束标记
XML只有一个根元素
属性必须加上引号
一个完整的XML长什么样子?
代码如下 | 复制代码 |
形式良好的XML文档须具备下列特征:
每一个元素有一个开始和结束标记
文档有且只有一个根元素,其他的所有元素都是它的子元素
正确的格式化空元素
标记的大小写匹配
正确的嵌套
属性值必须用引号
实体在引用之前必须声明
实体不能循环指向自身
通过DOM生成XML
代码如下 | 复制代码 |
// 创建一个新的文档$dom = new DOMDocument('1.0'); $trachtenberg = $book->appendChild($dom->createElement('author')); |
// 输出完美格式化的XML文档$dom->formatOutput = true;
echo $dom->saveXML();输出内容如下:
代码如下 | 复制代码 |
用PHP解析已经存在的XML文件
常用有三种方式来解析XML文件
对于简单文件采用SimpleXML
对于复杂的XML文件采用DOM扩展来实现
对于大型XML文件采用XMLReader扩展来实现
XML示例文件如下(address-book.xml):
代码如下 | 复制代码 |
|
通过SimpleXML方式:
代码如下 | 复制代码 |
$sx = simplexml_load_file('address-book.xml'); foreach ($sx->person as $person) { print "$firstname_text_value $lastname_text_valuen"; |
}通过DOM扩展:
代码如下 | 复制代码 |
$dom = new DOMDocument; foreach ($dom->getElementsByTagname('person') as $person) { $lastname = $person->getElementsByTagname('lastname'); print "$firstname_text_value $lastname_text_valuen"; |
通过XMLReader扩展:
代码如下 | 复制代码 |
$reader = new XMLReader(); while ($reader->read()) { |
用XPath来查询信息http://www.111com.net
在SimpleXML和DOM扩展中都有XPath
代码如下 | 复制代码 |
//SimpleXml示例 |
//DOM扩展示例
代码如下 | 复制代码 |
$xpath = new DOMXPath($dom); $email = $xpath->query('/address-book/preson/email');验证XML文档是否合法 |
在PHP中,DOM扩展支持基于DTD,XML Schema和RelaxNG的验证,而SimpleXML则只提供了XML Schema验证。
XML内容为UTF-8格式
如果数据来源为其他格式,需要经过编码为UTF-8格式,下面是通过iconv库进行转换的示例
代码如下 | 复制代码 |
$utf_8 = iconv('ISO-8859-1', 'UTF-8', $iso_8859_1); |