xml中字符实体和字符数据的深入分析
字符实体在了解字符实体之前,让我们了解XML实体是什么。
W3联盟定义的实体:文档实体是实体树的根元素的XML处理器的出发点。
这意味着实体是XML中的占位符。它们可以在文档序或DTD中声明。实体具有不同的类型,字符实体将在本章后面讨论。
HTML和XML有一些保留使用的符号,它们不能作为XML代码中的内容。例如,一个符号用作XML标记的开始和结束。
键盘输入不能直接使用某些特殊字符或符号,可以使用字符实体显示这些符号或特殊字符。
字符实体类型
有三种类型的字符实体:
预定义字符实体。
编码字符实体。
命名字符实体。
预定义的字符实体
他们避免了使用某些模棱两可的符号。例如,当我们把小于()括号(<>)符号使用时会产生歧义。字符实体基本上是用于定义XML标签。以下是从XML规范预定义字符实体名单。他们可以用来表示某些字符无歧义。
数字和数量:
单引号:
大于:
小于:<
双引号:
数字字符实体
数字引用用于表示字符实体,数字参考可以是十进制或十六进制格式,因为成千上万的数字引用难以记住它们。数字引用是用Unicode字符集中字符的编码数字表示的。
十进制数字参考基本语法:
xml代码将内容复制到剪贴板。
#十进制数;
十六位数字是指基本的语法:
xml代码将内容复制到剪贴板。
# X进制数;
下表列出了一些预定义的字符实体及其相应的值:
实体名称
性格
十进制的参考
十六基准参考
quot
# 34;
# X22;
AMP
# 38;
# X26;
APOS
'
# 39;
# X27;
书信电报
# 60;
# x3c;
GT
>
# 62;
# x3e;
指定的字符实体
如上所述,数字字符很难记住,最流行的字符实体类型是命名字符实体,因为每个实体都用名称来标识。
例如:
aacute'represents大写有重的注意特征。
ugrave'represents小写u与沉没的注意。
CDATA片断
这个词是data.cdata CDATA字符被定义为一个文本块,不会被解析器解析的,但它是公认的一个标签。
在标签如LT的预定义实体;gt;腺苷;需要手动输入往往难以阅读。在这种情况下,你可以使用CDATA片断。通过使用CDATA片断,我们可以告诉解析器的文档的特定部分不包含标签,而应被视为普通的文本。
语法
以下是CDATA片断语法:
xml代码将内容复制到剪贴板。
<!{一{
字符标记
} } >
上面的语法由三部分组成:
一开始部分CDATA始于9字符分隔符<!{一{。
最后一部分是一对} } >分隔符-最后。
CDATA部分人物的两个标记之间被解释为相反的标签字符。这部分可以包含标记的字符(和),但他们是由XML处理程序忽略。
样品
下面的代码显示的字符写在CDATA。CDATA片断被解析器忽略。
xml代码将内容复制到剪贴板。
<!{一{
欢迎tutorialspoint
编辑>
在上面的语法中,它们之间的所有内容将被视为字符数据而不是标记。
我的规则
XML CDATA需要遵循以下规则:
任何位置的CDATA的XML文档可以包含} } >字符。
CDATA片断不能嵌套。