preserveWhiteSpace=true | preserveWhiteSpace=true | preserveWhiteSpace=false | preserveWhiteSpace=false |
xml:space=preserve | xml:space=default | xml:space=preserve | xml:space=default |
保留 | 保留 | 保留 | 保留并截斷 |
preserveWhiteSpace = false when the document is loaded
preserveWhiteSpace=true | preserveWhiteSpace=true | preserveWhiteSpace=false | preserveWhiteSpace=false |
xml:space=preserve | xml:space=default | xml:space=preserve | xml:space=default |
半保留 | 半保留并截斷 | 半保留 | 半保留并截斷 |
此處的保留表示和原始 XML 文檔中完全相同的原始文本內容,截斷意味著前導和尾部空格已經(jīng)刪除,半保留意味著保留了“重要的空白字符”并規(guī)范化了“不重要的空白字符”。重要的空白字符是文本內容內部的空白字符。不重要的空白字符是標記之間的空白字符,請看如下所示:
\n
\t Jane\n
\tSmith \n
在本示例中,紅色是可以忽略的不重要的空白字符,而綠色是重要的空白字符,因為它是文本內容的一部分,因此有不可忽略的重要含義。所以在本例中,文本屬性返回下列結果:
狀態(tài) 返回值
保留 "\n\t Jane\n\tSmith \n"
保留并截斷 "Jane\n\tSmith"
半保留 " Jane Smith "
半保留并截斷 "Jane Smith"
請注意“半保留”將規(guī)范化不重要的空白字符,例如,新行和 tab 字符將退化為單個空格。如果更改 xml:space 屬性和 preserveWhiteSpace 開關,那么文本屬性將返回相應的不同值。
CDATA and xml:space="preserve" subtree boundaries
在下面的例子中,CDATA 節(jié)點或“保留”節(jié)點的內容將得到連接,原因是它們不參與不重要的空白字符規(guī)范化。例如:
\n
\t Jane \n
\t Smith ]>\n
在這種情況下,CDATA 節(jié)點內部的空白字符不再與“不重要”空白字符“合并”,并且不會截斷。因此“半保留并截斷”情況將返回下列內容:
"Jane Smith "
在此, 和 標記之間的不重要的空白字符將包括在內,與 CDATA 節(jié)點的內容無關。如果用下列內容代替 CDATA,那么將返回相同結果:
Smith
實體是特殊的
實體是作為 DTD 的一部分加載和分析的,并且顯示在 DOCTYPE 節(jié)點下。它們不一定要有任何 xml:space 范圍。例如:
Jane \n
\t\n
">
]>
Jane;
假定 preserveWhiteSpace=false(在 DOCTYPE 標記范圍內),在分析實體時不重要的空白字符丟失。實體將不會有空白字符節(jié)點。樹將類似于:
DOCTYPE foo
ENTITY: Jane
ELEMENT: employee
ELEMENT: name
TEXT: Jane
ELEMENT: title
TEXT>:Software Design Engineer
ELEMENT: foo
ATTRIBUTE: xml:space="preserve"
ENTITYREF: Jane
請注意,在 DOCTYPE 內部 ENTITY 節(jié)點下顯露的 DOM 樹不包含任何 WHITESPACE 節(jié)點。這意味著 ENTITYREF 節(jié)點的子節(jié)點也沒有 WHITESPACE 節(jié)點,即使實體引用在 xml:space="preserve" 的范圍內也是這樣。
給定文檔中引用的每個 ENTITY 的實例通常都有相同的樹。
如果實體必須絕對保留空白字符,那么它必須在自己內部指定自己的 xml:space 屬性,或者文檔 preserveWhiteSpace 開關必須設置為 true。
如何處理屬性中的空白字符?
有幾種方式可以訪問屬性值。IXMLDOMAttribute 接口有 nodeValue 屬性,它等價于作為 Microsoft 擴展的 nodeValue 和 text 屬性。這些屬性返回: 屬性 返回的文本
attrNode.nodeValue
attrNode.value
getAttribute("name") 返回和原始文檔中完全相同的內容(和擴展的實體)。
attrNode.nodeTypedValue Null
attrNode.text 除了前導和尾部的空白字符已經(jīng)截斷之外,其他與 nodeValue 相同。
“XML 語言”規(guī)范為 XML 應用程序定義了下列行為: 屬性類型 返回的文本
CDATA ID、IDREF、IDREFS、ENTITY、ENTITIES、NOTATION、枚舉
半規(guī)范化 全規(guī)范化
在此半規(guī)范化代表將新行和 tab 字符轉換為空格,但是多個空格不會退化為一個空格。