Технология XSLT — страница 38 из 66

Несмотря на то, что XSLT-процессоры должны лишь только преобразовывать логические модели документов, организованные в виде деревьев, многие из них имеют также возможность выдавать результат преобразования в виде последовательности символов.
Элемент xsl:output
Синтаксис этого элемента приведен ниже:
 method = "xml" | "html" | "text" | "имя"
 version = "токен"
 encoding = "строка"
 omit-xml-declaration = "yes" | "no"
 standalone = "yes" | "no"
 doctype-public = "строка"
 doctype-system = "строка"
 cdata-section-elements = "имена"
 indent = "yes" | "no"
 media-type = "строка"/>
Элемент верхнего уровня 
xsl:output
 позволяет указывать, каким образом должно быть выведено результирующее дерево.
Главным атрибутом элемента 
xsl:output
 является атрибут method
, который определяет, какой метод должен использоваться для вывода документа. Значением этого атрибута может быть любое имя, но при этом техническая рекомендация XSLT определяет только три стандартных метода вывода — "xml"
, "html"
 и "text"
. В том случае, если процессор поддерживает нестандартный метод вывода, его реализация полностью зависит от производителя.
Если в преобразовании не определен элемент 
xsl:output
 или в нем не указан атрибут method
, метод преобразования выбирается по умолчанию исходя из следующих условий.
□ Если корень выходящего документа имеет дочерний элемент с локальным именем "
html
" (в любом регистре символов), которому предшествуют только пробельные символы, методом вывода по умолчанию становится "html
".
□ Во всех остальных случаях методом вывода по умолчанию является 
"xml"
.
Пример
Для документа
XSL Transformations (XSLT)
XSL Transformations (XSLT)
Version 1.0
Методом вывода по умолчанию будет 
"html"
, а для документа
XSL Transformations (XSLT)
Version 1.0
будет выбран метод вывода 
"xml"
.
Помимо главного атрибута 
method
, элемент xsl:output
 имеет следующие атрибуты:
□
version
 (версия) — определяет версию языка выходящего документа;
□
indent
 (индентация) — определяет, должен ли процессор добавлять пробельные символы для более наглядного форматирования документа;
□
encoding
 (кодировка) — определяет, в какой кодировке должен быть выведен документ. Значение этого атрибута не зависит от регистра символов, то есть значения encoding="utf-8"
 и encoding="UtF-8"
 будут эквивалентны. В атрибуте encoding
 можно использовать только печатаемые символы ASCII, то есть символы интервала от #x21
 до #x7e
. Значением encoding
 должно быть название набора символов, определенное в стандартах IANA (Internet Assigned Numbers Authority) или RFC2278. В противном случае, атрибут должен начинаться символами "x-
";
□
media-type
 — определяет тип содержимого MIME выходящего документа;
□
doctype-system
 — определяет системный идентификатор, который должен быть использован в декларации типа документа (DTD);
□
doctype-public
 — определяет публичный идентификатор, который должен быть использован в декларации типа документа (DTD);
□
omit-xml-declaration
 (пропустить декларацию XML) — определяет, нужно ли включать декларацию XML в выходящий документ или нет. Значением этого атрибута должно быть либо "yes"
 (пропустить декларацию), либо "no"
 (включить декларацию в выходящий документ);
□
standalone
 (самостоятельный документ) — определяет, должен ли процессор выводить указание на самостоятельность документа (standalone declaration). Значением этого атрибута может быть либо "yes"
 (выводить указание), либо "no"
 (не выводить указание на самостоятельность);
□
cdata-section-elements
 — определяет список элементов, текстовое содержимое которых должно быть выведено с использованием секций CDATA.
Использование этих атрибутов зависит от того, какой из методов выбран для вывода преобразованного документа.
Метод вывода "xml"
Для того чтобы вывести результирующее дерево в виде XML-документа, следует использовать в элементе 
xsl:output
 метод "xml"
. Ниже мы подробно опишем, каким образом на выход должны влиять другие атрибуты этого элемента.
Атрибут version
Этот атрибут определяет версию языка XML, которая должна использоваться для вывода результирующего документа. В случае если процессор не поддерживает указанную версию, он может либо выдать ошибку, либо использовать одну из поддерживаемых версий. На данный момент единственной действующей версией языка является версия 1.0 и потому, если в атрибуте в 
version
 будет указано другое значение, единственным эффектом от этого будет измененный параметр version
 в декларации XML.
Пример
Предположим, что в преобразовании версия выходящего документа задана как 1.2:
Тогда процессор может вывести декларацию XML в следующем виде:
Значением атрибута version по умолчанию является 
"1.0"
, то есть, для того, чтобы получить декларацию XML вида
и т. д. ?>
достаточно опустить определение атрибута 
version
:
Атрибут encoding
Атрибут 
encoding
 указывает на то, какая кодировка предпочтительна для выходящего документа. Множество кодировок зависит от используемого процессора, но при этом в соответствии с технической рекомендацией все они обязаны поддерживать Unicode-формы кодировок UTF-8 и UTF-16.
В случае если процессор не поддерживает кодировку, указанную в атрибуте 
encoding
, процессор может либо выдать ошибку, либо использовать UTF-8 или UTF-16.
Если атрибут 
encoding
 опущен, процессор должен по умолчанию использовать UTF-8 или UTF-16. На практике абсолютное большинство процессоров используют по умолчанию кодировку UTF-8.
При выводе содержимого выходящего документа может возникнуть ситуация, когда в выходящем потоке будут находиться символы, которые невозможно будет отобразить при используемой кодировке. В этом случае непечатаемые символы должны быть заменены символьными сущностями.
Пример
Представим себе входящий документ в кодировке UTF-8, содержащий символ кириллицы "
Э
" с Unicode-кодом #x42d
 (или #1069
 в десятичной системе счисления):
Э
Если преобразование будет использовать для вывода кодировку, которая не может отображать символы кириллического алфавита, например ISO-8859-1, то символ "
Э
" в выходящем документе должен быть заменен символьной сущностью.
Листинг 8.36. Преобразование
 version="1.0"
 xmlns:xsl="http://www.w3.org/1999/XSL/Transform">

  method="xml"
  encoding="ISO-8859-1"
  indent="yes"/>


Листинг 8.37. Выходящий документ
Э
Вместе с тем синтаксис XML не разрешает использовать символьные сущности в именах элементов и атрибутов, и наличие в них символов, не отображаемых кодировкой вывода, будет являться ошибкой. Если в предыдущем примере документ будет иметь вид
<страница>Э
то вывести результирующее дерево в кодировке ISO-8859-1 будет невозможно.
Атрибут indent
Индентацией называют форматирование исходного текста, не влияющее на семантику, но облегчающее читаемость. К примеру, один и тот же XML-документ можно написать как
<В><С/><С><В>
или
Очевидно, что второй случай гораздо легче для понимания, поскольку в нем легко можно видеть принадлежность элементов одного другому. Подобное форматирование можно использовать и при выводе преобразованного документа при помощи атрибута 
indent
 элемента xsl:output
. Если этот атрибут имеет значение "yes"
, процессор может добавить один или несколько пробельных символов или символов перевода строки — в зависимости от реализации. Как правило, каждый дочерний элемент помещают на новой строке, добавляя впереди два пробела на каждый уровень вложенности.
Пример
Листинг 8.38. Входящий документ
Листинг 8.39. Преобразование
 version="1.0"
 xmlns:xsl="http://www.w3.org/1999/XSL/Transform">



Листинг 8.40. Выходящий документ
Следует быть осторожными при использовании 
indent="yes"
 там, где в содержимом документа могут встречаться значащие пробелы. Индентация позволяет процессору при выводе документа добавлять пробельные символы по собственному усмотрению. В случаях, когда при последующей обработке преобразованного документа пробельные символы могут быть восприняты неадекватно, лучше индентацию не использовать.
Атрибут cdata-section-elements
Для того чтобы вывести текстовое содержимое некоторых элементов в виде секций CDATA, XSLT предлагает простой механизм — следует лишь перечислить в атрибуте 
cdata-section-elements
 элемента xsl:output
 элементы, которые на выходе должны содержать секции символьных данных.
Пример
Листинг 8.41. Входящий документ
<br/>
Листинг 8.42. Преобразование
 version="1.0"
 xmlns:xsl="http://www.w3.org/1999/XSL/Transform">

  indent="yes"
  cdata-section-elements="page"/>


Листинг 8.43. Выходящий документ
]]>
В соответствии с синтаксисом XML, секции CDATA не могут содержать последовательности символов "
]]>
". Потому, встретив такую комбинацию в тексте элемента, имя которого включено в cdata-section-elements
, процессор заменит ее двумя секциями CDATA. Одна будет содержать "]]
", вторая – ">
".
Пример
Листинг 8.44. Входящий документ
]]>
<!-- Comment -->
Листинг 8.45. Преобразование
 version="1.0"
 xmlns:xsl="http://www.w3.org/1999/XSL/Transform">

 indent="yes"
 cdata-section-elements="data pre"/>


Листинг 8.46. Выходящий документ
]]>
]]>
Атрибут doctype-system
Для определения логической структуры документов в XML используются DTD — определения типов документов. В большинстве случаев определения типов содержатся во внешних ресурсах, которые включаются в документ в виде системных или публичных идентификаторов.
XSLT позволяет создавать ссылки на внешние определения типов при помощи атрибута 
doctype-system
 элемента xsl:output
.
Пример
Предположим, что мы создаем документ, логическая схема которого определена во внешнем файле по адресу 
"/dtds/document.dtd"
. Тогда, определив в преобразовании элемент xsl:output
 с атрибутом doctype-system
, равным "/dtds/document.dtd"
, мы получим в выходящем документе определение типа в виде
элемент SYSTEM "/dtds/document.dtd">
где 
элемент
 — первый элемент выходящего документа.
Листинг 8.47. Входящий документ
 content 
Листинг 8.48. Преобразование
 version="1.0"
 xmlns:xsl="http://www.w3.org/1999/XSL/Transform">

Листинг 8.49. Выходящий документ
 content 
Атрибут doctype-public
Если в преобразовании атрибутом 
doctype-system
 элемента xsl:output
 задано внешнее определение логического типа документа, это определение может быть расширено также и публичным идентификатором. Публичный идентификатор указывается в атрибуте doctype-public
 элемента xsl:output
. Его использование может быть продемонстрировано следующим примером.
Листинг 8.50. Входящий документ
 content 
Листинг 8.51. Преобразование
 version="1.0"
 xmlns:xsl="http://www.w3.org/1999/XSL/Transform">

  doctype-system="/dtds/document.dtd"
  doctype-public="-//Document//Description" />


Листинг 8.52. Выходящий документ
 PUBLIC "-//Document//Description" "/dtds/document.dtd">
 content 
Атрибут media-type
Атрибут 
media-type
 позволяет задавать медиа-тип содержимого выходящего документа. Для метода вывода "xml"
 значением media-type
 по умолчанию является "text/xml"
. Несмотря на то, что media-type
 не оказывает никакого влияния на содержимое самого документа, XSLT-процессоры, используемые на стороне сервера, могут в зависимости от значения этого атрибута изменять MIME-тип исходящих данных при использовании, к примеру, такого протокола, как HTTP.
Атрибут omit-xml-declaration
XML-документы, в принципе, могут быть корректными и без декларации XML. Поэтому XSLT позволяет опускать эту декларацию в выходящем документе, для чего значению атрибута 
omit-xml-declaration
 должно быть присвоено "yes"
:
 omit-xml-declaration="yes"/>
В случае если значение атрибута 
omit-xml-declaration
 опущено или не равно "yes"
, процессор будет выводить в выходящем документе декларацию XML, которая включает информацию о версии (по умолчанию "1.0"
) и кодировке документа (по умолчанию "utf-8"
 или "utf-16"
 в зависимости от процессора).
Атрибут standalone
Для того чтобы объявить документ как самостоятельный или несамостоятельный (standalone или non-standalone соответственно), следует использовать атрибут 
standalone
 элемента xsl:output
. Если этот атрибут будет присутствовать в xsl:output
, то процессор включит в декларацию XML объявление standalone
 с соответствующим значением. Если атрибут standalone
 не указан, объявление standalone
 в декларацию XML выходящего документа включено не будет.
Метод вывода "html"
В нынешнем состоянии языки XML и HTML сильно похожи синтаксически, но при этом имеют некоторые довольно весомые различия. Метод вывода 
"html"
 используется для того, чтобы выводить документы в формате, который будет понятен большинству существующих на данный момент Web-браузеров.
Одно из основных различий HTML и XML состоит в том, что в XML пустые элементы имеют формат 
<имя/>
, в то время как в HTML тот же элемент был бы выведен, как <имя>
 — без косой черты. Метод вывода "html"
 учитывает эти различия и выводит теги пустых элементов HTML без косой черты после имени. В соответствии с технической рекомендацией языка HTML 4.0, пустыми элементами являются area
, base
, basefont
, br
, col
, frame
, hr
, img
, input
, isindex
, link
, meta
 и param
.
Пример
Листинг 8.53. Входящий документ
I'm just a simple page...
I've got a simple content
Листинг 8.54. Преобразование
  version="1.0"
  xmlns:xsl="http://www.w3.org/1999/XSL/Transform">


</code></pre></p><p><pre><code><xsl:value-of select="title"/></code></pre></p><p><pre><code>
    Welcome!
    Be our guest! 

Листинг 8.55. Выходящий документ
I'm just a simple page...
  Welcome!
  Be our guest! 
  I've got a simple content
Как можно заметить, метод вывода 
"html"
 распознает элементы HTML вне зависимости от регистра символов — в нашем примере пустой элемент 
 был выведен как 
, что соответствует синтаксису HTML.
Документы, которые преобразуются в HTML, могут также иметь программы, определенные внутри элемента 
script
 или стили, заданные внутри элемента style
. В случае если внутри этих элементов оказываются символы, считающиеся в XML специальными — такие как "<
", "&
" и так далее, процессор не должен заменять их символьными или встроенными сущностями.
Пример
Предположим, что в преобразуемом документе элемент 
script
 определен с использованием специальных символов, которые заменены сущностями:
или с использованием секций символьных данных:
При использовании метода вывода 
"html"
 оба варианта будут выведены, как
Пожалуй, стоит еще раз повторить, что это относится только к элементам 
style
 и script
. Специальные символы, использованные в других элементах, будут заменены символьными или встроенными сущностями.
Пример
This >o< is a black hole of this page!
будет выведено как
This >o< is a black hole of this page!
В соответствии со спецификацией, некоторые атрибуты в HTML могут и не иметь значений — как правило, это атрибуты с булевыми значениями, такие, к примеру, как атрибут 
selected
 элемента option
, присутствие которого в элементе означает то, что опция выбрана, отсутствие — то, что она не выбрана. Для того чтобы получить в выходящем документе
следует в преобразовании указывать
то есть присваивать булевому атрибуту значение, равное собственному имени. Такие значения будут выведены в минимизированной форме, как это и требовалось.
HTML и XML также имеют небольшие различия в формате вывода инструкций по обработке. В то время как в XML эти инструкции имеют вид
приложение содержимое?>
в HTML инструкции по обработке заканчиваются не "
?>
", а просто правой угловой скобкой (">
"):
приложение содержимое>
Таким образом, результатом выполнения кода
content
при использовании метода XML будет
а при использовании метода HTML
Атрибут version
Атрибут 
version
 элемента xsl:output
 в методе "html"
 обозначает версию языка HTML, которая должна использоваться в выходящем документе. По умолчанию значением этого атрибута является "4.0"
, что означает соответствие выходящего документа спецификации языка HTML версии 4.0. Отметим, что последней версией языка HTML на момент написания этой книги является версия 4.02, однако отличия между этими версиями незначительны.
Атрибут encoding
Кодировка выходящего документа определяется в HTML несколько иначе, чем в XML. Если в XML мы использовали определение 
encoding
 в декларации XML, то в HTML кодировка описывается в элементе meta
 следующим образом:
 content="text/html; charset=windows-1251">
...
Поэтому, если в выходящем документе внутри корневого элемента 
html
 присутствует элемент head
, процессор должен добавить в него элемент meta с соответствующим определением кодировки.
Пример
Элемент
добавит в элемент 
head
 выходящего HTML-документа элемент meta
 в следующем виде:
 content="text/html; charset=ISO-8859-1">
Таким образом, для определения кодировки выходящего HTML-документа не следует вручную создавать соответствующий элемент 
meta
 — нужно просто указать требуемую кодировку в атрибуте encoding
 элемента xsl:output
.
Атрибут indent
XSLT позволяет использовать в HTML документах индентацию точно так же, как мы бы использовали ее в методе 
"xml"
.
Атрибуты doctype-system и doctype-public
Декларация типа документа с внешними системными или публичными идентификаторами может быть использована в HTML точно так же, как в XML. Поскольку в объявлении типа документа после 
 должно стоять имя корневого элемента, при методе вывода "html"
 этим именем будет "HTML"
 или "html"
 в зависимости от регистра символов имени корневого элемента документа.
Атрибут media-type
Атрибут 
media-type
 определяет медиа-тип содержимого выходящего документа. Для HTML-документов значением media-type
 по умолчанию будет "text/html"
.
Метод вывода "text"
XSLT позволяет выводить результат преобразования как простой текст. При использовании 
method="text"
 результирующее дерево приводится к строке, то есть в этом случае результатом преобразования будет строковое сложение всех текстовых узлов дерева.
Пример
Входящий документ
My heart's in the Highlands
My heart is not here
одним и тем же шаблоном:

при использовании метода вывода 
"xml"
 будет преобразован к виду
 My heart's in the Highlands
 My heart is not here
а при использовании метода 
"text"
 к виду
My heart's in the Highlands
My heart is not here
Атрибут encoding
Атрибут 
encoding
 указывает на предпочтительную кодировку вывода текста документа. Значение атрибута encoding
 по умолчанию зависит от программной платформы, на которой производится преобразование. В большинстве процессоров по умолчанию используются кодировки UTF-8, ASCII и ISO-8859-1.
В случае если кодировка, используемая для вывода текста, не отображает некоторые символы документа, процессор может выдать ошибку.
Атрибут media-type
По умолчанию в качестве значения атрибута 
media-type
, используемого для простого текста, указывается "text/plain"
. Значение атрибута media-type
 может быть использовано сервером, преобразующим документ в качестве MIME-типа.
Другие методы вывода
Как уже было сказано раньше, спецификация XSLT позволяет помимо основных методов 
"xml"
, "html"
 и "text"
 использовать также и другие методы, реализация которых будет зависеть от производителя того или иного процессора. Кажется вполне логичной и закономерной возможность использования, к примеру, такого метода, как "pdf"
 для создания документов в Adobe Portable Document Format (переносимом формате документов) или метода "bin"
 для создания двоичного потока данных. Однако, на данном этапе, процесс сериализации (создания физической сущности из логической модели) пока еще не определен в общем виде для произвольного метода. Возможно, в будущем, по аналогии с объектной моделью документа (DOM) будут созданы схожие интерфейсы для более легкого определения методов сериализации и интеграции преобразований в другие программы, но в настоящее время следует ограничиваться тремя основными методами.
Отметим также, что спецификация языка XSLT определяет функциональность элемента 
xsl:output
 как возможную, но не обязательную. Процессоры обязаны манипулировать логическими моделями XML-документов, но при этом они не обязаны поддерживать сериализацию и уметь выводить преобразованный XML-документ как последовательность байт. Конечно же, абсолютное большинство процессоров поддерживает такую возможность, но при всем том она остается не более чем возможностью.
Поэтому из соображений переносимости можно лишь только надеяться, что документ будет выведен так, как было задумано. Не следует исключать возможности, что в определённых условиях процессор не сможет контролировать процесс вывода документа.
Типичным примером такой ситуации может быть использование процессора совместно с другими компонентами, которые обмениваются с процессором документами в виде DOM-структур, но сами загружают и выводят документы. В этом примере компоненты, занимающиеся выводом преобразованного документа, могут спокойным образом игнорировать все то, что было указано в элементе 
xsl:output
 или в атрибутах disable-output-escaping
 других элементов преобразования. Более того, они даже не будут знать, что было там указано, поскольку эти значения не касаются процесса преобразования как такового — они относятся к выводу, контролировать который процессор в данном случае не может.
Отсюда следует однозначный вывод: не нужно чересчур злоупотреблять возможностями 
xsl:output
 и disable-output-escaping
.
Замена специальных символов
Как мы уже знаем, в XML есть несколько специальных символов, которые, как правило, заменяются процессором при выводе документа на соответствующие символьные или встроенные сущности. К примеру, для того, чтобы вывод был корректным XML-документом, процессор обязан заменять символы "
<
" и "&
" на встроенные (<
 и &
) или символьные (<
 и &
) сущности.
Между тем довольно часто бывает необходимым выводить в выходящем документе символы разметки.
Пример
Пусть входящий документ содержит описание товара, заданное в секции CDATA:
An elephant
big and grey animal!]]>
Если мы будем преобразовывать этот документ с использованием шаблона


то в выходящем документе специальные символы будут заменены:
An elephant

This is a <em>big</em> and <b>grey</b> animal!
Для того чтобы избежать замены, можно воспользоваться атрибутом 
disable-output-escaping
 (отменить замену символов) элементов xsl:value-of
 и xsl:text. Этот атрибут может принимать значения "yes"
 и "no"
 ("no" — значение по умолчанию). Значение "yes"
 означает, что процессор при выводе текста, создаваемого xsl:text
 или xsl:value-of
 не должен заменять специальные символы. Если бы в предыдущем примере мы использовали преобразование.
Листинг 8.56. Преобразование, содержащее disable-output-escaping
 xmlns:xsl="http://www.w3.org/1999/XSL/Transform">





то на выходе мы бы получили документ
An elephant

This is a big and grey animal!
Атрибут 
disable-output-escaping
 налагает ряд ограничений на использование текстовых узлов, генерируемых элементами xsl:text
 и xsl:value-of
: эти узлы не могут входить в качестве текстового содержимого в узлы атрибутов, комментариев или инструкций по обработке. Кроме того, дерево, содержащее текстовые узлы, для которых была отменена замена специальных символов, не может быть приведено к строке или числу. И в том и в другом случае процессор может либо выдать ошибку преобразования, либо проигнорировать отмену замены специальных символов.
Атрибут 
disable-output-escaping
 имеет также и более концептуальное ограничение. Процессор сможет отменить замену символов только в том случае, когда он сам будет контролировать процесс вывода. Как мы уже обсуждали в предыдущем разделе, ситуации, когда процесс вывода не будет выполняться самим процессором, не такая уж и редкость. Поэтому следует использовать disable-output-escaping
 только в тех случаях, когда другой альтернативы нет или когда имеется полная уверенность, что этот метод будет работать.
Атрибут 
disable-output-escaping
 работает с методами вывода "xml"
 и "html"
, но не оказывает никакого влияния на метод "text"
, поскольку при этом методе все специальные символы и так выводятся без замены.
Кодировки в XSLT-преобразованиях
Несмотря на то, что в логических деревьях, которыми манипулирует XSLT, текстовые узлы представляются в кодировке Unicode, очень часто в обрабатываемых документах бывает необходимо использовать также другие кодировки. К примеру, большинство русскоязычных документов хранятся в кодировках Windows-1251 и KOI8-R.
Если внимательно присмотреться к преобразованиям, можно заметить, что, как правило, в них участвуют минимум три документа — входящий (преобразовываемый) документ, документ преобразования (преобразующий) и выходящий (преобразованный документ). Соответственно, каждый из них может иметь собственную кодировку.
Кодировка входящего документа указывается в его xml-декларации. Например, документы в кодировке Windows-1251 должны иметь xml-декларацию вида
Возможно, небольшим сюрпризом окажется то, что в соответствии со стандартом XML, имена тегов вовсе не обязаны состоять исключительно из латинских букв. В имени элемента можно использовать весь кириллический алфавит, а также множество других символов. Совершенно корректным будет документ
<страница>
<содержимое/>
Аналогичным образом кириллицу, а также другие наборы символов и алфавиты можно использовать и в самих преобразованиях, поскольку те в свою очередь также являются XML-документами.
Пример
Листинг 8.57. Входящий документ
<каждый>
<охотник>
<желает>
<знать>
<где>
<сидит>
<фазан/>
Листинг 8.58. Преобразование
 version="1.0"
 xmlns:xsl="http://www.w3.org/1999/XSL/Transform">

<редкий>

<рыболов>

<может>
<забыть>

<как>

<плавает>

<щука>
Листинг 8.59. Выходящий документ
<редкий>
<рыболов>
<может>
<забыть>
<как>
<плавает>
<щука/>
Напомним, что кодировка выходящего документа определяется атрибутом 
encoding
 элемента xsl:output
 и не зависит от кодировок преобразования и обрабатываемых документов. Например, можно легко создать преобразование, которое будет изменять кодировку входящего документа. Это будет идентичное преобразование с элементом xsl:output
, определяющим целевой набор символов.
Листинг 8.60. Преобразование, изменяющее кодировку документа на KOI8-R
 xmlns:xsl="http://www.w3.org/1999/XSL/Transform">
Как можно видеть, XSLT довольно гибко поддерживает кодировки — входящие и выходящие документы, а также сами преобразования могут иметь разные наборы символов. Единственным ограничением является множество кодировок, поддерживаемое самим процессором, вернее парсером, который он использует для разбора входящих документов, и сериализатором, который служит для создания физического экземпляра выходящего документа.
Практически во всех процессорах поддерживаются кодировки UTF-8, US- ASCII и ISO-8859-1, но далеко не все могут работать с Windows-1251 или KOI8-R. Поэтому, создавая документы и преобразования в нестандартных кодировках, мы заведомо ограничиваем переносимость решений. В случаях, когда XML/XSLT приложения создаются под конкретный процессор с заведомо известными возможностями, это не является большой проблемой, однако в тех случаях, когда требуется универсальность или точно не известно, каким процессором будет производиться обработка, единственным выходом будет использовать UTF-8 — как во входящих документах, так и в самих преобразованиях.
Случай нескол

Предыдущая Стр. 38 из 66 Следующая

Связь с администрацией Обработка персональных данных Оглавление К карточке книги Предисловие О чем эта книга? Для кого эта книга? Как работать с книгой? Структура книги Глава 1. Введение в XML Глава 2. Введение в XSLT Глава 3. Идея и модель языка XSLT Глава 4. Структура преобразования Глава 5. Шаблонные правила Глава 6. XPath-выражения Глава 7. Основные элементы XSLT Глава 8. Дополнительные элементы и функции языка XSLT Глава 9. Использование XSLT совместно с другими языками программирования Глава 10. Расширения языка XSLT Глава 11. Готовые решения Глава 12. Развитие технологий Приложение 1. Обзор XSLT-процессоров Приложение 2. Краткий справочник элементов и атрибутов XSLT Приложение 3. Краткий справочник функций XSLT и XPath Приложение 4. Интернет-ресурсы, посвященные XSLT Соглашения Расширенная форма Бэкуса-Наура Обозначения Благодарности Глава 1 Введение в XML Что такое XML? Разметка документов XML снаружи и изнутри Конструкции XML Элемент Атрибут Инструкция по обработке Секции СDATA Комментарии (comments) Пространства имён Расширенные имена Структура XML-документа Декларация типа документа (DTD) Определение элемента Определение списка атрибутов Определение сущности Определение нотации Символьные данные в XML-документах Использование Unicode Коды некоторых символов Unicode Базовые продукции XML XML-документы с точки зрения спецификации Использование технологии XML SAX-парсеры DOM-парсеры Основные классы задач XML Создание новых языков Хранение данных Обмен данными и проекты интеграции Краткая история XML Глава 2 Введение в XSLT Документ = Данные + Структура XSLT как язык Отсутствие "побочных" эффектов Расширения Преобразования снаружи Области применения XSLT XSLT в архитектуре клиент-сервер XSLT на стороне сервера XSLT на стороне клиента XSLT в Web-решениях XSLT при обмене данными История XSLT Глава 3 Идея и модель языка XSLT Модель XML-документа Деревья Узлы дерева XML-документа Корневой узел Узлы элементов Узлы атрибутов Текстовые узлы Узлы пространств имен Узлы инструкций по обработке Узел комментария Сводная таблица характеристик узлов Ограничения модели XML-документа Порядок просмотра документа Типы данных Булевый тип (boolean) Численный тип (number) Строковый тип (string) Множество узлов (node-set) Результирующий фрагмент дерева (result tree fragment) Таблица преобразования типов Переменные Выражения Виды выражений Пути выборки Фильтрующие выражения Объединение множеств Арифметические операции Операции сравнения Логические операции Функции Контекст вычисления выражений Модель преобразования Контекст преобразования Выполнение преобразования Глава 4 Структура преобразования Пространство имен XSLT Корневые элементы преобразования Элементы xsl:stylesheet и xsl:transform Упрощенные преобразования Модульная организация преобразования Включение преобразований Элемент xsl:include Импорт преобразований Элемент xsl:import Порядок импорта Использование сущностей для разбивки на модули Совместное использование преобразований и XML-документов Ассоциация преобразования с XML-документом Объединение документа и преобразования Включение преобразования в документ Включение документа в преобразование Литеральные элементы результата Атрибуты языка XSLT в литеральных элементах Шаблоны значений атрибутов Глава 5 Шаблонные правила Преобразование как набор правил Определение шаблонного правила Элемент xsl:template Вызов шаблонных правил Элемент xsl:apply-templates Режимы Именованные шаблоны Элемент xsl:call-template Встроенные шаблоны Идентичное преобразование Разрешение конфликтов в шаблонах Элемент xsl:apply-imports Тело шаблона Переменные и параметры Элемент xsl:variable Область видимости переменных Использование переменных Параметры Элемент xsl:param Область видимости параметров Элемент xsl:with-param Глава 6 XPath-выражения Выражения для XML-документов Контекст вычисления выражений Пути выборки Шаги выборки Оси навигации Тесты узлов Предикаты Сокращенный синтаксис Примеры путей выборки Паттерны Семантика паттернов Примеры паттернов Выражения Переменные Операции с булевыми значениями Операции с числами Арифметические операции Операции сравнения Операции с множествами узлов Фильтрация Использование в выражениях путей выборки Объединение множеств Старшинство операций Функции Булевые функции Функция boolean Функция not Функции true и false Функция lang Числовые функции Функция number Функция sum Функции floor и ceiling Функция round Строковые функции Функция string Функция concat Функция starts-with Функция contains Функция substring-before Функция substring-after Функция substring Функция string-length Функция normalize-space Функция translate Функции множеств узлов Функции last и position Функция count Функции local-name , namespace-uri и name Функция id Базовые продукции XPath Разбор XPath-выражений Глава 7 Основные элементы XSLT Основные и дополнительные элементы Создание узлов элементов Элемент xsl:element Создание узлов атрибутов Элемент xsl:attribute Именованные наборы атрибутов Элемент xsl:attribute-set Атрибут xsl:use-attribute-sets Создание текстовых узлов Элемент xsl:text Элемент xsl:value-of Создание узлов комментариев и инструкций по обработке Элемент xsl:comment Элемент xsl:processing-instruction Копирование узлов Элемент xsl:copy Элемент xsl:copy-of Условная обработка Элемент xsl:if Элементы xsl:choose, xsl:when, xsl:otherwise Циклическая обработка Элемент xsl:for-each Глава 8 Дополнительные элементы и функции языка XSLT Дополнительные элементы и функции Обработка пробельных символов Элементы xsl:preserve-space и xsl:strip-space Сообщения процессора Элемент xsl:message Сортировка Элемент xsl:s ort Псевдонимы пространств имен Элемент xsl:namespace-alias Ключи Элемент xsl:key Функция key Определение множества ключей Использование нескольких ключей в одном преобразовании Использование нескольких определений од ного ключа Использование множеств узлов в функции key Использование ключей в нескольких документах Составные ключи Функция key в паттернах Нумерация Элемент xsl:number Вычисление номеров Форматирование номеров Форматирование чисел Функция format-number Элемент xsl:decimal-format Контроль вывода документа Элемент xsl:output Метод вывода "xml" Метод вывода "html" Метод вывода "text" Другие методы вывода Замена специальных символов Кодировки в XSLT-преобразованиях Случай нескол ьких входящих документов Функция document Вызов document(string) Вызов document(node-set) Вызов document(string, node-set) Вызов document(node-set, node-set) Другие дополнительные функции XSLT Функция current Функция unparsed-entity-uri Функция generate-id Функция system-property Глава 9 Совместное использование XSLT с другими языками программирования XSLT и другие языки Выполнение XSLT-преобразований в Object Pascal Импорт MSXML в Delphi Форма проекта Использование DOMDocument Выполнение XSLT-преобразований в C/C++ Настройка путей Использование класса XalanTransformer Выполнение XSLT-преобразований в PHP Страница гостевой книги Выполнение XSLT-преобразований в JavaScript Выполнение XSLT-преобразований в VBScript/ASP Выполнение XSLT-преобразований в Python Выполнение XSLT-преобразований в PL/SQL Выполнение XSLT-преобразований в Java *** *** Краткие выводы Глава 10 Расширения языка XSLT Что такое расширения? Функции расширения Функция function-available Функция расширения nodeset Элементы расширения Функция element-available Элемент xsl:fallback Инициатива EXSLT Глава 11 Готовые решения Группировка Перечисление узлов Именованный шаблон как функция Рекурсия Циклы Цикл while Цикл for Метод Пиза для for-цикла Операции над множествами Перенос строк и элементы BR Данные, разделенные запятыми (CSV) Глава 12 Развитие технологий Отличия XSLT 1.1 от XSLT 1.0 Отсутствие result tree fragment Несколько выходящих документов Дополнительные возможности по расширению "Внешние" типы данных Стандартные интерфейсы расширений Другие изменения Отличия XSLT 2.0 от XSLT 1.1 Изменения в XPath 2.0 Выбор шаблонов для элементов пространства имен, определенного по умолчанию Средства для форматирования даты и времени Функции id и key на внешних документах Включение неразбираемых внешних сущностей в виде текста Использование именованных сущностей вместо кодов символов Обращение ссылок по ID / IDREF Другие требования Приложение 1 Обзор XSLT-процессоров Популярность XSLT-процессоров Производительность XSLT-процессоров Библиотека Microsoft XML Parser Использование Расширения Процессор Xalan Использование Расширения Процессор Saxon Использование Расширения Библиотека Oracle XDK Использование Расширения Процессор Sablotron Использование Процессор xt Использование Расширения Библиотека libxslt Использование Расширения Приложение 2 Краткий справочник элементов и атрибутов XSLT Об означения Элементы *** Атрибуты Приложение 3 Краткий справочник функций XSLT и XPath Обозначения Функции Приложение 4 Интернет-ресурсы, посвященные XSLT Зарубежные интернет-ресурсы по XSLT Русскоязычные ресурсы Технические рекомендации и стандарты Переводы стандартов на русский язык Другие ресурсы Списки рассылки Электронные конференции Список литературы