Технология XSLT — страница 59 из 66

Прежде чем приступить к описанию отличий второй версии XSLT от версии 1.1 (и, соответственно, 1.0), следует сделать одно существенное замечание. Лицензионные соглашения Консорциума W3 не позволяют раскрывать широкой общественности внутренние материалы рабочих групп W3C до того, как они будут официально опубликованы. Потому, строго говоря, все, что будет ниже сказано о версии 2.0 — это не более чем совокупность гипотез, пожеланий и выводов, сделанных на основе спецификации XSLT 1.1 и требований к XSLT 2.0 и XPath 2.0. Эти документы доступны публично.

Изменения в XPath 2.0

Разрабатываемая версия языка XPath, вследствие интеграции с XQuery, очевидно, претерпит серьезные изменения. Новая спецификация уже сейчас разбита на два документа: документ, описывающий модель данных и документ, описывающий функции и операторы. Поэтому на данный момент сложно делать точный прогноз относительно того, что же получится в итоге. Мы ограничимся перечислением основных требований:

□ поддержка группы XML-стандартов: определение модели в терминах XML Information Set, выделение общего синтаксиса и семантики с XQuery 1.0;

□ переопределение операторов сравнения на множествах;

□ определение операторов пересечения и разности множеств;

□ расширение множества агрегатных функций (наподобие

sum
,
count
,
min
,
max
— функций, работающих на множествах);

□ возможность использования выражений, возвращающих множества узлов в качестве шагов выборки, например

/a/(b|c)/d
вместо
/а/b/d | /a/c/d
;

□ введение оператора аналогичного оператору

?
в Java и С (выражение
a ? b : с
, где
а
имеет булевый тип, возвращает
b
, если
a
— "истина" и
с
, если
a
— "ложь");

□ дополнительные строковые функции как-то: замена подстроки, выравнивание, изменение регистра символов;

□ поддержка регулярных выражений;

□ поддержка примитивных типов XML Schema;

□ использование информации о структуре документа, определенной в его схеме;

□ поддержка экспоненциальной нотации чисел (наподобие

2Е10
= 1024);

□ поддержка функций приведения и преобразования (аналог

CAST
и
CONVERT
из SQL).

Выбор шаблонов для элементов пространства имен, определенного по умолчанию

Одним из значительных неудобств первой версии XSLT была невозможность сменить пространство имен, определенное по умолчанию для паттернов. То есть, если шаблон будет определен как

 ...

то обрабатывать он будет только те элементы

foo
, которые принадлежат нулевому пространству имен. Для элемента

придется писать шаблон вида

 ...

В случае целого документа принадлежащего ненулевому пространству имен, определения подобного рода могут оказаться слишком громоздкими. Решение этой проблемы может быть очень простым и элегантным.

Листинг 12.8. Изменение пространства имен для паттерна

 version="2.0"

 xmlns:xsl="http://www.w3.org/1999/XSL/Transform"

 xmlns="urn:bar-namespace">


  ...


В элементе xsl:stylesheet пространство имен с URI

"urn:bar-namespace"
определяется как пространство имен по умолчанию и паттерн
foo
соответствует элементу с локальной частью имени
"foo"
и URI пространства имен
"urn:bar-namespace"
.

Средства для форматирования даты и времени

В первых версиях XSLT элемент

xsl:decimal-format
и функция
format-number
обеспечивали форматирование чисел при их текстовом отображении. К сожалению, подобных инструментов для форматирования даты предусмотрено не было.

Поскольку связка элемента, определяющего именованный формат и функции, выполняющей форматирование, оказалась очень удачной, по всей вероятности, подобную схему мы будем наблюдать и в версии 2.0. Скорее всего, связка для форматирования даты и времени будет состоять из элемента

xsl:date-format
и функции
format-date
.

Функции id и key на внешних документах

В XSLT 1.1 функции

id
и
key
возвращают множества узлов документа, который содержит текущий узел преобразования. То есть для того, чтобы использовать ключи или уникальные идентификаторы для выбора узлов внешнего документа, необходимо сначала сменить контекст, например:

Требования ко второй версии XSLT предполагают упрощение работы с ключами и уникальными идентификаторами на внешних документах.

Включение неразбираемых внешних сущностей в виде текста

В первых версиях XSLT отсутствовала возможность включения внешних сущностей, не разбирая их как XML-документы. Без помощи расширений было невозможно включить в выходящий документ простой внешний текстовый файл. Между тем, вполне подходящим решением была бы функция типа

unparsed-entity
, которая по данному URI возвращала бы содержимое ресурса в виде строки. Естественно, при этом необходимо учитывать кодировку внешней сущности и Unicode-символы, которые не могут присутствовать в XML (например, управляющие символы).

Использование именованных сущностей вместо кодов символов

Это требование связано с желанием пользователей видеть в выходящем документе вместо сущности

 
ее более привычный вариант
 
. В настоящее время приходится прибегать ко всяким хитростям вроде

 

совсем не гарантирующим, кстати, что в выходящем файле окажется именно

 
.

В самом преобразовании сущности можно определять в DTD-заголовке следующим образом:

]>

 ...

Однако на выходящий документ эти определения никоим образом не сказываются.

Обращение ссылок по ID/IDREF

Функция

id
позволяет отыскать в документе элементы по заданным значениями
ID
-атрибутов. Это особенно полезно при работе с
IDREF
-атрибутами, которые ссылаются на
ID
-атрибуты: можно с легкостью выбрать элементы, на которые ссылается текущий элемент. Новым требованием к XSLT 2.0 является возможность "обращать" такого рода ссылки — то есть находить элементы, которые ссылаются на данный элемент (включают определенные значения в свои
IDREF
-атрибуты).

Другие требования

В числе прочих требований, предъявленных к XSLT 2.0, можно перечислить следующие:

□ поддержка группировки;

□ поддержка Unicode-нормализации строк;

□ сортировка узлов в соответствии с информацией о их типах, сообщенной XML-схемой документа;

□ создание и копирование узлов с учетом информации об их типах;

□ создание пространства имен с вычисляемым префиксом и URI.

Приложение 1Обзор XSLT-процессоров

Здесь даны необходимые сведения по всем существующим XSLT-процессорам, достаточные для того, чтобы сориентировать разработчика и помочь ему выбрать наиболее подходящий инструмент. Перечислим основные факторы, которые мы будем учитывать для каждого из рассматриваемых процессоров: