Установить тип документа HTML5 с помощью XSLT


134

Как бы я аккуратно установить доктайп файл в HTML5 с <!DOCTYPE html>помощью XSLT (в данном случае с collective.xdv )

Следующее, что лучше всего нашел мой Google foo:

<xsl:output
    method="html"
    doctype-public="XSLT-compat"
    omit-xml-declaration="yes"
    encoding="UTF-8"
    indent="yes" />

производит:

<!DOCTYPE html PUBLIC "XSLT-compat" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">

7
Кстати, использование PUBLIC "XSLT-compat" устарело. Совместимый с XSLT тип документа HTML5 теперь является <! DOCTYPE HTML SYSTEM "about: legacy-compat">. См. Dev.w3.org/html5/spec/syntax.html#doctype-legacy-string
Alohci

1
Из последнего редактора WD, похоже, разрешен почти любой тип документа: короткий <!DOCTYPE html>, устаревший <!DOCTYPE HTML SYSTEM "about:legacy-compat">и устаревший («не должен») HTML 4, HTML 4.01, XHTML 1.0 и XHTML 1.1 (все строгие DTD при наличии SYSTEM).

1
Пожалуйста, обновите ответ на HTML5 как (в настоящее время) рекомендацию W3C.
Питер Краусс

Ответы:


147

Я думаю, что в настоящее время это поддерживается только записью doctype в виде текста:

<?xml version="1.0" encoding="utf-8"?>
<xsl:stylesheet version="1.0" xmlns:xsl="http://www.w3.org/1999/XSL/Transform">
  <xsl:output method="html" encoding="utf-8" indent="yes" />

  <xsl:template match="/">
    <xsl:text disable-output-escaping='yes'>&lt;!DOCTYPE html&gt;</xsl:text>
    <html>
    </html>
  </xsl:template>

</xsl:stylesheet>

Это даст следующий результат:

<!DOCTYPE html>
<html>
</html>

Это единственный стандартный путь. Но в MSXSL есть нестандартный способ: использовать пустой xsl: output / @ doctype-public и xsl: output / @ doctype-system.

4
disable-output-escapingимел в виду Кейси
yegor256

Я больше не работаю над этим проектом, поэтому не могу его протестировать, однако отмечаю это как лучший ответ на основе положительных голосов.
Джон Хэдли

Я использую это все время. Спасибо.
Jgroenen

Спас меня ... Спасибо
cgatian

66

Для того, чтобы использовать простой HTML доктайп <!DOCTYPE html>, вы должны использовать disable-output-escapingфункцию: <xsl:text disable-output-escaping="yes">&lt;!DOCTYPE html&gt;</xsl:text>. Тем не менее, disable-output-escapingэто дополнительная функция в XSLT, поэтому ваш механизм XSLT или конвейер сериализации могут не поддерживать ее.

По этой причине HTML5 предоставляет альтернативный тип документа для совместимости с версиями XSLT, не поддерживающими HTML5 (т. Е. Со всеми существующими версиями XSLT), и другими системами, которые сталкиваются с такой же проблемой. Альтернативный тип документа есть <!DOCTYPE html SYSTEM "about:legacy-compat">. Для вывода этой DOCTYPE, используйте атрибут doctype-system="about:legacy-compat"на xsl:outputэлемент без использования doctype-publicатрибута вообще.

<?xml version="1.0"?>
<xsl:stylesheet version="1.0" xmlns:xsl="http://www.w3.org/1999/XSL/Transform">
   <xsl:output method="html" doctype-system="about:legacy-compat"/>
   ...
   <html>
   </html>
</xsl:stylesheet>

Я ценю, что это, вероятно, правильный, основанный на стандартах способ добиться того, чего я хочу (я проголосовал за него как таковой). Но первое не поддерживается (мой процессор падает), а второе все еще приводит "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"к моему типу документа. Как сказал @Jirka Kosek, я думаю, что мой процессор XSLT может быть сломан.
Джон Хэдли

1
Рассылка Deliverance (используемый мной XSLT-процессор), посвященная этой проблеме, находится здесь: coactivate.org/projects/deliverance/lists/…
Джон Хэдли,

1
Служба валидатора w3c выдает предупреждение, когда документ начинается с<!DOCTYPE html SYSTEM "about:legacy-compat">
Адриан В.

30
<xsl:output
     method="html"
     doctype-system="about:legacy-compat"
     encoding="UTF-8"
     indent="yes" />

это выводы

<!DOCTYPE html SYSTEM "about:legacy-compat">

это исправлено как мое исправление для http://ukchill.com/technology/generating-html5-using-xslt/


1
Служба валидатора w3c выдает предупреждение, когда документ начинается с:<!DOCTYPE html SYSTEM "about:legacy-compat">
Adrian W

20

С Saxon 9.4 вы можете использовать:

<xsl:output method="html" version="5.0" encoding="UTF-8" indent="yes" />

Это создает:

<!DOCTYPE HTML>

2
К сожалению, это специфично для саксонцев. С другой стороны, это просто самый краткий ответ на вопрос. Интересно, работает ли это с другими процессорами XSLT 2.0?
Полб

Теперь это больше не относится только к Saxon, но также поддерживается в источниках libxslt / xsltproc. Смотрите подробности в конце stackoverflow.com/questions/3387127/set-html5-doctype-with-xslt/...
sideshowbarker

10

Используйте doctype-system вместо doctype-public


Это все еще уходит "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"в doctype.
Джон Хэдли,

5
если <xsl: output doctype-system = "about: legacy-compat" method = "html" /> производит то, что вы говорите, то в используемом вами XSLT-процессоре явно есть ошибка.
Йирка Косек

Где указано это поведение? Это определенно не работает в JAXP XSLT.
rustyx

xml.apache.org/xalan-j этот пример не соответствует тому, что вы ожидаете - может быть, просто возраст.
PandaWood

9

Вы должны использовать XHTML 1.0 Strict как DOCTYPE , если вы хотите выход XHTML в соответствии с HTML5, XML сериализатору Libxml2 имеет специальный режим вывода вызываемую XHTML 1.0 DOCTYPEs , который обеспечивает выход в XHTML совместимы (например , <br />вместо того <br/>, <div></div>вместо <div/>). doctype-system="about:legacy-compat"это не вызовет этот режим совместимости

Если вы довольны выводом html, тогда настройка <xsl:output method="html">должна работать правильно. Затем вы можете установить doctype с помощью <xsl:text disable-output-escaping="yes">&lt;!DOCTYPE html&gt;</xsl:text>, хотя для этого потребуется подключиться в соответствующем месте, поскольку XDV пока не поддерживает это.

На самом деле это, похоже, <xsl:output method="html"/>тоже не очень помогает - это приведет <br/>к выводу как <br></br>.


6

Эта вариация советов Джирки Косек через тематику Advanced XDV на Plone.org, похоже, работает для меня в коллективно.xdv .

<?xml version="1.0" encoding="UTF-8"?>
<xsl:stylesheet version="1.0" xmlns:xsl="http://www.w3.org/1999/XSL/Transform">
  <xsl:output
      doctype-public="HTML"
      doctype-system=""/>
</xsl:stylesheet>

1
Да, но, как я уже прокомментировал в ответе 0xA3, пустые @ doctype-system или @ doctype-public не являются стандартными (также это противоречит спецификации!)

5

Это комментарий, но мне не хватает очков кармы, чтобы поставить его в нужное место. Вздох.

Я ценю, что это, вероятно, правильный, основанный на стандартах способ добиться того, чего я хочу (я проголосовал за него как таковой). Но первое не поддерживается (мой процессор падает), а второе все еще приводит к « http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd » в моем типе документа. Как сказал @Jirka Kosek, я думаю, что мой процессор XSLT может быть сломан.

Нет, ваш XSLT-процессор не сломан, просто XDV добавляет:

<xsl:output method="xml" indent="no" omit-xml-declaration="yes" media-type="text/html" encoding="utf-8" doctype-public="-//W3C//DTD XHTML 1.0 Transitional//EN" doctype-system="http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"/>

по умолчанию, поэтому при добавлении секунды <xsl:output doctype-system="about:legacy-compat"/>предыдущая doctype-publicне перезаписывается.

Обратите внимание, что строгий XHTML 1.0 указан как устаревшая разрешенная строка типа документа , поэтому вполне допустимо использовать этот тип документа и по-прежнему называть его HTML5.


Если ваш процессор XSLT добавляет элементы в таблицы стилей или имеет некоторые нестандартные значения атрибутов по умолчанию, это будет означать, что он не работает.

6
@Alejandro: XDV (теперь переименованный в diazo) - это не XSLT-процессор, а тема -> XSLT-компилятор. Это XDV, который добавляет значения по умолчанию в скомпилированный XSLT. Я знаю это, потому что я написал это;)
Лоуренс Роу

3

Извините, что предоставил только ссылки, но это обсуждалось в группе WHATWG, но прошло много месяцев с тех пор, как я с этим справился. Здесь Йен Хиксон и некоторые эксперты по XML обсуждают это:
http://lists.w3.org/Archives/Public/public-html/2009Jan/0640.html
http://markmail.org/message/64aykbbsfzlbidzl,
и вот актуальная проблема номер:
http://www.w3.org/html/wg/tracker/issues/54
и вот эта дискуссия
http://www.contentwithstyle.co.uk/content/xslt-and-html-5-problems



1

Следующий код будет работать как отдельный шаблон, если он сохранен как html5.xml:

<?xml version="1.0" encoding="utf-8"?>
<?xml-stylesheet type="text/xsl" href="html5.xml"?>
<xsl:stylesheet version="1.0"
            xmlns:xsl="http://www.w3.org/1999/XSL/Transform" xmlns="http://www.w3.org/1999/xhtml"
            >
<xsl:output method="xml" encoding="utf-8" version="" indent="yes" standalone="no" media-type="text/html" omit-xml-declaration="no" doctype-system="about:legacy-compat" />

<xsl:template match="xsl:stylesheet">
  <xsl:apply-templates/>
</xsl:template>

<xsl:template match="/">
  <html>
    <head>
      <meta http-equiv="Content-Type" content="text/html;charset=utf-8" />
    </head>
    <body>
      <xsl:text>hi</xsl:text>
    </body>
  </html>
</xsl:template>

</xsl:stylesheet>

Ссылки


1

это то, что я использую для генерации совместимого html5 doctype (извлечение саксонского html5, в противном случае выполнение устаревшего)

<?xml version="1.0" encoding="UTF-8" standalone="yes"?>

<xsl:stylesheet
    xmlns:xsl="http://www.w3.org/1999/XSL/Transform"
    xmlns="http://www.w3.org/TR/REC-html40">

    <xsl:output
        method="html"
        version="5.0"
        doctype-system="about:legacy-compat"
        encoding="UTF-8"
        indent="yes" />
Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.