Каковы правильные типы содержимого для документов XML, HTML и XHTML?
Мне нужно написать простой поисковый робот, который выбирает только такие файлы.
В настоящее время http://example.net/index.html может служить, например, файлом JPEG из-за mod_rewrite, поэтому мне нужно проверить тип содержимого из заголовка ответа и сравнить его со списком разрешенных типов содержимого.
Откуда мне взять такой список?