В чем разница между использованием RDFS / OWL и XML?


10

Мне было интересно, какие преимущества имеют языки онтологии в RDFS / OWL по сравнению с использованием системы тегов / разметки (такой как http://www.schema.org/ ) для управления и создания метаданных?


3
Двигатель вывода, вот что. Что удивительно, ни один из ответов ниже не говорит о. Такие двигатели, как Jena, могут выводить новые данные и использовать переходные свойства.
Эндрю Финнелл

2
@AndrewFinnell выложите более подробное объяснение в качестве ответа, пожалуйста

Андрей, я согласен и проголосую за твой ответ. Существующие в настоящее время ответы ниже неинформированы и низкого качества.
Диббеке

@AndrewFinnell, я также хотел бы, чтобы вы опубликовали свой собственный ответ, также мне интересно, выходит ли вывод за рамки ОП или нет. (Первоначально я так и думал, но тогда, может быть, это не так)
ZJR

Ответы:


5

Ваш вопрос не имеет большого смысла, как есть. RDFS - это очень простой язык схем для выражения ограничений RDF. OWL - более продвинутая схема для выражения сложной онтологии. Они не имеют абсолютно ничего общего с XML, за исключением того, что они могут быть выражены в XML.


4

Не могу установить больше с ответом ZJR. Это совершенно не информировано.

  1. Как вы анализируете микроданные? Что это тоже разбирает? RDFa анализирует RDF, общую модель данных, которая является тем, к чему стремилась Semantic Web. Микроданные появились в основном потому, что Хики не удосужился прочитать спецификации RDF и RDFa. Это может быть проще для разработчика, но это не лучше для сети (то есть ленивый )
  2. Список общих словарей OWL приведен ниже:

  3. Следующая версия RDF неизбежна, включая новые форматы сериализации, такие как Turtle и RDFj

  4. SPARQL 1.1 также неизбежно. Федерация запросов, выражение пути свойств, SPARQL-обновление и многое другое.

  5. BBC построен на RDF. API графиков Facebook предоставляет RDF (это верно, вы можете задерживать URI графика, используя заголовок text / turtle Accepts и возвращать RDF) и многие другие крупные корпорации.

Итак, в целом, семантическая паутина, RDF, RDFS, OWL, SPARQL и все стандарты семантической паутины очень живы и работают. Если вы не верите мне, посмотрите на все действия на http://www.semanticoverflow.com


BBC построен на RDF, хотя и сопоставляется с микроданными, так? Они перестроили сайт в десятилетие 2000-2010 гг., Когда W3C обещал замечательные волшебные инструменты для RDF, эти инструменты на самом деле не материализовались, RDF там унаследованы. Прочная организационная структура, но ужасно, что микроданные охватывают последнюю милю. (и сохранить день)
ZJR

а потом еще немного: полезный SPARQL был неизбежен с незапамятных времен, формулировка спецификации RDF использовалась для того, чтобы отнимать много времени и отпугивать большинство потенциальных разработчиков на годы. (Не знаю, исправили ли они это, исправили ли они? ИМХО, слишком поздно, во всяком случае ), а затем RDF<some-letter>номенклатура все время вызывает замешательства и ссоры.
ZJR

1
BBC построен на RDF с использованием BigOWLIM, а не микроданных. Mircodata не является каноническим форматом данных. Это дополнение к HTML. Новая олимпийская платформа построена полностью на RDF, как упоминалось в пресс-релизах и презентациях в их Академии.
Уильям Гринли

4

RDF / OWL против XML - ложная альтернатива. На самом деле одной из популярных сериализаций является использование XML.

Также RDF / OWL против микроформатов является ложной альтернативой. Фактически существуют стандарты, которые позволяют использовать RDF в качестве микроформата, eRDF и официальный RDFa W3C со стандартизованным способом встраивания его в HTML5 .

Так что действительно вопрос в том, в чем преимущество использования стандартных, одобренных W3C форматов. Причины:

  • уже существует несколько онтологий, включая наиболее широко используемые, такие как Dublin Core и FOAF .
  • несколько тройных хранилищ, совместимых с RDF / OWL для большинства языков программирования.
  • различные вышеупомянутые механизмы тройного хранилища имеют механизм вывода с интерфейсом SPARQL .

В целом, я не вижу причин, почему вы должны использовать нестандартный микроформат W3C.


1

RDF и OWL являются установленными стандартами для кодирования семантических данных и их схемы на гораздо более глубоком и общем уровне, чем разметка ad-hoc.

Например, с помощью OWL вы можете определить новую схему, которая будет хотя бы частично понятна другим инструментам (поскольку вы можете смешивать различные схемы OWL / RDF вместе). Таким образом, вы можете экспортировать из одного набора данных разные «представления» и заставить всех сотрудничать. Также вы можете просто «исследовать» связи между объектами и их свойствами.

С микроданными это в основном произвольный, принятый набор вещей, которые вы можете применять, а не общая семантическая платформа.


Я все еще не понимаю, чем RDF отличается от RDFS отличается от OWL .... Могут ли эти термины использоваться взаимозаменяемо ...?
тезаурус Вебстера

@WebsterThesaurus RDF - довольно простой язык для описания концепций, основанных на тройках Subject-Verb-Object. RDFS - это RDF-схема, в основном предопределенный набор терминов, облегчающий определение значения отношений. OWL - это система описания онтологий, гораздо более мощная, чем RDFS, но сложнее в реализации
p_l

1

Я хотел бы начать, отметив, что этот ответ не написан экспертом в этой области. Хотя я сторонник семантических распределенных систем, я думаю, что в настоящее время применение OWL ограничено. Хотя точное описание ниши, в которой может применяться OWL, выходит за рамки этого ответа, я мог бы выявить некоторые «за» и «против».

OWL - это в основном язык, который позволяет выражать семантические конструкции с использованием классификации, мало чем отличаясь от классов, которые вы знаете из ООП, и от ограничений между классами и их экземплярами. Можно было бы увидеть это как более формальный и более высокий способ описания отношений, которые вы знаете из реляционной базы данных.

Чтобы описать и передать этот язык, его необходимо сериализовать в определенный формат. Существует несколько форматов, из которых RDF - только один.

Существует три различных уровня OWL, которые позволяют повысить выразительность, но ограничивают вычислимость (например, можете ли вы найти возможное решение вопросов, которые вы задаете в базе знаний, описанной определением OWL). Это OWL Lite, DL и Full.

Наиболее важным преимуществом использования OWL / RDF является обмен знаниями между различными базами знаний (или классификационными иерархиями) и создание полезных выводов без необходимости заранее спроектировать все эти базы, чтобы позволить им общаться. Это делается частично путем определения классов эквивалентности. Использование пространств имен позволяет инженеру установить уникальность; полезная парадигма.

Другим преимуществом является постоянно растущее количество механизмов вывода и языков запросов. В нашем сетевом мире существует потребность в распределенном обмене знаниями.

Возможно, важным недостатком является сравнительно высокая сложность определения вычислимости выводов и их пространственных и временных ограничений. Например. в OWL full вы можете запросить выводы, которые не могут быть подтверждены. Таким образом, есть предел мощности OWL.

Знание OWL дискретно ... нет полуправд или систем верований. Их наличие, скорее всего, сделает решения слишком сложными.

Но самый главный недостаток на мой вкус заключается в том, что просто невозможно найти много хороших инженеров в этой области. Вам понадобится инженер знаний, один или два программиста и небольшая команда разработчиков, чтобы создать даже небольшую базу знаний. Поэтому зачастую гораздо дешевле и эффективнее просто использовать описательные языки, такие как XML-схема, и описать необходимую семантику в удобочитаемом документе.


0

RDFS - это описание структурированных данных. Было бы намного полезнее, если бы он включал методы или функции, поэтому мы могли бы описать интерфейсы с ним. В настоящее время для этого нужен дополнительный словарный запас, например WSDL или Hydra by webservices. Я думаю, что есть также Vocab для ООП, я просто не знаю много Vocab.

OWL - это что-то вроде XSD, оно касается проверки ваших данных, например, если вы ожидаете строку длиной не более 20 символов, вы используете OWL для описания этого правила и создания валидатора. Теоретически вы могли бы сделать то же самое с RDFS и XSD, я понятия не имею, почему людям пришлось изобретать OWL вместо того, чтобы просто использовать XSD. Возможно, это потому, что XSD не основан на RDFS, поэтому, например, строка XSD не является потомком RDFS Literal.

Schema.org описывает общие классы, такие как Person, например. Они создают свои собственные RDFS, такие как vocab, которые включают в себя Thing вместо rdfs: Class, domainInclude вместо rdfs: domain, rangeInclude вместо rdfs: range и т. Д. Вместо использования RDFS. Их ограниченные типы также являются специальными, они используют Text и Number, не определяя их или подключая их, по крайней мере, к rdfs: Literal или XSD примитивам. Насколько я могу судить, они не используют XSD или OWL для определения ограниченных типов. Я не уверен, есть ли какие-либо ограничения в их словарном запасе, но если это так, я предполагаю, что они упоминают это в удобочитаемых описаниях, поэтому вы не сможете сгенерировать правильный валидатор для schema.org, что вы могли бы сделать, если бы они будет использовать XSD / OWL и RDFS.

Поэтому я думаю, что преимущество использования таких стандартов, как RDFS, XSD, OWL, заключается в том, что вы можете создавать библиотеки, которые вы можете использовать в каждом документе.


-2

В целях разработки будущих продуктов XML-файлы RDFS / OWL следует считать практически мертвыми и ушедшими.

Они требуют слишком много работы, чтобы выразить концепции, которые было бы лучше выражено в решении, построенном по индивидуальному заказу, на основе пользовательских текстовых форматов , сохраняя при этом данные более читабельными и редактируемыми для людей и машин. Они не добавляют никакой реальной ценности и только делают жизнь немного более несчастной для всех, кто на них натыкается. (и имеет дело с их номенклатурой пространства имен)

Тем не менее, существуют гигантские решения для обработки документов, основанные на них, и они были недавно разработаны, развернуты и находятся в эксплуатации. Они угрожают задержаться на очень долгое время. Многие программисты в будущем, несомненно, будут страдать от многих WTF, вызванных RDF и OWL.

Системы микроданных (версия микроформатов, удобная для валидаторов ), подобные тем, которые описаны на schema.org , вместо этого предоставляют множество преимуществ для разработчиков, редакторов и читателей; и человек, и механик.

Концепции RDF (те, которые стоит сэкономить) можно безболезненно отображать (и на самом деле отображают явно) в представлениях микроданных.

Элементы микроданных позволяют авторам и системам обработки документов обогатить общение таким способом, который довольно легко (так же просто, как CSS или DOM) обрабатывать и настраивать для читателя.


Подождите, я не понимаю ... так чем микроданные отличаются от XML / HTML? План, описанный в schema.org, в частности, говорит, что они используют теги на своих веб-страницах ... разве это не то, что делают XML и HTML также?
тезаурус Вебстера

И если микроданные намного лучше, почему W3C подталкивает к RDFS / OWL, а не к самим микроданным?
тезаурус Вебстера

Я думаю, что ответ довольно обманчив, так как RDF! = XML. XML-кодирование RDF является лишь одним из многих и было разработано с целью смешивания с существующими XML-приложениями. Более того, вернуться к пользовательским системам (да, включая микроданные) означает вернуться к «написать собственный анализатор для всего, что нужно», вместо того, чтобы использовать общий словарь. С помощью RDF / OWL я могу смешивать различные приложения, каждое из которых работает с определенным подмножеством данных, а также писать гибкий код с автоматическим отражением - хороший пример - Xanasys LinkExplorer.
p_l

1
Неинформативный самоуверенный ответ. Пожалуйста, покажите ссылки для поддержки этих утверждений.
Диббеке

@Dibbeke Моим первоначальным предположением было то, что ОП искала прагматичные метаданные. RDF в этом случае является излишним. Часть, выражающая мнение, связана с моей верой в то, что RDF всегда является излишним .
ZJR
Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.