обзор
Существует много возможных представлений и, следовательно, схем баз данных для хранения нечетких дат (или даже просто нечетких дат):
- Дата-время и код, указывающий его точность или достоверность
- Дата-время и интервал, где есть несколько возможностей для представления интервала:
- Представьте все интервалы в виде целого (или другого числового) количества некоторой фиксированной единицы, например, дней, минут, наносекунд.
- Представьте интервал как целое (или другое числовое) количество и код, указывающий его единицы.
- Время начала и окончания
- строка
- Распределение вероятностей:
- Десятичные числа или числа с плавающей запятой для параметров, которые определяют конкретное распределение в определенном семействе, например, среднее значение и стандартное отклонение нормального распределения.
- Функция распределения вероятностей, например, в виде (поискового) кода (потенциально с параметрами конкретных значений) или в виде выражения на достаточно выразительном языке, формате или представлении.
[1], [2] и [3] - все (неявно) однородные интервалы, то есть набор (одинаково) возможных моментов времени.
[4] является наиболее выразительным, т. Е. Когда допускаются любые возможные (или, по крайней мере, произвольно длинные) письменные предложения или фразы на языке. Но с этим труднее всего работать. В пределе ИИ на уровне человека должен был бы обрабатывать произвольные значения. Практически, диапазон возможных значений должен быть строго ограничен, и альтернативные «структурированные» значения, вероятно, предпочтительнее для многих операций, например, сортировки, поиска.
[5], вероятно, является наиболее общим компактным представлением, которое (несколько) практично.
Единые интервалы
Унифицированные интервалы - это самый простой и компактный способ представления набора (возможных) значений даты и времени.
Для [1] части значения даты и времени игнорируются, то есть части, соответствующие единицам, более точным, чем указанная точность или точность; в противном случае это эквивалентно [2], а код точности / точности эквивалентен интервалу с теми же единицами (и подразумеваемой величиной 1).
[2] и [3] выразительно эквивалентны. [1] строго менее выразителен, чем любой, поскольку существуют эффективные интервалы, которые не могут быть представлены [1], напр. нечеткая дата-время, эквивалентная 12-часовому интервалу, который охватывает границу даты.
[1] проще для пользователей, чем любое другое представление, и, как правило, требует (хотя бы немного) меньшего ввода текста. Если даты и время можно вводить в различных текстовых представлениях, например, «2013», «2014-3», «2015-5-2», «30.07.2016, 11p», «2016-07-31 18:15» Точность или точность также может быть выведена автоматически из входных данных.
Точность или точность [1] также проще всего преобразовать в форму, которая будет передаваться пользователям, например, «2015-5 с точностью до месяца» в «май 2015», по сравнению с «13 мая 2015, 2р, плюс или минус 13,5 дней» (обратите внимание, что последний в любом случае не может быть представлен [1]).
Струны
Практически, строковые значения необходимо преобразовывать в другие представления для запроса, сортировки или иного сравнения нескольких значений. Таким образом, хотя любой письменный естественный (человеческий) язык строго более выразителен, чем [1], [2], [3] или [5], у нас пока нет средств для обработки чего-то большего, чем стандартные текстовые представления или форматы. Учитывая это, это, вероятно, наименее полезное представление само по себе .
Одним из преимуществ этого представления является то, что на практике значения должны быть презентабельными для пользователей как есть и не требовать преобразования, чтобы их было легко понять.
Распределение вероятностей
Распределения вероятностей обобщают представления равномерных интервалов [1], [2], [3] и (возможно) эквивалентны (общему) строковому представлению [4].
Одним из преимуществ распределения вероятностей над строками является то, что первое является однозначным.
[5-1] будет подходить для значений, которые (в основном) соответствуют существующему распределению, например, значение даты-времени, выводимое из устройства, для которого известно (или считается), что измерения соответствуют определенному распределению.
[5-2], вероятно, является лучшим (несколько) практичным способом компактного представления произвольных значений «нечеткой даты-времени». Конечно, вычислимость конкретных распределений вероятностей имела значение, и существуют определенные интересные (и, возможно, невозможные) проблемы, которые необходимо решить при запросе, сортировке или сравнении различных значений, но многое из этого, вероятно, уже известно или решено где-то в существующих математическая и статистическая литература, так что это определенно предельно общее и однозначное представление.