Полезность коэффициента Танимото по сравнению с традиционной точностью (т. Е. Рассел-Рао) очевидна при анализе изображений при сравнении сегментации с золотым стандартом. Рассмотрим эти два изображения:
В каждом из этих изображений, которые являются двоичными «масками», у нас есть два объекта одинакового размера, но размещенных в немного разных местах, и мы хотим оценить, насколько эти объекты идентичны по форме и положению, оценивая их наложение. Обычно один (например, фиолетовая маска) представляет собой сегментацию (производимую с помощью компьютерного алгоритма), например, это может быть попытка определить местонахождение сердца по медицинскому изображению. Другой (например, зеленый) является золотым стандартом (т. Е. Сердцем, определенным опытным врачом). Там, где есть белый цвет, две фигуры перекрываются. Черные пиксели являются фоном.
Эти два изображения идентичны (т. Е. Результаты алгоритма сегментации, а также золотой стандарт одинаковы на обоих изображениях), за исключением большого количества "отступов" фона на втором изображении (например, это может представлять два эксперимента с две разные рентгеновские аппараты, где вторая машина имела более широкий луч, покрывающий большую площадь тела, но в остальном размер сердца одинаков в обоих наборах изображений).
Очевидно, что поскольку сегментация и золотой стандарт на обоих изображениях идентичны, если мы оценим точность сегментации по золотому стандарту, мы бы хотели, чтобы наша метрика выявила одинаковый результат «точности» в обоих экспериментах.
Однако, если мы попытаемся оценить качество сегментации с использованием подхода Рассела-Рао, мы получим ошибочно высокую точность для правильного изображения (около 100%), поскольку «фоновые пиксели, правильно определенные как фоновые пиксели», вносят вклад в Общая точность наборов и фоновых пикселей непропорционально представлены во втором наборе. Объекты, чье наложение мы хотим оценить в медицинской сегментации, часто представляют собой крошечные пятнышки на массивном фоне, поэтому это не очень полезно для нас. Кроме того, это привело бы к проблемам, если бы мы попытались сравнить точность одного алгоритма сегментации с другим, и оба были оценены на изображениях разного размера! (или, что то же самое, в разных масштабах).Масштабирование / размер встраиваемого изображения не должны влиять на оценку сегментации по золотому стандарту! ,
Напротив, коэффициент tanimoto не заботится о пикселях фона, что делает его инвариантным для «масштаба». Таким образом, что касается коэффициента танимото, сходство обоих этих наборов будет идентичным, что делает его гораздо более полезным показателем сходства, который мы можем использовать для оценки качества алгоритма сегментации.