В чем разница между функцией и меткой?


101

Я следую руководству по основам машинного обучения, и там упоминается, что что-то может быть функцией или меткой .

Насколько я знаю, функция - это свойство данных, которые используются. Я не могу понять, что это за ярлык, я знаю значение этого слова, но я хочу знать, что оно означает в контексте машинного обучения.


Функции - это поля, используемые как входные, а метки - как выходные. В качестве простого примера рассмотрим, как предсказать, следует ли продавать автомобиль, на основе пробега, года и т. Д. Да / нет - это этикетка, тогда как пробег и год будут характеристиками.
Эндрю Макнил,

Ответы:


202

Вкратце, фича вводная; метка выводится. Это относится как к задачам классификации, так и к задачам регрессии.

Функция - это один столбец данных во входном наборе. Например, если вы пытаетесь предсказать тип домашнего животного, которое кто-то выберет, ваши входные характеристики могут включать возраст, домашний регион, семейный доход и т. Д. Окончательный выбор - это ярлык, например собака, рыба, игуана, камень, и т.п.

После обучения своей модели вы предоставите ей наборы новых входных данных, содержащих эти функции; он вернет предсказанный "ярлык" (тип питомца) для этого человека.


1
Итак, [возраст, домашний регион, семейный доход] будут «3 векторами признаков». А в Keras ваш массив NumPy для вашей сети LSTM будет [образцы, временные шаги, 3]?
naisanza

3
@naisanza: это, безусловно, одна из возможностей. Я не знаком с Keras, но эта организация высокого уровня, безусловно, может стать началом действительной реализации.
Prune

функция и переменная - это одно и то же?
Debadatta

Я хотел бы заявить, что «ярлык» также зависит от контекста; например, для обучения модели вы будете использовать «помеченные» данные. В этом случае метка - это истинная правда, с которой сравниваются ваши выходные данные.
Атанасов

Вот это да. отличный ответ, спасибо, это проясняет множество давних вопросов по этой теме.
Эндрю Рэй

31

Характерная черта:

В машинном обучении функция означает свойство ваших данных обучения. Или вы можете назвать имя столбца в наборе обучающих данных.

Предположим, это ваш набор данных для обучения

Height   Sex   Age
 61.5     M     20
 55.5     F     30
 64.5     M     41
 55.5     F     51
 .     .     .
 .     .     .
 .     .     .
 .     .     .

Тогда здесь Height, Sexи Ageте черты.

метка:

Результат, который вы получаете от своей модели после обучения, называется меткой.

Предположим, вы передали вышеуказанный набор данных некоему алгоритму и сгенерировали модель для прогнозирования пола как мужской или женский.В приведенной выше модели вы передаете такие функции, как ageи heightт. Д.

Поэтому после вычисления он вернет пол как Мужской или Женский. Это называется этикеткой


5

А вот и более наглядный подход к объяснению концепции. Представьте, что вы хотите классифицировать животное, изображенное на фотографии.

Возможные классы животных, например, кошки или птицы. В этом случае меткой будут возможные ассоциации классов, например кошка или птица, которые будет предсказывать ваш алгоритм машинного обучения.

К характеристикам относятся узор, цвета, формы, которые являются частью ваших изображений, например мех, перья или более низкоуровневая интерпретация, значения пикселей.

Птица Этикетка:
Характеристики птицы : Перья

Кошка

Этикетка:
Характеристики кошки : Мех


5

Возьмем пример, в котором мы хотим определить алфавит с помощью рукописных фотографий. Мы загружаем эти образцы изображений в программу, и программа классифицирует эти изображения на основе полученных ими функций.

Пример особенности в этом контексте: букву 'C'можно представить себе как вогнутую вправо.

Теперь возникает вопрос, как хранить эти функции. Нам нужно их назвать. Вот роль появившегося лейбла. Метка даются такие особенности , чтобы отличить их от других особенностей.

Таким образом, мы получаем метки в качестве выходных данных, когда им предоставляются функции в качестве входных .

Ярлыки не связаны с обучением без учителя.


4

Предварительные требования: базовая статистика и знакомство с ML (линейная регрессия)

На него можно ответить в предложении -

Они похожи, но их определение меняется в зависимости от необходимости.

Объяснение

Разрешите пояснить свое заявление. Предположим, что у вас есть набор данных, для этого подумайте exercise.csv. Каждый столбец в наборе данных называется функциями. Пол, возраст, рост, частота пульса, температура тела и калории могут быть одними из различных столбцов. Каждый столбец представляет отдельные функции или свойства.

упражнение.csv

User_ID  Gender Age  Height  Weight Duration    Heart_Rate  Body_Temp   Calories
14733363 male   68  190.0   94.0    29.0           105.0    40.8        231.0
14861698 female 20  166.0   60.0    14.0            94.0    40.3        66.0
11179863 male   69  179.0   79.0    5.0             88.0    38.7        26.0

Чтобы укрепить понимание и прояснить загадку, давайте возьмем две разные задачи (случай предсказания).

СЛУЧАЙ 1: В этом случае мы можем рассмотреть возможность использования - Пол, Рост и Вес для прогнозирования количества калорий, сожженных во время тренировки. Этот прогноз (Y) Калории - это метка . Калории - это столбец, который вы хотите предсказать, используя различные функции, такие как - x1: пол, x2: рост и x3: вес .

CASE2: Во втором случае здесь мы могли бы захотеть предсказать Heart_rate, используя пол и вес в качестве функции. Здесь Heart_Rate - это метка, предсказанная с использованием функций - x1: пол и x2: вес .

Как только вы поймете приведенное выше объяснение, вы больше не будете путаться с ярлыком и функциями.


3

Кратко объясненная функция будет входом, который вы подали в систему, а метка будет выходом, который вы ожидаете. Например, вы добавили много характеристик собаки, таких как рост, цвет шерсти и т. Д., Поэтому после вычислений будет возвращена порода собаки, которую вы хотите узнать.


0

Предположим, вы хотите спрогнозировать климат, тогда вам будут предоставлены исторические климатические данные, текущая погода, температура, скорость ветра и т. Д., А метками будут месяцы. Вышеупомянутая комбинация может помочь вам делать прогнозы.

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.