Ответы:
Поскольку вы задаете этот очень простой вопрос, похоже, стоит указать, что собой представляет само машинное обучение.
Машинное обучение - это класс алгоритмов, управляемых данными, то есть, в отличие от «обычных» алгоритмов, именно данные «говорят», что такое «хороший ответ». Пример: гипотетический алгоритм не машинного обучения для обнаружения лица на изображениях будет пытаться определить, что такое лицо (круглый диск цвета кожи, с темной областью, где вы ожидаете глаза и т. Д.). Алгоритм машинного обучения не будет иметь такого закодированного определения, но будет «учиться на примерах»: вы покажете несколько изображений лиц, а не лиц, и хороший алгоритм в конечном итоге научится и сможет предсказать, является ли невидимым или нет изображение это лицо.
Этот конкретный пример обнаружения лица контролируется , что означает, что ваши примеры должны быть помечены или явно сказать, какие из них являются лицами, а какие нет.
В неконтролируемом алгоритме ваши примеры не помечены , то есть вы ничего не говорите. Конечно, в таком случае сам алгоритм не может «придумать», что такое лицо, но он может попытаться сгруппировать данные в разные группы, например, он может отличить лица, которые сильно отличаются от ландшафтов, которые сильно отличаются от лошадей.
Так как другой ответ упоминает об этом (хотя и в неправильном виде): существуют «промежуточные» формы контроля, то есть полу-контролируемое и активное обучение . Технически, это контролируемые методы, в которых есть какой-то «умный» способ избежать большого количества помеченных примеров. При активном обучении алгоритм сам решает, какую вещь вы должны пометить (например, он может быть довольно уверен относительно ландшафта и лошади, но он может попросить вас подтвердить, действительно ли горилла является изображением лица). В полууправляемом обучении есть два разных алгоритма, которые начинаются с помеченных примеров, а затем «рассказывают» друг другу, как они думают о каком-то большом количестве немаркированных данных. Из этой «дискуссии» они учатся.
Контролируемое обучение - это когда данные, которыми вы снабжаете ваш алгоритм, «помечены» или «помечены», чтобы помочь вашей логике принимать решения.
Пример: байесовская фильтрация спама, где вы должны пометить элемент как спам, чтобы уточнить результаты.
Неконтролируемое обучение - это типы алгоритмов, которые пытаются найти корреляции без каких-либо внешних входных данных, кроме необработанных данных.
Пример: алгоритмы кластеризации данных.
Приложения, в которых обучающие данные содержат примеры входных векторов вместе с соответствующими им целевыми векторами, известны как контролируемые проблемы обучения.
В других задачах распознавания образов обучающие данные состоят из набора входных векторов x без каких-либо соответствующих целевых значений. Цель таких неконтролируемых проблем обучения может заключаться в обнаружении групп схожих примеров в данных, где это называется кластеризацией.
Распознавание образов и машинное обучение (Епископ, 2006)
В контролируемом обучении ввод x
обеспечивается с ожидаемым результатом y
(т. Е. Выводом, который модель должна производить, когда ввод x
), который часто называют «классом» (или «меткой») соответствующего ввода.x
.
В обучении без учителя, «класс» примера x
не предоставляется. Таким образом, неконтролируемое обучение можно рассматривать как поиск «скрытой структуры» в наборе немаркированных данных.
Подходы к контролируемому обучению включают в себя:
Классификация (1R, Наивный Байес, алгоритм обучения дерева решений, такой как ID3 CART и т. Д.)
Прогноз числовых значений
Подходы к обучению без учителя включают в себя:
Кластеризация (K-средних, иерархическая кластеризация)
Обучение правилам ассоциации
Например, очень часто обучение нейронной сети является контролируемым обучением: вы сообщаете сети, какому классу соответствует вектор признаков, который вы кормите.
Кластеризация - это обучение без контроля: вы позволяете алгоритму решать, как группировать выборки в классы, которые имеют общие свойства.
Другим примером неконтролируемого обучения являются самоорганизующиеся карты Кохонена .
Я могу рассказать вам пример.
Предположим, вам нужно узнать, какое транспортное средство является автомобилем, а какое - мотоциклом.
В контролируемом обучения ваш входной (обучающий) набор данных должен быть помечен, то есть для каждого входного элемента в вашем входном (обучающем) наборе данных вы должны указать, представляет ли он автомобиль или мотоцикл.
В случае неконтролируемого обучения вы не помечаете входные данные. Неконтролируемая модель группирует входные данные в кластеры, например, на основе сходных характеристик / свойств. Так что, в этом случае нет таких ярлыков, как «машина».
Контролируемое обучение
Контролируемое обучение основано на обучении выборки данных из источника данных с правильной классификацией, уже назначенной. Такие методы используются в моделях прямой связи или многослойных персептронов (MLP). Эти MLP имеют три отличительные характеристики:
Эти характеристики наряду с обучением через обучение решают сложные и разнообразные проблемы. Обучение через обучение в контролируемой модели ANN, также называемой алгоритмом обратного распространения ошибок. Алгоритм обучения коррекции ошибок обучает сеть на основе выборок ввода-вывода и находит сигнал ошибки, который представляет собой разницу рассчитанного выхода и требуемого выхода, и корректирует синаптические веса нейронов, которые пропорциональны произведению ошибки. сигнал и входной экземпляр синаптического веса. Основываясь на этом принципе, обучение обратному распространению ошибок происходит в два этапа:
Форвард Пасс:
Здесь входной вектор представлен в сети. Этот входной сигнал распространяется вперед, нейрон за нейроном через сеть и появляется на выходном конце сети в качестве выходного сигнала: y(n) = φ(v(n))
где v(n)
индуцированное локальное поле нейрона определяется как v(n) =Σ w(n)y(n).
Выходной сигнал, который рассчитывается на выходном слое o (n), равен по сравнению с желаемым ответом d(n)
и находит ошибку e(n)
для этого нейрона. Синаптические веса сети во время этого прохода остаются неизменными.
Обратный проход:
Сигнал ошибки, который исходит из выходного нейрона этого уровня, распространяется обратно по сети. Это вычисляет локальный градиент для каждого нейрона в каждом слое и позволяет синаптическим весам сети претерпевать изменения в соответствии с правилом дельты как:
Δw(n) = η * δ(n) * y(n).
Это рекурсивное вычисление продолжается с последующим проходом, за которым следует обратный проход для каждого входного паттерна, пока сеть не сойдет.
Парадигма обучения ANN под наблюдением эффективна и находит решения для ряда линейных и нелинейных задач, таких как классификация, управление установкой, прогнозирование, прогнозирование, робототехника и т. Д.
Обучение без учителя
Самоорганизующиеся нейронные сети учатся, используя алгоритм обучения без присмотра, чтобы идентифицировать скрытые шаблоны в немаркированных входных данных. Это неконтролируемое относится к способности изучать и систематизировать информацию без предоставления сигнала ошибки для оценки потенциального решения. Отсутствие направления для алгоритма обучения в обучении без присмотра иногда может быть выгодным, поскольку оно позволяет алгоритму оглядываться на шаблоны, которые ранее не рассматривались. Основными характеристиками самоорганизующихся карт (SOM) являются:
Вычислительный уровень также называется конкурентным уровнем, так как нейроны в этом уровне конкурируют друг с другом, чтобы стать активными. Следовательно, этот алгоритм обучения называется конкурентным алгоритмом. Необслуживаемый алгоритм в СДЛ работает в три этапа:
Этап соревнования:
для каждого входного шаблона x
, представленного в сети, w
вычисляется внутренний продукт с синаптическим весом, и нейроны в конкурентном слое находят дискриминантную функцию, которая вызывает конкуренцию между нейронами и вектором синаптического веса, который близок к входному вектору на евклидовом расстоянии объявляется победителем конкурса. Этот нейрон называется наиболее подходящим нейроном,
i.e. x = arg min ║x - w║.
Кооперативная фаза:
победивший нейрон определяет центр топологической окрестности h
взаимодействующих нейронов. Это осуществляется путем латерального взаимодействия d
между кооперативными нейронами. Эта топологическая окрестность уменьшает свой размер с течением времени.
Адаптивная фаза:
позволяет выигравшему нейрону и соседним нейронам увеличивать свои индивидуальные значения дискриминантной функции по отношению к входному шаблону посредством подходящих корректировок синаптического веса,
Δw = ηh(x)(x –w).
При повторном представлении шаблонов обучения векторы синаптического веса имеют тенденцию следовать распределению шаблонов ввода из-за обновления окрестности, и, таким образом, ANN обучается без супервизора.
Самоорганизующаяся модель естественным образом представляет нейробиологическое поведение и, следовательно, используется во многих реальных приложениях, таких как кластеризация, распознавание речи, сегментация текстур, векторное кодирование и т. Д.
Я всегда находил различие между неконтролируемым и контролируемым обучением произвольным и немного запутанным. Между этими двумя случаями нет реального различия, вместо этого существует ряд ситуаций, в которых алгоритм может иметь более или менее «надзор». Существование обучения под наблюдением - очевидные примеры, где линия размыта.
Я склонен думать о надзоре как о предоставлении обратной связи алгоритму о том, какие решения должны быть предпочтительными. Для традиционных контролируемых настроек, таких как обнаружение спама, вы говорите алгоритму «не допускайте ошибок в обучающем наборе» ; для традиционных неконтролируемых настроек, таких как кластеризация, вы сообщаете алгоритму «точки, которые находятся близко друг к другу, должны находиться в одном кластере» . Так уж сложилось, что первая форма обратной связи гораздо более конкретна, чем последняя.
Короче говоря, когда кто-то говорит «под наблюдением», думайте о классификации, когда он говорит «без присмотра», думайте о кластеризации и старайтесь не беспокоиться об этом сверх этого.
Уже есть много ответов, которые подробно объясняют различия. Я нашел эти гифки на Codeacademy, и они часто помогают мне эффективно объяснить различия.
Обратите внимание, что на тренировочных изображениях есть метки, и что модель изучает названия изображений.
Обратите внимание, что здесь делается только группировка (кластеризация) и что модель ничего не знает ни о каком изображении.
Машинное обучение: исследует и строит алгоритмы, которые могут учиться и делать прогнозы на основе данных. Такие алгоритмы работают на основе построения модели из примеров входных данных, чтобы сделать управляемые данными прогнозы или решения, выраженные в виде выходных данных, а не следовать строго статичным инструкции по программе.
Обучение под наблюдением. Это задача машинного обучения, заключающаяся в том, чтобы вывести функцию из обозначенных данных обучения. Данные обучения состоят из набора примеров обучения. В контролируемом обучении каждый пример представляет собой пару, состоящую из входного объекта (обычно вектора) и желаемого выходного значения (также называемого контрольным сигналом). Алгоритм контролируемого обучения анализирует данные обучения и выдает предполагаемую функцию, которую можно использовать для отображения новых примеров.
Компьютер представлен с примерами входных данных и их желаемых выходных данных, предоставленных «учителем», и цель состоит в том, чтобы изучить общее правило, которое отображает входные данные на выходные данные. В частности, контролируемый алгоритм обучения принимает известный набор входных данных и известные ответы к данным (выводу) и обучает модель генерировать разумные прогнозы для ответа на новые данные.
Обучение без учителя : это обучение без учителя. Одна из основных вещей, которую вы можете захотеть сделать с данными, - это визуализировать их. Задача машинного обучения состоит в том, чтобы вывести функцию для описания скрытой структуры из немаркированных данных. Поскольку примеры, данные учащемуся, не имеют маркировки, нет никакого сигнала об ошибке или вознаграждении для оценки потенциального решения. Это отличает неконтролируемое обучение от контролируемого обучения. При обучении без учителя используются процедуры, которые пытаются найти естественные разделы шаблонов.
При неконтролируемом обучении нет обратной связи, основанной на результатах прогнозирования, то есть, нет учителя, который бы вас поправил. Под неконтролируемыми методами обучения не приводятся помеченные примеры и отсутствует понятие результата в процессе обучения. В результате, это зависит от схемы / модели обучения, чтобы найти шаблоны или обнаружить группы входных данных.
Вы должны использовать неконтролируемые методы обучения, когда вам нужно большое количество данных для обучения ваших моделей, а также готовность и способность экспериментировать и исследовать, и, конечно, проблему, которая не очень хорошо решается с помощью более устоявшихся методов. возможно выучить более крупные и более сложные модели, чем при контролируемом обучении. Вот хороший пример
,
Контролируемое обучение: говорят, что ребенок идет в детский сад. здесь учитель показывает ему 3 игрушки-домик, мяч и машину. сейчас учитель дает ему 10 игрушек. он классифицирует их по 3 коробкам с домом, мячом и машиной на основе своего предыдущего опыта. Учителя сначала присматривали за ребенком, чтобы получить правильные ответы для нескольких подходов. Затем он был проверен на неизвестных игрушках.
Обучение без присмотра: снова пример детского сада. Ребенку дают 10 игрушек. ему велят разбивать похожие на сегменты. поэтому, основываясь на таких особенностях, как форма, размер, цвет, функции и т. д., он попытается выделить 3 группы, например, A, B, C и сгруппировать их.
Слово «Надзор» означает, что вы даете надзору / инструкции машине, чтобы помочь ей найти ответы. Как только он изучает инструкции, он может легко предсказать новый случай.
Без присмотра означает, что нет никакого контроля или инструкции, как найти ответы / ярлыки, и машина будет использовать свой интеллект, чтобы найти какой-то образец в наших данных. Здесь он не будет делать прогноз, он просто попытается найти кластеры, которые имеют схожие данные.
Алгоритм обучения нейронной сети может контролироваться или не контролироваться.
Говорят, что нейронная сеть обучается под наблюдением, если желаемый результат уже известен. Пример: шаблон связи
Нейронные сети, которые учатся без присмотра, не имеют таких целевых выходов. Невозможно определить, как будет выглядеть результат процесса обучения. В процессе обучения единицы (значения веса) такой нейронной сети «располагаются» внутри определенного диапазона, в зависимости от заданных входных значений. Цель состоит в том, чтобы сгруппировать сходные блоки близко друг к другу в определенных областях диапазона значений. Пример: классификация паттернов
Контролировал обучение, предоставляя данные с ответом.
Учитывая письмо, помеченное как спам / не спам, изучите фильтр спама.
Учитывая набор данных пациентов, у которых диагностирован диабет или нет, научитесь классифицировать новых пациентов как диабет или нет.
Обучение без учителя, учитывая данные без ответа, позволяет ПК группировать вещи.
Учитывая набор новостных статей, найденных в Интернете, сгруппируйте их в набор статей на одну и ту же историю.
Имея базу данных пользовательских данных, автоматически обнаруживать сегменты рынка и группировать клиентов по различным сегментам рынка.
Контролируемое обучение
При этом каждый входной шаблон, который используется для обучения сети, связан с выходным шаблоном, который является целью или желаемым шаблоном. Предполагается, что учитель присутствует в процессе обучения, когда проводится сравнение между вычисленным выходным сигналом сети и правильным ожидаемым выходным значением, чтобы определить ошибку. Затем ошибку можно использовать для изменения параметров сети, что приводит к улучшению производительности.
Обучение без учителя
В этом методе обучения целевой выход не представлен в сети. Это как если бы не было учителя, который бы представлял желаемый шаблон, и, следовательно, система учится самостоятельно, обнаруживая и адаптируясь к структурным особенностям входных шаблонов.
Контролируемое обучение : вы вводите в качестве входных данных различные примеры данных вместе с правильными ответами. Этот алгоритм извлечет уроки из этого и начнет прогнозировать правильные результаты на основе последующих данных. Пример : почтовый спам-фильтр
Обучение без учителя : вы просто даете данные и ничего не говорите - например, ярлыки или правильные ответы. Алгоритм автоматически анализирует закономерности в данных. Пример : Новости Google
Я постараюсь сделать это простым.
Контролируемое обучение: в этой методике обучения нам предоставляется набор данных, и система уже знает правильный вывод набора данных. Итак, наша система учится, предсказывая собственную ценность. Затем он проверяет точность, используя функцию стоимости, чтобы проверить, насколько близок ее прогноз к фактическому результату.
Обучение без учителя. При таком подходе мы практически не знаем, каким будет наш результат. Таким образом, вместо этого, мы получаем структуру из данных, где мы не знаем влияние переменной. Мы создаем структуру путем кластеризации данных на основе взаимосвязи между переменной в данных. Здесь у нас нет обратной связи, основанной на нашем прогнозе.
У вас есть вход х и целевой выход т. Итак, вы тренируете алгоритм для обобщения недостающих частей. Это контролируется, потому что цель задана. Вы - супервизор, который говорит алгоритму: для примера x вы должны вывести t!
Хотя сегментация, кластеризация и сжатие обычно учитываются в этом направлении, мне трудно найти хорошее определение для этого.
Давайте возьмем в качестве примера авто-кодеры для сжатия . В то время как у вас есть только введенные данные x, именно инженер-человек говорит алгоритму, что целью также является x. Так что в некотором смысле это не отличается от контролируемого обучения.
Что касается кластеризации и сегментации, я не слишком уверен, действительно ли это соответствует определению машинного обучения (см. Другой вопрос ).
Контролируемое обучение: вы пометили данные и должны учиться на них. например, данные о доме вместе с ценой, а затем научиться прогнозировать цену
Обучение без учителя: вы должны найти тенденцию и затем предсказать, без предварительных ярлыков. например, разные люди в классе, а затем приходит новый человек, к какой группе принадлежит этот новый студент.
В контролируемом обучении мы знаем, каким должен быть ввод и вывод. Например, дан набор автомобилей. Мы должны выяснить, какие из них красные, а какие синие.
Принимая во внимание, что неконтролируемое обучение - это то, где мы должны найти ответ, практически или совсем не имея представления о том, каким должен быть результат. Например, учащийся может построить модель, которая определяет, когда люди улыбаются, на основе соотношения лицевых моделей и слов, таких как «над чем ты улыбаешься?».
Обучение под наблюдением может пометить новый предмет в одном из обученных ярлыков на основе обучения во время обучения. Вам необходимо предоставить большое количество обучающих данных, проверочных данных и тестовых данных. Если вы предоставите, скажем, пиксельные векторы изображений цифр вместе с обучающими данными с метками, то он может идентифицировать числа.
Обучение без учителя не требует наборов обучающих данных. При неконтролируемом обучении он может группировать элементы в разные кластеры, основываясь на разнице входных векторов. Если вы предоставите пиксельные векторы изображений цифр и попросите их классифицировать на 10 категорий, это может сделать это. Но он знает, как пометить его, поскольку вы не предоставили обучающие ярлыки.
Контролируемое обучение - это, в основном, когда у вас есть входные переменные (x) и выходная переменная (y), и вы используете алгоритм для изучения функции отображения от входа к выходу. Причина, по которой мы назвали это контролируемым, заключается в том, что алгоритм учится на основе обучающего набора данных, алгоритм итеративно делает прогнозы на обучающих данных. Контролируемые имеют два типа - классификация и регрессия. Классификация - это когда выходной переменной является категория типа да / нет, правда / ложь. Регрессия - это когда на выходе есть реальные значения, такие как рост человека, температура и т. Д.
Обучение под надзором ООН - это когда у нас есть только входные данные (X) и нет выходных переменных. Это называется неконтролируемым обучением, потому что в отличие от контролируемого обучения выше нет правильных ответов и нет учителя. Алгоритмы оставлены на свое усмотрение, чтобы обнаружить и представить интересную структуру в данных.
Типы неконтролируемого обучения - кластеризация и ассоциация.
Контролируемое обучение - это, в основном, метод, в котором данные обучения, на которых обучается машина, уже помечены, что предполагает простой классификатор четных нечетных чисел, в котором вы уже классифицировали данные во время обучения. Поэтому он использует «LABELED» данные.
Напротив, неконтролируемое обучение - это метод, при котором машина сама маркирует данные. Или вы можете сказать, что это тот случай, когда машина учится сама с нуля.
В простом контролируемом обучении это тип проблемы машинного обучения, в котором у нас есть несколько меток, и с помощью этих меток мы реализуем алгоритм, такой как регрессия и классификация. Классификация применяется там, где наш вывод похож на 0 или 1, истина / ложь, да нет. и регрессия применяется там, где поставить реальную стоимость такого дома цены
Неподготовленное обучение - это тип проблемы машинного обучения, при котором у нас нет меток, что означает, что у нас есть только некоторые данные, неструктурированные данные, и мы должны кластеризовать данные (группировать данные), используя различные неконтролируемые алгоритмы.
Контролируемое машинное обучение
«Процесс обучения алгоритма на основе обучающего набора данных и прогнозирования результатов».
Точность прогнозируемого результата прямо пропорциональна тренировочным данным (длина)
При контролируемом обучении у вас есть входные переменные (x) (обучающий набор данных) и выходная переменная (Y) (тестирующий набор данных), и вы используете алгоритм для изучения функции отображения от входа к выходу.
Y = f(X)
Основные типы:
Алгоритмы:
Алгоритмы классификации:
Neural Networks
Naïve Bayes classifiers
Fisher linear discriminant
KNN
Decision Tree
Super Vector Machines
Прогнозные алгоритмы:
Nearest neighbor
Linear Regression,Multi Regression
Области применения:
Распознавание голоса
Предсказать HR выбрать конкретного кандидата или нет
Предсказать цену фондового рынка
Контролируемое обучение :
Алгоритм контролируемого обучения анализирует данные обучения и выдает предполагаемую функцию, которую можно использовать для отображения новых примеров.
Категории проблемы:
Регресс: предсказывать результаты в непрерывном выводе => отображать входные переменные в некоторую непрерывную функцию.
Пример:
Учитывая фотографию человека, предскажите его возраст
Классификация: Прогнозирование результатов в дискретном выводе => преобразование входных переменных в дискретные категории
Пример:
Является ли этот опухоль раковым?
Обучение без учителя:
Обучение без учителя учится на тестовых данных, которые не были помечены, классифицированы или классифицированы. Неконтролируемое обучение выявляет общие черты в данных и реагирует на основании наличия или отсутствия таких общих черт в каждом новом фрагменте данных.
Мы можем получить эту структуру путем кластеризации данных на основе отношений между переменными в данных.
Там нет обратной связи на основе результатов прогноза.
Категории проблемы:
Кластеризация: задача группирования набора объектов таким образом, чтобы объекты в одной и той же группе (называемой кластером) были больше похожи (в некотором смысле) друг на друга, чем на объекты в других группах (кластерах).
Пример:
Возьмите коллекцию из 1 000 000 различных генов и найдите способ автоматически сгруппировать эти гены в группы, которые каким-то образом похожи или связаны различными переменными, такими как продолжительность жизни, местоположение, роли и так далее .
Популярные варианты использования перечислены здесь.
Разница между классификацией и кластеризацией в интеллектуальном анализе данных?
Ссылки:
Контролируемое обучение
Обучение без учителя
Пример:
Контролируемое обучение:
Одна сумка с апельсином
=> построить модель
Один смешанный пакет с яблоком и апельсином.
=> Пожалуйста, классифицируйте
Обучение без учителя:
Один смешанный пакет с яблоком и апельсином.
=> построить модель
Еще одна смешанная сумка
=> Пожалуйста, классифицируйте
Простыми словами .. :) Это мое понимание, не стесняйтесь исправлять. Контролируемое обучение - это то, что мы прогнозируем на основе предоставленных данных. Итак, у нас есть столбец в наборе данных, который необходимо предикатировать. Неконтролируемое обучение заключается в том, что мы пытаемся извлечь смысл из предоставленного набора данных. У нас нет ясности относительно того, что должно быть предсказано. Итак, вопрос в том, почему мы делаем это? .. :) Ответ таков: результатом обучения без учителя являются группы / кластеры (аналогичные данные вместе). Поэтому, если мы получаем какие-либо новые данные, мы связываем их с указанным кластером / группой и понимаем их особенности.
Я надеюсь, что это поможет вам.
контролируемое обучение
контролируемое обучение - это то, где мы знаем выходные данные необработанного ввода, то есть данные помечаются так, чтобы во время обучения модели машинного обучения он понимал, что нужно обнаружить в исходном выводе, и направляет систему во время обучения для обнаруживать предварительно помеченные объекты на том основании, что он обнаружит аналогичные объекты, которые мы предоставили при обучении.
Здесь алгоритмы будут знать, какова структура и структура данных. Контролируемое обучение используется для классификации
В качестве примера, у нас могут быть разные объекты, формы которых квадратные, круглые, треугольные. Наша задача состоит в том, чтобы упорядочить одинаковые типы фигур, для которых в маркированном наборе данных есть все маркированные фигуры, и мы будем обучать модель машинного обучения этому набору данных в на основе набора дат обучения он начнет обнаруживать фигуры.
Неконтролируемое обучение
Неконтролируемое обучение - это неуправляемое обучение, когда конечный результат неизвестен, оно будет кластеризовать набор данных и на основе схожих свойств объекта разделить объекты на различные группы и обнаружить объекты.
Здесь алгоритмы будут искать другой шаблон в необработанных данных и на основе этого будут кластеризовать данные. Неконтролируемое обучение используется для кластеризации.
Например, у нас могут быть разные объекты разных форм: квадрат, круг, треугольник, поэтому он будет создавать сгустки на основе свойств объекта, если объект имеет четыре стороны, он будет считать его квадратным, а если он имеет три стороны треугольника и если нет сторон, кроме круга, то здесь данные не помечены, он научится обнаруживать различные формы
Машинное обучение - это сфера, в которой вы пытаетесь создать машину, которая имитирует поведение человека.
Вы тренируете машину, как ребенок. То, как люди учатся, выявляют особенности, распознают закономерности и тренируются, точно так же, как вы тренируете машину, передавая данные с различными функциями. Машинный алгоритм идентифицирует шаблон в данных и классифицирует его по определенной категории.
Машинное обучение широко подразделяется на две категории: контролируемое и неконтролируемое обучение.
Контролируемое обучение - это концепция, в которой у вас есть входной вектор / данные с соответствующим целевым значением (выходом). С другой стороны, неконтролируемое обучение - это концепция, в которой у вас есть только входные векторы / данные без какого-либо соответствующего целевого значения.
Примером контролируемого обучения является распознавание рукописных цифр, когда у вас есть изображение цифр с соответствующей цифрой [0-9], а примером неконтролируемого обучения является группировка покупателей по покупательскому поведению.