Машинное обучение
Существуют три типа машинного обчения: обучение с учителем , обучения без учителя. обучение с подкреплением.
Основная задача обучения.с учителем состоит в том, чтобы на маркированных тренировочных данных извлечь модель , которая позволяет делать прогнозы о ранее не встречающихся или будущих данных
В качестве примера можно рассмотреть фильтрация спама. Мы можем натренировать модель на корпусе маркированных сообщений электронной почты , где почтовые сообщения правильно помечены как спамные и неспамные и потом предсказать к какому из этих категорий принадлежит новое сообщение.
Методы обучения с учителем , когда имеются дискретные метки принадлежности к классу , называют методами классификации.
Другую подкатегорию методов обучения с учителем представляет регрессия, где результирующий сигнал - непрерывная величина.
В регрессивном анализе нам даны несколько предикторных(объясняющих) переменных и непрерывная(результирующая) переменная отклика и мы пытаемся найти между этими переменными связь, которая нам позволит предсказывать результат.
Задача обучения с подкреплением состоит в выработке системы(агента), которая улучшает свое качество на основе взаимодействий со средой.
В качестве примера рассмотрим шахматный движок Здесь агент выбирает серию ходов в зависимости от состояния шахматной доски(среды), где вознаграждение можно задать как выигрыш либо проигрыш в конце игры
Кластеризация - это метод разведочного анализа данных , который позволяет организовать груду информации в содержательные подгруппы(кластеры), не имея никаких предварительных сведений о принадлежности группе. Каждый кластер , который может появиться во время анализа, обозначает группу объектов , которые обладают степенью подобия и одновременно больше отличаются от объектов в других кластерах , поэтому кластеризацию также иногда называют идентификацией без учителя. Кластеризация незаменима для структирования информации и получения содержательных связей внутри данных. (позволяет маркетолагам обнаруживать группы потребителей на основе их интересов с целью разработки конкретных маркетинговых программ)
Еще одна подобласть обучения без учителя представлена методом снижения размерности. Подход на основе снижения размерности без учителя широко используется во время предобработки признаков с целью удаления из данных шума, который тоже может ухудшить предсказательниц способность некоторых алгоритмов и для сжатия данных в подпространство меньшей размерности при сохранении большрй части релевантной информации