Машинное обучение: Первая глава

Термин «машинное обучение» впервые появился в 1950-х годах, когда Артур Самуэль, пионер ИИ, разработал самообучающуюся систему игры в шашки. Он заметил, что по мере того, как система играла все больше и больше, она становилась все лучше и лучше. Началась новая эра машинного обучения, обусловленная достижениями в области статистики и информатики, а также разработкой более совершенных нейронных сетей и доступностью наборов данных. Осознаете вы это или нет, но в 21 веке машинное обучение повсюду. Интеллектуальный домашний помощник, такой как Google Home, фитнес-трекер, такой как FitBit, или умный помощник по программированию, такой как Github Copilot, и т.д. — вот несколько примеров.

Артур Самуэль определил машинное обучение как область исследований, которая дает компьютерам способность обучаться без явного программирования. Цель машинного обучения — подражать тому, как человек учится, используя данные и алгоритмы, повышая точность с каждой итерацией. Машинное обучение в целом направлено на понимание структуры данных и преобразование их в интуитивно понятные и пригодные для использования модели.

Типы машинного обучения

В зависимости от того, как обучение воспринимается разрабатываемой системой и как осуществляется обратная связь с обучением, существуют различные типы моделей и алгоритмов машинного обучения. В целом эти модели можно разделить на следующие категории:

Контролируемое обучение

Процесс контролируемого обучения подразумевает использование маркированных наборов данных для обучения алгоритмов классификации данных и точности прогнозирования. Веса модели настраиваются по мере поступления входных данных в модель. Этот метод позволяет алгоритму обучаться, сверяя фактический результат с результатами обучения, а затем соответствующим образом модифицируя модель для устранения обнаруженных ошибок.

Например, для автоматического обнаружения спама алгоритму машинного обучения необходимо предоставить примеры писем, которые являются спамом, и других писем, которые не следует считать спамом. Использование исторических данных для предсказания будущих событий является распространенным применением контролируемого обучения. Контролируемое обучение можно разделить на:

  • Регрессия: Она включает в себя отображение входных переменных на некоторую непрерывную функцию и прогнозирование результатов в рамках непрерывного выхода. Выходом задачи регрессии обычно является реальная или непрерывная величина, такая как цена, высота или температура.
  • Классификация: Алгоритм классификации отображает входные переменные на дискретные категории. Классификация либо предсказывает категориальные метки классов, либо классифицирует данные (строит модель) на основе обучающего набора и значений (меток классов) в классифицирующих атрибутах и использует ее при классификации новых данных.

Обучение без контроля

Целью алгоритмов обучения без контроля является выявление взаимосвязей и понимания в немаркированных данных. В этом случае моделям подаются данные, но они не получают никаких указаний относительно желаемых результатов, поэтому им приходится делать предположения, используя косвенные доказательства. Для поиска скрытых закономерностей или группировок данных не требуется вмешательство человека.

Методы бесконтрольного обучения без подсказки правильного ответа могут помочь организовать данные потенциально значимыми способами и найти понимание. Неподконтрольное обучение также можно разделить на:

  • Кластеризация: Это процесс группировки объектов на основе общих характеристик. Его основная цель — вычислить, насколько объекты или сущности похожи друг на друга. В качестве примера можно привести группировку клиентов по их покупательскому поведению, группировку фильмов по их жанру и т.д.
  • Ассоциация: Цель ассоциации — найти правила, которые описывают связь между большими кусками данных, например, когда amazon рекомендует вам купить мышь после покупки ноутбука.

Обучение с подкреплением

Алгоритм обучения с подкреплением — это поведенческая модель машинного обучения, которая похожа на контролируемое обучение, но вместо того, чтобы обучаться на образцах данных, она учится методом проб и ошибок. Последовательность успешных результатов подкрепляется, чтобы разработать наилучшую политику для данной проблемы.

Алгоритм или агент (который, по сути, является программой) учится, взаимодействуя с окружающей средой, где правильные ответы вознаграждаются, а неправильные — наказываются. Используя вознаграждения и наказания, алгоритм обучается без вмешательства человека, с целью максимизации вознаграждений и минимизации наказаний.

Основы ML

UC Berkeley разделяет систему обучения алгоритма машинного обучения на три основные части.

  1. Процесс принятия решения: В общем случае алгоритмы машинного обучения используются для составления прогноза или классификации. На основе некоторых входных данных, которые могут быть маркированными или немаркированными, алгоритм определяет оценку закономерности в данных.
  2. Функция ошибки : Функция ошибки служит для оценки предсказания модели. Если есть известные примеры, функция ошибки может провести сравнение для оценки точности модели.
  3. Процесс оптимизации модели: Если модель может лучше соответствовать точкам данных в обучающем множестве, то веса корректируются, чтобы уменьшить расхождение между известным примером и оценкой модели. Алгоритм будет повторять эту оценку и оптимизировать процесс, обновляя веса автономно, пока не будет достигнут порог точности.

Заключение

Этот блог должен был дать вам представление о ML с высоты птичьего полета и познакомить вас с некоторыми идеями и методами. В ближайшее время я опубликую подробные статьи о каждом из этих методов. Счастливого обучения! 🤩

Оцените статью
devanswers.ru
Добавить комментарий