logo

Типи машинного навчання

Машинне навчання — це підмножина штучного інтелекту, яка дозволяє машині автоматично навчатися на основі даних, покращувати продуктивність на основі минулого досвіду та робити прогнози . Машинне навчання містить набір алгоритмів, які працюють з величезною кількістю даних. Дані передаються цим алгоритмам для їх навчання, і на основі навчання вони будують модель і виконують певне завдання.

Типи машинного навчання

Ці алгоритми ML допомагають вирішувати різні бізнес-проблеми, такі як регресія, класифікація, прогнозування, кластеризація та асоціації тощо.

Залежно від методів і способу навчання машинне навчання поділяється на чотири типи, а саме:

  1. Контрольоване машинне навчання
  2. Машинне навчання без нагляду
  3. Напівкероване машинне навчання
  4. Навчання з підкріпленням
Типи машинного навчання

У цій темі ми надамо детальний опис типів машинного навчання разом із відповідними алгоритмами:

1. Контрольоване машинне навчання

Як випливає з назви, Контрольоване машинне навчання ґрунтується на нагляді. Це означає, що в техніці навчання під наглядом ми навчаємо машини за допомогою «позначеного» набору даних, і на основі навчання машина прогнозує результат. Тут позначені дані вказують на те, що деякі входи вже зіставлено з виходом. Більш дорогоцінно, ми можемо сказати; спочатку ми навчаємо машину введенням і відповідним виводом, а потім просимо машину передбачити вихід, використовуючи тестовий набір даних.

Розглянемо контрольоване навчання на прикладі. Припустімо, що ми маємо вхідний набір даних із зображеннями котів і собак. Отже, спочатку ми навчимо машину розуміти зображення, наприклад форма та розмір хвоста кота та собаки, форма очей, колір, зріст (собаки вищі, коти менші) тощо. Після завершення навчання ми вводимо зображення кота і просимо машину ідентифікувати об’єкт і передбачити результат. Тепер машина добре навчена, тому вона перевірить усі характеристики об’єкта, такі як зріст, форму, колір, очі, вуха, хвіст тощо, і виявить, що це кіт. Отже, це віднесе його до категорії Cat. Це процес, у якому машина ідентифікує об’єкти під час контрольованого навчання.

Основна мета методики навчання під керівництвом полягає в тому, щоб зіставити вхідну змінну (x) із вихідною змінною (y). Деякі реальні програми навчання під наглядом є Оцінка ризиків, виявлення шахрайства, фільтрація спаму, тощо

Категорії керованого машинного навчання

Контрольоване машинне навчання можна класифікувати на два типи проблем, які наведено нижче:

    Класифікація регресія

а) Класифікація

Алгоритми класифікації використовуються для вирішення задач класифікації, в яких вихідна змінна є категоричною, наприклад ' Так чи ні, чоловік чи жінка, червоний чи синій тощо . Алгоритми класифікації передбачають категорії, присутні в наборі даних. Деякі реальні приклади алгоритмів класифікації Виявлення спаму, фільтрація електронної пошти тощо.

Деякі популярні алгоритми класифікації наведені нижче:

    Алгоритм випадкового лісу Алгоритм дерева рішень Алгоритм логістичної регресії Алгоритм опорної векторної машини

б) Регресія

Алгоритми регресії використовуються для вирішення задач регресії, в яких існує лінійна залежність між вхідними та вихідними змінними. Вони використовуються для прогнозування безперервних змінних випуску, таких як ринкові тенденції, прогноз погоди тощо.

Деякі популярні алгоритми регресії наведені нижче:

    Простий алгоритм лінійної регресії Алгоритм багатофакторної регресії Алгоритм дерева рішень Регресія ласо

Переваги та недоліки навчання під наглядом

Переваги:

  • Оскільки контрольоване навчання працює з позначеним набором даних, ми можемо мати точне уявлення про класи об’єктів.
  • Ці алгоритми допомагають передбачити результат на основі попереднього досвіду.

Недоліки:

  • Ці алгоритми не здатні вирішувати складні завдання.
  • Він може передбачити неправильний результат, якщо тестові дані відрізняються від даних навчання.
  • Для навчання алгоритму потрібно багато обчислювального часу.

Застосування контрольованого навчання

Нижче наведено деякі поширені програми навчання під наглядом:

    Сегментація зображення:
    У сегментації зображень використовуються алгоритми навчання під наглядом. У цьому процесі класифікація зображень виконується на різних даних зображення з попередньо визначеними мітками.Медичний діагноз:
    Контрольовані алгоритми також використовуються в медичній галузі для діагностики. Це робиться за допомогою медичних зображень і минулих даних з мітками для захворювань. Завдяки такому процесу машина може ідентифікувати захворювання для нових пацієнтів.Виявлення шахрайства -Алгоритми класифікації керованого навчання використовуються для ідентифікації шахрайських транзакцій, шахрайських клієнтів тощо. Це робиться за допомогою історичних даних для виявлення моделей, які можуть призвести до можливого шахрайства.Виявлення спаму -У виявленні та фільтрації спаму використовуються алгоритми класифікації. Ці алгоритми класифікують електронний лист як спам чи ні. Спам-лист надсилається в папку спаму.Розпізнавання мови -Алгоритми навчання під наглядом також використовуються для розпізнавання мовлення. Алгоритм навчається з голосовими даними, і за допомогою них можна виконувати різні ідентифікації, наприклад голосові паролі, голосові команди тощо.

2. Машинне навчання без нагляду

Навчання без нагляду g відрізняється від методики навчання під наглядом; як випливає з назви, немає потреби в нагляді. Це означає, що при неконтрольованому машинному навчанні машина навчається за допомогою немаркованого набору даних, і машина прогнозує вихідні дані без будь-якого нагляду.

У неконтрольованому навчанні моделі навчаються з даними, які не є ані засекреченими, ані позначеними, і модель діє на цих даних без будь-якого контролю.

Основною метою алгоритму неконтрольованого навчання є групування або категоризація несортованого набору даних відповідно до подібностей, моделей і відмінностей. Машини отримують інструкції знаходити приховані шаблони у вхідному наборі даних.

Давайте візьмемо приклад, щоб зрозуміти це більш цінно; Припустімо, що є кошик із зображеннями фруктів, і ми вводимо його в модель машинного навчання. Зображення абсолютно невідомі моделі, і завдання машини полягає в тому, щоб знайти закономірності та категорії об'єктів.

швета тіварі актор

Отже, тепер машина виявить свої закономірності та відмінності, такі як різниця кольорів, різниця у формі, і передбачить результат під час тестування за допомогою тестового набору даних.

Категорії неконтрольованого машинного навчання

Неконтрольоване навчання можна далі класифікувати на два типи, які наведено нижче:

    Кластеризація Асоціація

1) Кластеризація

Техніка кластеризації використовується, коли ми хочемо знайти притаманні групи з даних. Це спосіб згрупувати об’єкти в кластер таким чином, щоб об’єкти з найбільшою кількістю подібностей залишалися в одній групі та мали менше або взагалі не мали подібностей з об’єктами інших груп. Прикладом алгоритму кластеризації є групування клієнтів за їх купівельною поведінкою.

Деякі з популярних алгоритмів кластеризації наведено нижче:

    Алгоритм кластеризації K-Means Алгоритм середнього зсуву Алгоритм DBSCAN Аналіз головних компонентів Незалежний аналіз компонентів

2) Асоціація

Навчання правилам асоціації – це техніка неконтрольованого навчання, яка знаходить цікаві зв’язки між змінними у великому наборі даних. Основна мета цього алгоритму навчання полягає в тому, щоб знайти залежність одного елемента даних від іншого елемента даних і відобразити ці змінні відповідно, щоб отримати максимальний прибуток. Цей алгоритм в основному застосовується в Аналіз ринкового кошика, аналіз веб-користування, безперервне виробництво і т.д.

Деякі популярні алгоритми навчання правил асоціації Апріорний алгоритм, Eclat, FP-алгоритм зростання.

Переваги та недоліки алгоритму неконтрольованого навчання

Переваги:

  • Ці алгоритми можна використовувати для складніших завдань порівняно з контрольованими, оскільки ці алгоритми працюють із набором даних без міток.
  • Алгоритми без контролю є кращими для різних завдань, оскільки отримати набір даних без міток легше порівняно з набором даних з мітками.

Недоліки:

  • Результати неконтрольованого алгоритму можуть бути менш точними, оскільки набір даних не позначено, а алгоритми не навчені точним результатам попереднього.
  • Працювати з неконтрольованим навчанням складніше, оскільки воно працює з немаркованим набором даних, який не зіставляється з результатом.

Застосування неконтрольованого навчання

    Аналіз мережі:Неконтрольоване навчання використовується для виявлення плагіату та авторського права в мережевому аналізі документів текстових даних для наукових статей.Системи рекомендацій:Системи рекомендацій широко використовують методи неконтрольованого навчання для створення програм рекомендацій для різних веб-додатків і веб-сайтів електронної комерції.Виявлення аномалії:Виявлення аномалій — це популярна програма неконтрольованого навчання, яка може ідентифікувати незвичайні точки даних у наборі даних. Він використовується для виявлення шахрайських операцій.Декомпозиція сингулярного значення:Сингулярне розкладання або SVD використовується для вилучення певної інформації з бази даних. Наприклад, отримання інформації про кожного користувача, який знаходиться в певному місці.

3. Напівконтрольоване навчання

Напівконтрольоване навчання – це тип алгоритму машинного навчання, який знаходиться між керованим і неконтрольованим машинним навчанням . Він являє собою проміжну основу між контрольованим (з позначеними навчальними даними) і неконтрольованим навчанням (без позначених навчальних даних) алгоритмами та використовує комбінацію позначених і не позначених наборів даних протягом періоду навчання.

А Хоча напівконтрольоване навчання є серединою між контрольованим і неконтрольованим навчанням і працює з даними, які складаються з кількох міток, воно переважно складається з немаркованих даних. Оскільки етикетки дорогі, але для корпоративних цілей вони можуть мати небагато етикеток. Це повністю відрізняється від навчання під контролем і без нього, оскільки вони базуються на наявності та відсутності ярликів.

Щоб подолати недоліки алгоритмів навчання під контролем і навчання без контролю, вводиться концепція напівконтрольованого навчання . Основна мета напівконтрольованого навчання полягає в тому, щоб ефективно використовувати всі доступні дані, а не лише позначені дані, як у контрольованому навчанні. Спочатку подібні дані кластеризуються разом із алгоритмом неконтрольованого навчання, а потім це допомагає позначити дані без міток у дані з мітками. Це тому, що мічені дані є порівняно дорожчим придбанням, ніж не мічені дані.

Ми можемо уявити ці алгоритми на прикладі. Навчання під наглядом – це коли студент перебуває під наглядом інструктора вдома та в коледжі. Крім того, якщо цей учень самостійно аналізує ту саму концепцію без будь-якої допомоги викладача, це вважається навчанням без нагляду. Під напівконтрольованим навчанням студент має переглянути себе після аналізу тієї самої концепції під керівництвом інструктора в коледжі.

Переваги та недоліки напівконтрольованого навчання

Переваги:

  • Алгоритм простий і зрозумілий.
  • Він високоефективний.
  • Він використовується для усунення недоліків алгоритмів навчання під контролем і без контролю.

Недоліки:

  • Результати ітерацій можуть бути нестабільними.
  • Ми не можемо застосувати ці алгоритми до даних на рівні мережі.
  • Точність низька.

4. Навчання з підкріпленням

Навчання з підкріпленням працює на основі процесу зворотного зв’язку, у якому агент штучного інтелекту (програмний компонент A) автоматично досліджує навколишнє середовище, вдаряючи та слідуючи, вживаючи дій, навчаючись на досвіді та покращуючи свою продуктивність. Агент отримує винагороду за кожну хорошу дію і отримує покарання за кожну погану дію; отже, метою агента навчання з підкріпленням є максимізація винагороди.

У навчанні з підкріпленням немає позначених даних, таких як контрольоване навчання, і агенти навчаються лише на власному досвіді.

Процес навчання з підкріпленням подібний до людського; наприклад, дитина вчиться різним речам на досвіді свого повсякденного життя. Прикладом навчання з підкріпленням є гра в гру, де Гра — це середовище, рухи агента на кожному кроці визначають стани, а мета агента — отримати високий бал. Агент отримує зворотній зв'язок щодо покарань і винагород.

Завдяки своєму способу роботи навчання з підкріпленням використовується в різних сферах, наприклад Теорія ігор, дослідження операцій, теорія інформації, мультиагентні системи.

Проблему навчання з підкріпленням можна формалізувати за допомогою Марковський процес прийняття рішень (MDP). У MDP агент постійно взаємодіє з середовищем і виконує дії; на кожну дію середовище реагує і породжує новий стан.

Категорії навчання з підкріпленням

Навчання з підкріпленням поділяють на два типи методів/алгоритмів:

    Навчання з позитивним підкріпленням:Навчання з позитивним підкріпленням вказує на посилення тенденції до того, що необхідна поведінка повторюватиметься знову, додаючи щось. Це посилює силу поведінки агента і позитивно впливає на нього.Навчання з негативним підкріпленням:Навчання з негативним підкріпленням працює прямо протилежно позитивному RL. Це збільшує тенденцію до того, що конкретна поведінка повториться, уникаючи негативного стану.

Реальні випадки використання Reinforcement Learning

    Відео ігри:
    Алгоритми RL дуже популярні в ігрових програмах. Він використовується для отримання надлюдської продуктивності. Деякі популярні ігри, які використовують алгоритми RL AlphaGO і AlphaGO Zero .Управління ресурсами:
    У документі «Керування ресурсами з глибоким підкріпленням навчання» показано, як використовувати RL у комп’ютері для автоматичного навчання та планування ресурсів для очікування різних завдань, щоб мінімізувати середнє сповільнення виконання завдань.Робототехніка:
    RL широко використовується в роботах. Роботи використовуються в промисловості та на виробництві, і ці роботи стають ще потужнішими за допомогою навчання з підкріпленням. Існують різні галузі, які мають своє бачення створення розумних роботів за допомогою штучного інтелекту та технології машинного навчання.Видобуток тексту
    Видобуток тексту, одне з чудових застосувань НЛП, зараз реалізується за допомогою Reinforcement Learning від компанії Salesforce.

Переваги та недоліки навчання з підкріпленням

Переваги

  • Це допомагає у вирішенні складних проблем реального світу, які важко вирішити за допомогою загальних методів.
  • Модель навчання RL подібна до навчання людей; тому можна отримати найточніші результати.
  • Допомагає досягти довготривалих результатів.

Недолік

  • Алгоритми RL не є кращими для простих задач.
  • Алгоритми RL вимагають величезних даних і обчислень.
  • Занадто багато навчання з підкріпленням може призвести до перевантаження станів, що може послабити результати.

Прокляття розмірності обмежує навчання з підкріпленням для реальних фізичних систем.