Машинне навчання — це підмножина штучного інтелекту, яка дозволяє машині автоматично навчатися на основі даних, покращувати продуктивність на основі минулого досвіду та робити прогнози . Машинне навчання містить набір алгоритмів, які працюють з величезною кількістю даних. Дані передаються цим алгоритмам для їх навчання, і на основі навчання вони будують модель і виконують певне завдання.
Ці алгоритми ML допомагають вирішувати різні бізнес-проблеми, такі як регресія, класифікація, прогнозування, кластеризація та асоціації тощо.
Залежно від методів і способу навчання машинне навчання поділяється на чотири типи, а саме:
- Контрольоване машинне навчання
- Машинне навчання без нагляду
- Напівкероване машинне навчання
- Навчання з підкріпленням
У цій темі ми надамо детальний опис типів машинного навчання разом із відповідними алгоритмами:
1. Контрольоване машинне навчання
Як випливає з назви, Контрольоване машинне навчання ґрунтується на нагляді. Це означає, що в техніці навчання під наглядом ми навчаємо машини за допомогою «позначеного» набору даних, і на основі навчання машина прогнозує результат. Тут позначені дані вказують на те, що деякі входи вже зіставлено з виходом. Більш дорогоцінно, ми можемо сказати; спочатку ми навчаємо машину введенням і відповідним виводом, а потім просимо машину передбачити вихід, використовуючи тестовий набір даних.
Розглянемо контрольоване навчання на прикладі. Припустімо, що ми маємо вхідний набір даних із зображеннями котів і собак. Отже, спочатку ми навчимо машину розуміти зображення, наприклад форма та розмір хвоста кота та собаки, форма очей, колір, зріст (собаки вищі, коти менші) тощо. Після завершення навчання ми вводимо зображення кота і просимо машину ідентифікувати об’єкт і передбачити результат. Тепер машина добре навчена, тому вона перевірить усі характеристики об’єкта, такі як зріст, форму, колір, очі, вуха, хвіст тощо, і виявить, що це кіт. Отже, це віднесе його до категорії Cat. Це процес, у якому машина ідентифікує об’єкти під час контрольованого навчання.
Основна мета методики навчання під керівництвом полягає в тому, щоб зіставити вхідну змінну (x) із вихідною змінною (y). Деякі реальні програми навчання під наглядом є Оцінка ризиків, виявлення шахрайства, фільтрація спаму, тощо
Категорії керованого машинного навчання
Контрольоване машинне навчання можна класифікувати на два типи проблем, які наведено нижче:
а) Класифікація
Алгоритми класифікації використовуються для вирішення задач класифікації, в яких вихідна змінна є категоричною, наприклад ' Так чи ні, чоловік чи жінка, червоний чи синій тощо . Алгоритми класифікації передбачають категорії, присутні в наборі даних. Деякі реальні приклади алгоритмів класифікації Виявлення спаму, фільтрація електронної пошти тощо.
Деякі популярні алгоритми класифікації наведені нижче:
б) Регресія
Алгоритми регресії використовуються для вирішення задач регресії, в яких існує лінійна залежність між вхідними та вихідними змінними. Вони використовуються для прогнозування безперервних змінних випуску, таких як ринкові тенденції, прогноз погоди тощо.
Деякі популярні алгоритми регресії наведені нижче:
Переваги та недоліки навчання під наглядом
Переваги:
- Оскільки контрольоване навчання працює з позначеним набором даних, ми можемо мати точне уявлення про класи об’єктів.
- Ці алгоритми допомагають передбачити результат на основі попереднього досвіду.
Недоліки:
- Ці алгоритми не здатні вирішувати складні завдання.
- Він може передбачити неправильний результат, якщо тестові дані відрізняються від даних навчання.
- Для навчання алгоритму потрібно багато обчислювального часу.
Застосування контрольованого навчання
Нижче наведено деякі поширені програми навчання під наглядом:
У сегментації зображень використовуються алгоритми навчання під наглядом. У цьому процесі класифікація зображень виконується на різних даних зображення з попередньо визначеними мітками.
Контрольовані алгоритми також використовуються в медичній галузі для діагностики. Це робиться за допомогою медичних зображень і минулих даних з мітками для захворювань. Завдяки такому процесу машина може ідентифікувати захворювання для нових пацієнтів.
2. Машинне навчання без нагляду
Навчання без нагляду g відрізняється від методики навчання під наглядом; як випливає з назви, немає потреби в нагляді. Це означає, що при неконтрольованому машинному навчанні машина навчається за допомогою немаркованого набору даних, і машина прогнозує вихідні дані без будь-якого нагляду.
У неконтрольованому навчанні моделі навчаються з даними, які не є ані засекреченими, ані позначеними, і модель діє на цих даних без будь-якого контролю.
Основною метою алгоритму неконтрольованого навчання є групування або категоризація несортованого набору даних відповідно до подібностей, моделей і відмінностей. Машини отримують інструкції знаходити приховані шаблони у вхідному наборі даних.
Давайте візьмемо приклад, щоб зрозуміти це більш цінно; Припустімо, що є кошик із зображеннями фруктів, і ми вводимо його в модель машинного навчання. Зображення абсолютно невідомі моделі, і завдання машини полягає в тому, щоб знайти закономірності та категорії об'єктів.
швета тіварі актор
Отже, тепер машина виявить свої закономірності та відмінності, такі як різниця кольорів, різниця у формі, і передбачить результат під час тестування за допомогою тестового набору даних.
Категорії неконтрольованого машинного навчання
Неконтрольоване навчання можна далі класифікувати на два типи, які наведено нижче:
1) Кластеризація
Техніка кластеризації використовується, коли ми хочемо знайти притаманні групи з даних. Це спосіб згрупувати об’єкти в кластер таким чином, щоб об’єкти з найбільшою кількістю подібностей залишалися в одній групі та мали менше або взагалі не мали подібностей з об’єктами інших груп. Прикладом алгоритму кластеризації є групування клієнтів за їх купівельною поведінкою.
Деякі з популярних алгоритмів кластеризації наведено нижче:
2) Асоціація
Навчання правилам асоціації – це техніка неконтрольованого навчання, яка знаходить цікаві зв’язки між змінними у великому наборі даних. Основна мета цього алгоритму навчання полягає в тому, щоб знайти залежність одного елемента даних від іншого елемента даних і відобразити ці змінні відповідно, щоб отримати максимальний прибуток. Цей алгоритм в основному застосовується в Аналіз ринкового кошика, аналіз веб-користування, безперервне виробництво і т.д.
Деякі популярні алгоритми навчання правил асоціації Апріорний алгоритм, Eclat, FP-алгоритм зростання.
Переваги та недоліки алгоритму неконтрольованого навчання
Переваги:
- Ці алгоритми можна використовувати для складніших завдань порівняно з контрольованими, оскільки ці алгоритми працюють із набором даних без міток.
- Алгоритми без контролю є кращими для різних завдань, оскільки отримати набір даних без міток легше порівняно з набором даних з мітками.
Недоліки:
- Результати неконтрольованого алгоритму можуть бути менш точними, оскільки набір даних не позначено, а алгоритми не навчені точним результатам попереднього.
- Працювати з неконтрольованим навчанням складніше, оскільки воно працює з немаркованим набором даних, який не зіставляється з результатом.
Застосування неконтрольованого навчання
3. Напівконтрольоване навчання
Напівконтрольоване навчання – це тип алгоритму машинного навчання, який знаходиться між керованим і неконтрольованим машинним навчанням . Він являє собою проміжну основу між контрольованим (з позначеними навчальними даними) і неконтрольованим навчанням (без позначених навчальних даних) алгоритмами та використовує комбінацію позначених і не позначених наборів даних протягом періоду навчання.
А Хоча напівконтрольоване навчання є серединою між контрольованим і неконтрольованим навчанням і працює з даними, які складаються з кількох міток, воно переважно складається з немаркованих даних. Оскільки етикетки дорогі, але для корпоративних цілей вони можуть мати небагато етикеток. Це повністю відрізняється від навчання під контролем і без нього, оскільки вони базуються на наявності та відсутності ярликів.
Щоб подолати недоліки алгоритмів навчання під контролем і навчання без контролю, вводиться концепція напівконтрольованого навчання . Основна мета напівконтрольованого навчання полягає в тому, щоб ефективно використовувати всі доступні дані, а не лише позначені дані, як у контрольованому навчанні. Спочатку подібні дані кластеризуються разом із алгоритмом неконтрольованого навчання, а потім це допомагає позначити дані без міток у дані з мітками. Це тому, що мічені дані є порівняно дорожчим придбанням, ніж не мічені дані.
Ми можемо уявити ці алгоритми на прикладі. Навчання під наглядом – це коли студент перебуває під наглядом інструктора вдома та в коледжі. Крім того, якщо цей учень самостійно аналізує ту саму концепцію без будь-якої допомоги викладача, це вважається навчанням без нагляду. Під напівконтрольованим навчанням студент має переглянути себе після аналізу тієї самої концепції під керівництвом інструктора в коледжі.
Переваги та недоліки напівконтрольованого навчання
Переваги:
- Алгоритм простий і зрозумілий.
- Він високоефективний.
- Він використовується для усунення недоліків алгоритмів навчання під контролем і без контролю.
Недоліки:
- Результати ітерацій можуть бути нестабільними.
- Ми не можемо застосувати ці алгоритми до даних на рівні мережі.
- Точність низька.
4. Навчання з підкріпленням
Навчання з підкріпленням працює на основі процесу зворотного зв’язку, у якому агент штучного інтелекту (програмний компонент A) автоматично досліджує навколишнє середовище, вдаряючи та слідуючи, вживаючи дій, навчаючись на досвіді та покращуючи свою продуктивність. Агент отримує винагороду за кожну хорошу дію і отримує покарання за кожну погану дію; отже, метою агента навчання з підкріпленням є максимізація винагороди.
У навчанні з підкріпленням немає позначених даних, таких як контрольоване навчання, і агенти навчаються лише на власному досвіді.
Процес навчання з підкріпленням подібний до людського; наприклад, дитина вчиться різним речам на досвіді свого повсякденного життя. Прикладом навчання з підкріпленням є гра в гру, де Гра — це середовище, рухи агента на кожному кроці визначають стани, а мета агента — отримати високий бал. Агент отримує зворотній зв'язок щодо покарань і винагород.
Завдяки своєму способу роботи навчання з підкріпленням використовується в різних сферах, наприклад Теорія ігор, дослідження операцій, теорія інформації, мультиагентні системи.
Проблему навчання з підкріпленням можна формалізувати за допомогою Марковський процес прийняття рішень (MDP). У MDP агент постійно взаємодіє з середовищем і виконує дії; на кожну дію середовище реагує і породжує новий стан.
Категорії навчання з підкріпленням
Навчання з підкріпленням поділяють на два типи методів/алгоритмів:
Реальні випадки використання Reinforcement Learning
Алгоритми RL дуже популярні в ігрових програмах. Він використовується для отримання надлюдської продуктивності. Деякі популярні ігри, які використовують алгоритми RL AlphaGO і AlphaGO Zero .
У документі «Керування ресурсами з глибоким підкріпленням навчання» показано, як використовувати RL у комп’ютері для автоматичного навчання та планування ресурсів для очікування різних завдань, щоб мінімізувати середнє сповільнення виконання завдань.
RL широко використовується в роботах. Роботи використовуються в промисловості та на виробництві, і ці роботи стають ще потужнішими за допомогою навчання з підкріпленням. Існують різні галузі, які мають своє бачення створення розумних роботів за допомогою штучного інтелекту та технології машинного навчання.
Видобуток тексту, одне з чудових застосувань НЛП, зараз реалізується за допомогою Reinforcement Learning від компанії Salesforce.
Переваги та недоліки навчання з підкріпленням
Переваги
- Це допомагає у вирішенні складних проблем реального світу, які важко вирішити за допомогою загальних методів.
- Модель навчання RL подібна до навчання людей; тому можна отримати найточніші результати.
- Допомагає досягти довготривалих результатів.
Недолік
- Алгоритми RL не є кращими для простих задач.
- Алгоритми RL вимагають величезних даних і обчислень.
- Занадто багато навчання з підкріпленням може призвести до перевантаження станів, що може послабити результати.
Прокляття розмірності обмежує навчання з підкріпленням для реальних фізичних систем.