logo

Моделі машинного навчання

Модель машинного навчання визначається як математичне представлення результату процесу навчання. Машинне навчання – це дослідження різних алгоритмів, які можна автоматично покращувати за допомогою досвіду та старих даних і створювати модель. Модель машинного навчання схожа на комп’ютерне програмне забезпечення, призначене для розпізнавання шаблонів або поведінки на основі попереднього досвіду чи даних. Алгоритм навчання виявляє шаблони в навчальних даних і виводить модель ML, яка фіксує ці шаблони та робить прогнози на основі нових даних.

Моделі машинного навчання

Давайте розберемо приклад моделі ML, де ми створюємо додаток для розпізнавання емоцій користувача на основі виразу обличчя. Отже, створення такого додатка можливо за допомогою моделей машинного навчання, де ми будемо навчати модель, подаючи зображення облич з різними емоціями, на яких позначені. Щоразу, коли ця програма використовується для визначення настрою користувача, вона зчитує всі подані дані, а потім визначає настрій будь-якого користувача.

Отже, простими словами, ми можемо сказати, що a Модель машинного навчання – це спрощене представлення чогось або процесу. У цій темі ми обговоримо різні моделі машинного навчання, їх методи й алгоритми .

Що таке модель машинного навчання?

Моделі машинного навчання можна розуміти як програму, навчену знаходити шаблони в нових даних і робити прогнози. Ці моделі представлені у вигляді математичної функції, яка приймає запити у формі вхідних даних, робить прогнози щодо вхідних даних, а потім надає вихід у відповідь. Спочатку ці моделі навчаються на наборі даних, а потім їм надається алгоритм для міркування над даними, вилучення шаблону з даних фіду та навчання на цих даних. Коли ці моделі навчені, їх можна використовувати для прогнозування невидимого набору даних.

Існують різні типи моделей машинного навчання на основі різних бізнес-цілей і наборів даних.

Класифікація моделей машинного навчання:

На основі різних бізнес-цілей і наборів даних існує три моделі навчання для алгоритмів. Кожен алгоритм машинного навчання розташовується в одній із трьох моделей:

  • Контрольоване навчання
  • Навчання без контролю
  • Навчання з підкріпленням
Моделі машинного навчання

Контрольоване навчання далі поділяється на дві категорії:

  • Класифікація
  • регресія

Неконтрольоване навчання також поділяється на такі категорії:

  • Кластеризація
  • Правило асоціації
  • Зменшення розмірності

1. Моделі керованого машинного навчання

Контрольоване навчання — це найпростіша модель машинного навчання, яка дає змогу зрозуміти, які вхідні дані називаються даними навчання та мають відому мітку або результат як вихід. Отже, він працює за принципом пар введення-виведення. Для цього потрібно створити функцію, яку можна навчити за допомогою навчального набору даних, а потім її застосувати до невідомих даних і забезпечити певну прогностичну продуктивність. Контрольоване навчання базується на виконанні завдань і перевіряється на позначених наборах даних.

Ми можемо реалізувати модель навчання під наглядом на простих життєвих проблемах. Наприклад, у нас є набір даних, що складається з віку та зросту; тоді ми можемо побудувати модель навчання під наглядом, щоб передбачити зріст людини на основі її віку.

Моделі навчання під наглядом поділяються на дві категорії:

регресія

У задачах регресії вихід є безперервною змінною. Нижче наведено деякі широко використовувані моделі регресії:

а) Лінійна регресія

Лінійна регресія — це найпростіша модель машинного навчання, у якій ми намагаємося передбачити одну вихідну змінну за допомогою однієї або кількох вхідних змінних. Представлення лінійної регресії – це лінійне рівняння, яке поєднує набір вхідних значень (x) і прогнозований вихід (y) для набору цих вхідних значень. Зображується у вигляді лінії:

Y = bx + c.

Моделі машинного навчання

Основна мета моделі лінійної регресії полягає в тому, щоб знайти найкращу лінію, яка найкраще відповідає точкам даних.

Лінійна регресія поширюється на множинну лінійну регресію (знайти площину найкращого підходу) і поліноміальну регресію (знайти криву найкращого припасування).

б) Дерево рішень

ідея intellij проти затемнення

Дерева рішень — це популярні моделі машинного навчання, які можна використовувати як для задач регресії, так і для класифікації.

Дерево рішень використовує деревоподібну структуру рішень разом із їхніми можливими наслідками та результатами. У цьому випадку кожен внутрішній вузол використовується для представлення перевірки атрибута; кожна гілка використовується для представлення результату тесту. Чим більше вузлів має дерево рішень, тим точнішим буде результат.

Перевага дерев рішень полягає в тому, що вони інтуїтивно зрозумілі та прості у реалізації, але їм бракує точності.

Дерева рішень широко використовуються в дослідження операцій, зокрема в аналізі рішень, стратегічному плануванні , і в основному в машинному навчанні.

в) Випадковий ліс

Випадковий ліс — це метод ансамблевого навчання, який складається з великої кількості дерев рішень. Кожне дерево рішень у випадковому лісі передбачає результат, і прогноз із більшістю голосів вважається результатом.

Модель випадкового лісу можна використовувати як для задач регресії, так і для класифікації.

Для завдання класифікації результат випадкового лісу береться з більшості голосів. Тоді як у задачі регресії результат береться із середнього або середнього прогнозів, створених кожним деревом.

г) Нейронні мережі

Нейронні мережі є підмножиною машинного навчання і також відомі як штучні нейронні мережі. Нейронні мережі складаються зі штучних нейронів і розроблені таким чином, що нагадує структуру та роботу людського мозку. Кожен штучний нейрон з’єднується з багатьма іншими нейронами нейронної мережі, і такі мільйони з’єднаних нейронів створюють складну когнітивну структуру.

Моделі машинного навчання

Нейронні мережі складаються з багатошарової структури, що містить один вхідний рівень, один або більше прихованих шарів і один вихідний рівень. Оскільки кожен нейрон з’єднаний з іншим нейроном, він передає дані з одного шару на інший нейрон наступних шарів. Нарешті, дані досягають останнього рівня або вихідного рівня нейронної мережі та генерують вихідні дані.

Нейронні мережі залежать від навчальних даних для навчання та підвищення їх точності. Однак ідеально навчена та точна нейронна мережа може швидко кластеризувати дані та стати потужним інструментом машинного навчання та ШІ. Однією з найвідоміших нейронних мереж є Алгоритм пошуку Google.

Класифікація

Моделі класифікації є другим типом методик навчання під керівництвом, які використовуються для створення висновків із спостережуваних значень у категоричній формі. Наприклад, модель класифікації може визначити, чи є електронний лист спамом чи ні; покупець придбає продукт чи ні тощо. Алгоритми класифікації використовуються для прогнозування двох класів і категоризації продукції в різні групи.

У класифікації розробляється модель класифікатора, яка класифікує набір даних за різними категоріями, і кожній категорії присвоюється мітка.

У машинному навчанні існує два типи класифікацій:

    Бінарна класифікація: якщо проблема містить лише два можливих класи, називається бінарним класифікатором. Наприклад, кіт чи собака, Так чи Ні,Багатокласова класифікація: якщо проблема містить більше двох можливих класів, це багатокласовий класифікатор.

Ось деякі популярні алгоритми класифікації:

а) Логістична регресія

Логістична регресія використовується для вирішення проблем класифікації в машинному навчанні. Вони подібні до лінійної регресії, але використовуються для прогнозування категоріальних змінних. Він може передбачити вихідні дані у вигляді «Так» або «Ні», 0 або 1, «Правда» або «Неправда» тощо. Однак замість того, щоб надавати точні значення, він надає ймовірнісні значення між 0 і 1.

б) опорна векторна машина

Машина опорних векторів або SVM — це популярний алгоритм машинного навчання, який широко використовується для задач класифікації та регресії. Однак, зокрема, він використовується для вирішення проблем класифікації. Основна мета SVM — знайти межі найкращого рішення в N-вимірному просторі, який може розділити точки даних на класи, а межа найкращого рішення відома як гіперплощина. SVM вибирає крайній вектор для знаходження гіперплощини, і ці вектори відомі як опорні вектори.

Моделі машинного навчання

в) Наївний Байєс

Naive Bayes — ще один популярний алгоритм класифікації, який використовується в машинному навчанні. Це називається так, оскільки воно базується на теоремі Байєса та дотримується наївного (незалежного) припущення між характеристиками, яке подано як:

Моделі машинного навчання

Кожен наївний класифікатор Байєса передбачає, що значення конкретної змінної не залежить від будь-якої іншої змінної/функції. Наприклад, якщо фрукт потрібно класифікувати за кольором, формою та смаком. Тож жовтий, овальний і солодкий буде визнано манго. Тут кожна функція не залежить від інших функцій.

2. Моделі машинного навчання без контролю

Моделі неконтрольованого машинного навчання реалізують процес навчання, протилежний керованому навчанню, що означає, що вони дають змогу моделі навчатися з непозначеного навчального набору даних. На основі непозначеного набору даних модель прогнозує результат. Використовуючи неконтрольоване навчання, модель вивчає приховані шаблони з набору даних сама без будь-якого контролю.

Моделі навчання без контролю в основному використовуються для виконання трьох завдань, а саме:

    Кластеризація
    Кластеризація — це техніка неконтрольованого навчання, яка включає кластеризацію або групування точок даних у різні кластери на основі подібностей і відмінностей. Об’єкти з найбільшою кількістю подібностей залишаються в одній групі, і вони не мають або мають дуже мало подібностей з іншими групами.
    Алгоритми кластеризації можна широко використовувати в різних задачах, таких як Сегментація зображень, аналіз статистичних даних, сегментація ринку і т.д.
    Деякі з найпоширеніших алгоритмів кластеризації є K-означає кластеризацію, ієрархічну кластеризацію, DBSCAN і т.д.
    Моделі машинного навчання Вивчення правила асоціації
    Навчання правилам асоціації – це техніка неконтрольованого навчання, яка знаходить цікаві зв’язки між змінними у великому наборі даних. Основна мета цього алгоритму навчання полягає в тому, щоб знайти залежність одного елемента даних від іншого елемента даних і відобразити ці змінні відповідно, щоб отримати максимальний прибуток. Цей алгоритм в основному застосовується в Аналіз ринкового кошика, аналіз веб-користування, безперервне виробництво і т.д.
    Деякі популярні алгоритми навчання правил асоціації Апріорний алгоритм, Eclat, FP-алгоритм зростання. Зменшення розмірності
    Кількість ознак/змінних, присутніх у наборі даних, відома як розмірність набору даних, а техніка, яка використовується для зменшення розмірності, відома як техніка зменшення розмірності.
    Хоча більше даних дає більш точні результати, це також може вплинути на продуктивність моделі/алгоритму, наприклад проблеми з переобладнанням. У таких випадках використовуються методи зменшення розмірності.
    ' Це процес перетворення набору даних вищих вимірів у набір даних менших вимірів, гарантуючи, що він надає подібну інформацію .'
    Різні методи зменшення розмірності, такі як PCA (аналіз основних компонентів), сингулярне розкладання тощо.

Навчання з підкріпленням

У навчанні з підкріпленням алгоритм вивчає дії для заданого набору станів, які ведуть до цільового стану. Це модель навчання на основі зворотного зв’язку, яка приймає сигнали зворотного зв’язку після кожного стану чи дії шляхом взаємодії з навколишнім середовищем. Цей зворотний зв’язок працює як винагорода (позитивна за кожну хорошу дію та негативна за кожну погану дію), і мета агента полягає в тому, щоб максимізувати позитивні винагороди для покращення своєї продуктивності.

Поведінка моделі в навчанні з підкріпленням подібна до навчання людини, оскільки люди вивчають речі через досвід у вигляді зворотного зв’язку та взаємодіють із середовищем.

Нижче наведено кілька популярних алгоритмів, які підпадають під навчання з підкріпленням:

    Q-навчання:Q-навчання є одним із популярних безмодельних алгоритмів навчання з підкріпленням, який базується на рівнянні Беллмана.

Він спрямований на вивчення політики, яка може допомогти агенту ШІ вжити найкращих заходів для максимізації винагороди за конкретних обставин. Він включає значення Q для кожної пари стан-дія, які вказують на винагороду за наступний шлях стану, і намагається максимізувати значення Q.

    Стан-дія-нагорода-держава-дія (SARSA):SARSA — це алгоритм згідно з правилами, заснований на процесі прийняття рішень Маркова. Він використовує дію, виконану поточною політикою, щоб дізнатися значення Q. Алгоритм SARSA стоїть для State Action Reward State Action, що символізує кортеж (s, a, r, s', a'). Deep Q Network:DQN або Deep Q Neural network — це Q-навчання всередині нейронної мережі. В основному він використовується у великому просторі станів, де визначення Q-таблиці було б складним завданням. Отже, у такому випадку, замість використання Q-таблиці, нейронна мережа використовує Q-значення для кожної дії на основі стану.

Навчання моделям машинного навчання

Після створення моделі машинного навчання її навчають, щоб отримати належні результати. Щоб навчити модель машинного навчання, потрібна величезна кількість попередньо оброблених даних. Тут попередньо оброблені дані означають дані в структурованій формі зі зменшеними нульовими значеннями тощо. Якщо ми не надамо попередньо оброблені дані, існує величезна ймовірність того, що наша модель працюватиме жахливо.

Як вибрати найкращу модель?

У наведеному вище розділі ми обговорили різні моделі та алгоритми машинного навчання. Але одне найбільш заплутане питання, яке може виникнути у будь-якого початківця: «Яку модель мені вибрати?». Отже, відповідь полягає в тому, що це залежить головним чином від бізнес-вимог або вимог проекту. Окрім цього, це також залежить від пов’язаних атрибутів, обсягу доступного набору даних, кількості функцій, складності тощо. Однак на практиці рекомендується завжди починати з найпростішої моделі, яку можна застосувати до конкретного проблему, а потім поступово збільшуйте складність і перевіряйте точність за допомогою налаштування параметрів і перехресної перевірки.

Різниця між моделлю машинного навчання та алгоритмами

Одне з найбільш заплутаних питань у початківців полягає в тому, що моделі машинного навчання та алгоритми однакові? Тому що в різних випадках у машинному навчанні та науці про дані ці два терміни використовуються як взаємозамінні.

Відповідь на це запитання – ні, і модель машинного навчання – це не те саме, що алгоритм. Простим способом ан Алгоритм ML схожий на процедуру або метод, який працює з даними, щоб виявити в них шаблони і створити модель. Водночас а Модель машинного навчання схожа на комп’ютерну програму, яка генерує результати або робить прогнози . Точніше, коли ми навчаємо алгоритм з даними, він стає моделлю.

 Machine Learning Model = Model Data + Prediction Algorithm