logo

Машинне навчання без нагляду

У попередній темі ми дізналися про кероване машинне навчання, у якому моделі навчаються з використанням позначених даних під наглядом навчальних даних. Але може бути багато випадків, коли ми не маємо позначених даних і нам потрібно знайти приховані шаблони з заданого набору даних. Отже, для вирішення таких типів випадків у машинному навчанні нам потрібні методи навчання без контролю.

Що таке неконтрольоване навчання?

Як випливає з назви, неконтрольоване навчання — це техніка машинного навчання, у якій моделі не контролюються за допомогою навчального набору даних. Натомість моделі самі знаходять приховані закономірності та ідеї з наданих даних. Це можна порівняти з навчанням, яке відбувається в людському мозку під час вивчення нового. Його можна визначити як:

розділити на рядок java
Неконтрольоване навчання – це тип машинного навчання, у якому моделі навчаються за допомогою немаркованого набору даних і їм дозволяється діяти з цими даними без будь-якого контролю.

Неконтрольоване навчання не можна безпосередньо застосувати до проблеми регресії чи класифікації, оскільки, на відміну від контрольованого навчання, у нас є вхідні дані, але немає відповідних вихідних даних. Метою неконтрольованого навчання є знайти основну структуру набору даних, згрупувати ці дані відповідно до подібності та представити цей набір даних у стиснутому форматі .

приклад: Припустімо, що алгоритму неконтрольованого навчання надано вхідний набір даних, що містить зображення різних типів котів і собак. Алгоритм ніколи не навчається на заданому наборі даних, що означає, що він не має жодного уявлення про особливості набору даних. Завдання алгоритму неконтрольованого навчання полягає в тому, щоб самостійно визначити особливості зображення. Алгоритм неконтрольованого навчання виконає це завдання шляхом кластеризації набору даних зображень у групи відповідно до подібності між зображеннями.

Контрольоване машинне навчання

Навіщо використовувати неконтрольоване навчання?

Нижче наведено кілька основних причин, які описують важливість неконтрольованого навчання:

  • Навчання без нагляду корисне для пошуку корисної інформації з даних.
  • Навчання без нагляду багато в чому схоже на те, як людина вчиться думати на основі власного досвіду, що робить його ближчим до справжнього ШІ.
  • Неконтрольоване навчання працює на немаркованих і некатегоризованих даних, що робить неконтрольоване навчання більш важливим.
  • У реальному світі ми не завжди маємо вхідні дані з відповідним виходом, тому для вирішення таких випадків нам потрібне неконтрольоване навчання.

Робота неконтрольованого навчання

Роботу неконтрольованого навчання можна зрозуміти за наведеною нижче схемою:

compareto в java
Контрольоване машинне навчання

Тут ми взяли вхідні дані без міток, що означає, що вони не класифіковані, і відповідні виходи також не надаються. Тепер ці немічені вхідні дані передаються в модель машинного навчання для її навчання. По-перше, він інтерпретує необроблені дані, щоб знайти в них приховані шаблони, а потім застосовує відповідні алгоритми, такі як кластеризація k-середніх, дерево рішень тощо.

Після застосування відповідного алгоритму алгоритм розділяє об’єкти даних на групи відповідно до подібності та відмінності між об’єктами.

Типи алгоритму неконтрольованого навчання:

Алгоритм неконтрольованого навчання можна додатково розділити на два типи проблем:

Контрольоване машинне навчання
    Кластеризація: Кластеризація – це метод групування об’єктів у кластери таким чином, що об’єкти з найбільшою схожістю залишаються в групі та мають меншу схожість або зовсім не схожі з об’єктами іншої групи. Кластерний аналіз знаходить спільні риси між об’єктами даних і класифікує їх за наявністю та відсутністю цих спільних рис.Асоціація: Правило асоціації – це метод неконтрольованого навчання, який використовується для пошуку зв’язків між змінними у великій базі даних. Він визначає набір елементів, які зустрічаються разом у наборі даних. Правило асоціації робить маркетингову стратегію більш ефективною. Наприклад, люди, які купують товар X (припустимо, хліб), також схильні купувати товар Y (масло/джем). Типовим прикладом правила асоціації є аналіз ринкового кошика.

Примітка: ми ознайомимося з цими алгоритмами в наступних розділах.

Алгоритми неконтрольованого навчання:

Нижче наведено список деяких популярних алгоритмів неконтрольованого навчання:

    K-означає кластеризацію KNN (k-найближчі сусіди) Ієрархічна кластеризація Виявлення аномалії Нейронні мережі Аналіз основних компонентів Незалежний аналіз компонентів Апріорний алгоритм Декомпозиція сингулярного значення

Переваги неконтрольованого навчання

  • Навчання без контролю використовується для більш складних завдань порівняно з навчанням під контролем, оскільки при навчанні без контролю у нас немає позначених вхідних даних.
  • Неконтрольоване навчання є кращим, оскільки легко отримати немічені дані порівняно з міченими.

Недоліки неконтрольованого навчання

  • Навчання без контролю за своєю суттю складніше, ніж навчання під контролем, оскільки воно не має відповідного результату.
  • Результат алгоритму неконтрольованого навчання може бути менш точним, оскільки вхідні дані не позначені, і алгоритми не знають точний результат заздалегідь.