МАШИННЕ НАВЧАННЯ БЕЗ НАГЛЯДУ

У попередній темі ми дізналися про кероване машинне навчання, у якому моделі навчаються з використанням позначених даних під наглядом навчальних даних. Але може бути багато випадків, коли ми не маємо позначених даних і нам потрібно знайти приховані шаблони з заданого набору даних. Отже, для вирішення таких типів випадків у машинному навчанні нам потрібні методи навчання без контролю.

Що таке неконтрольоване навчання?

Як випливає з назви, неконтрольоване навчання — це техніка машинного навчання, у якій моделі не контролюються за допомогою навчального набору даних. Натомість моделі самі знаходять приховані закономірності та ідеї з наданих даних. Це можна порівняти з навчанням, яке відбувається в людському мозку під час вивчення нового. Його можна визначити як:

розділити на рядок java

Неконтрольоване навчання – це тип машинного навчання, у якому моделі навчаються за допомогою немаркованого набору даних і їм дозволяється діяти з цими даними без будь-якого контролю.

Неконтрольоване навчання не можна безпосередньо застосувати до проблеми регресії чи класифікації, оскільки, на відміну від контрольованого навчання, у нас є вхідні дані, але немає відповідних вихідних даних. Метою неконтрольованого навчання є знайти основну структуру набору даних, згрупувати ці дані відповідно до подібності та представити цей набір даних у стиснутому форматі .

приклад: Припустімо, що алгоритму неконтрольованого навчання надано вхідний набір даних, що містить зображення різних типів котів і собак. Алгоритм ніколи не навчається на заданому наборі даних, що означає, що він не має жодного уявлення про особливості набору даних. Завдання алгоритму неконтрольованого навчання полягає в тому, щоб самостійно визначити особливості зображення. Алгоритм неконтрольованого навчання виконає це завдання шляхом кластеризації набору даних зображень у групи відповідно до подібності між зображеннями.

Навіщо використовувати неконтрольоване навчання?

Нижче наведено кілька основних причин, які описують важливість неконтрольованого навчання:

Навчання без нагляду корисне для пошуку корисної інформації з даних.
Навчання без нагляду багато в чому схоже на те, як людина вчиться думати на основі власного досвіду, що робить його ближчим до справжнього ШІ.
Неконтрольоване навчання працює на немаркованих і некатегоризованих даних, що робить неконтрольоване навчання більш важливим.
У реальному світі ми не завжди маємо вхідні дані з відповідним виходом, тому для вирішення таких випадків нам потрібне неконтрольоване навчання.

Робота неконтрольованого навчання

Роботу неконтрольованого навчання можна зрозуміти за наведеною нижче схемою:

compareto в java

Тут ми взяли вхідні дані без міток, що означає, що вони не класифіковані, і відповідні виходи також не надаються. Тепер ці немічені вхідні дані передаються в модель машинного навчання для її навчання. По-перше, він інтерпретує необроблені дані, щоб знайти в них приховані шаблони, а потім застосовує відповідні алгоритми, такі як кластеризація k-середніх, дерево рішень тощо.

Після застосування відповідного алгоритму алгоритм розділяє об’єкти даних на групи відповідно до подібності та відмінності між об’єктами.

Типи алгоритму неконтрольованого навчання:

Алгоритм неконтрольованого навчання можна додатково розділити на два типи проблем:

Кластеризація: Кластеризація – це метод групування об’єктів у кластери таким чином, що об’єкти з найбільшою схожістю залишаються в групі та мають меншу схожість або зовсім не схожі з об’єктами іншої групи. Кластерний аналіз знаходить спільні риси між об’єктами даних і класифікує їх за наявністю та відсутністю цих спільних рис.Асоціація: Правило асоціації – це метод неконтрольованого навчання, який використовується для пошуку зв’язків між змінними у великій базі даних. Він визначає набір елементів, які зустрічаються разом у наборі даних. Правило асоціації робить маркетингову стратегію більш ефективною. Наприклад, люди, які купують товар X (припустимо, хліб), також схильні купувати товар Y (масло/джем). Типовим прикладом правила асоціації є аналіз ринкового кошика.

Примітка: ми ознайомимося з цими алгоритмами в наступних розділах.

Алгоритми неконтрольованого навчання:

Нижче наведено список деяких популярних алгоритмів неконтрольованого навчання:

K-означає кластеризацію KNN (k-найближчі сусіди) Ієрархічна кластеризація Виявлення аномалії Нейронні мережі Аналіз основних компонентів Незалежний аналіз компонентів Апріорний алгоритм Декомпозиція сингулярного значення

Переваги неконтрольованого навчання

Навчання без контролю використовується для більш складних завдань порівняно з навчанням під контролем, оскільки при навчанні без контролю у нас немає позначених вхідних даних.
Неконтрольоване навчання є кращим, оскільки легко отримати немічені дані порівняно з міченими.

Недоліки неконтрольованого навчання

Навчання без контролю за своєю суттю складніше, ніж навчання під контролем, оскільки воно не має відповідного результату.
Результат алгоритму неконтрольованого навчання може бути менш точним, оскільки вхідні дані не позначені, і алгоритми не знають точний результат заздалегідь.

TechCodeview

Машинне навчання без нагляду