Asosiy farq – nazorat ostida va nazoratsiz mashina oʻrganish
Nazorat ostidagi oʻrganish va nazoratsiz oʻrganish mashinalarni oʻrganishning ikkita asosiy tushunchasidir. Nazorat ostida o'rganish - bu kirish-chiqish juftliklari misoli asosida kirishni chiqish bilan taqqoslaydigan funktsiyani o'rganish bo'yicha Machine Learning vazifasi. Nazoratsiz o'rganish - bu yorliqsiz ma'lumotlardan yashirin tuzilmani tavsiflash uchun funktsiyani chiqarish uchun Mashinani o'rganish vazifasi. Nazorat ostidagi va nazoratsiz mashinani oʻrganish oʻrtasidagi asosiy farq shundaki, nazorat ostida oʻrganish yorliqli maʼlumotlardan, nazoratsiz oʻrganish esa yorliqsiz maʼlumotlardan foydalanadi.
Mashinani oʻrganish - bu kompyuter fanining sohasi boʻlib, u kompyuter tizimiga aniq dasturlashtirilmagan holda maʼlumotlardan oʻrganish imkoniyatini beradi. Bu ma'lumotlarni tahlil qilish va undagi naqshlarni bashorat qilish imkonini beradi. Mashinani o'rganishning ko'plab ilovalari mavjud. Ulardan ba'zilari yuzni aniqlash, imo-ishoralarni aniqlash va nutqni aniqlashdir. Mashinani o'rganish bilan bog'liq turli xil algoritmlar mavjud. Ulardan ba'zilari regressiya, tasniflash va klasterlashdir. Mashina o'rganishga asoslangan ilovalarni ishlab chiqish uchun eng keng tarqalgan dasturlash tillari R va Python hisoblanadi. Java, C++ va Matlab kabi boshqa tillardan ham foydalanish mumkin.
Nazorat ostidagi ta'lim nima?
Mashina oʻrganishga asoslangan tizimlarda model algoritm boʻyicha ishlaydi. Nazorat ostidagi ta'limda model nazorat qilinadi. Birinchidan, modelni o'rgatish kerak. Olingan bilimlar bilan u kelajakdagi holatlar uchun javoblarni bashorat qilishi mumkin. Model etiketli ma'lumotlar to'plami yordamida o'qitiladi. Tizimga namunadan tashqari ma'lumotlar berilsa, u natijani bashorat qilishi mumkin. Quyida mashhur IRIS maʼlumotlar toʻplamidan kichik koʻchirma berilgan.
Yuqoridagi jadvalga koʻra, Sepal uzunligi, Sepal kengligi, Patel uzunligi, Patel kengligi va Turlar atributlar deb ataladi. Ustunlar xususiyatlar sifatida tanilgan. Bitta qatorda barcha atributlar uchun ma'lumotlar mavjud. Shuning uchun bir qator kuzatish deyiladi. Ma'lumotlar raqamli yoki toifali bo'lishi mumkin. Modelga kirish sifatida tegishli tur nomi bilan kuzatuvlar beriladi. Yangi kuzatuv berilganda, model qaysi turga mansubligini bashorat qilishi kerak.
Nazorat ostidagi ta'limda tasniflash va regressiya algoritmlari mavjud. Tasniflash - bu etiketlangan ma'lumotlarni tasniflash jarayoni. Model ma'lumotlar toifalarini ajratuvchi chegaralarni yaratdi. Modelga yangi ma'lumotlar taqdim etilganda, u nuqta mavjud bo'lgan joyga qarab tasniflanishi mumkin. K-Eng yaqin qo'shnilar (KNN) tasniflash modelidir. k qiymatiga qarab toifaga qaror qilinadi. Misol uchun, k 5 bo'lsa, ma'lum bir ma'lumot nuqtasi A toifasida sakkizta ma'lumot nuqtasiga va B toifasida oltita ma'lumot nuqtasiga yaqin bo'lsa, u holda ma'lumot nuqtasi A sifatida tasniflanadi.
Regressiya - bu yangi ma'lumotlarning natijasini bashorat qilish uchun oldingi ma'lumotlar tendentsiyasini bashorat qilish jarayoni. Regressiyada chiqish bir yoki bir nechta uzluksiz o'zgaruvchilardan iborat bo'lishi mumkin. Bashorat ko'pchilik ma'lumotlar nuqtalarini qamrab oluvchi chiziq yordamida amalga oshiriladi. Eng oddiy regressiya modeli chiziqli regressiya hisoblanadi. Bu tez va KNNdagi kabi sozlash parametrlarini talab qilmaydi. Agar ma'lumotlar parabolik tendentsiyani ko'rsatsa, chiziqli regressiya modeli mos kelmaydi.
Bular nazorat ostidagi oʻrganish algoritmlariga misollar. Umuman olganda, nazorat ostidagi ta'lim usullaridan olingan natijalar aniqroq va ishonchli bo'ladi, chunki kiritilgan ma'lumotlar yaxshi ma'lum va etiketlanadi. Shuning uchun mashina faqat yashirin naqshlarni tahlil qilishi kerak.
Nazoratsiz ta'lim nima?
Nazoratsiz oʻrganishda model nazorat qilinmaydi. Natijalarni bashorat qilish uchun model o'z-o'zidan ishlaydi. Belgilanmagan ma'lumotlar bo'yicha xulosaga kelish uchun u mashinani o'rganish algoritmlaridan foydalanadi. Umuman olganda, nazoratsiz o'rganish algoritmlari nazorat ostidagi o'rganish algoritmlariga qaraganda qiyinroq, chunki ma'lumotlar kam. Klaster - bu nazoratsiz o'rganishning bir turi. U noma'lum ma'lumotlarni algoritmlar yordamida guruhlash uchun ishlatilishi mumkin. K-o'rtacha va zichlikka asoslangan klasterlash ikkita klasterlash algoritmidir.
k-o'rtacha algoritm, har bir klaster uchun tasodifiy ravishda k markazni joylashtiradi. Keyin har bir ma'lumot nuqtasi eng yaqin markazga tayinlanadi. Evklid masofasi ma'lumotlar nuqtasidan markazgacha bo'lgan masofani hisoblash uchun ishlatiladi. Ma'lumotlar nuqtalari guruhlarga bo'lingan. K centroidlar uchun pozitsiyalar yana hisoblab chiqiladi. Yangi markazning pozitsiyasi guruhdagi barcha nuqtalarning o'rtacha qiymati bilan aniqlanadi. Yana har bir ma'lumot nuqtasi eng yaqin markazga tayinlanadi. Bu jarayon markazlar o'zgarmaguncha takrorlanadi. k-o'rtacha tez klasterlash algoritmidir, lekin klasterlash nuqtalarining aniq ishga tushirilishi yo'q. Bundan tashqari, klaster nuqtalarini ishga tushirishga asoslangan klasterlash modellarining katta xilma-xilligi mavjud.
Klasterlashning yana bir algoritmi Zichlikka asoslangan klasterlashdir. U shovqinli zichlikka asoslangan fazoviy klasterlash ilovalari sifatida ham tanilgan. U klasterni zichlikdagi bog'langan nuqtalarning maksimal to'plami sifatida belgilash orqali ishlaydi. Ular zichlikka asoslangan klasterlash uchun ishlatiladigan ikkita parametrdir. Ular Ɛ (epsilon) va minimal nuqtalardir. Ɛ - mahallaning maksimal radiusi. Minimal ballar klasterni aniqlash uchun Ɛ mahallasidagi minimal nuqtalar sonidir. Bular nazoratsiz taʼlimga tegishli boʻlgan klasterlashning ayrim misollari.
Umuman olganda, nazoratsiz oʻrganish algoritmlari natijasida olingan natijalar unchalik aniq va ishonchli emas, chunki mashina yashirin naqsh va funksiyalarni aniqlashdan oldin kirish maʼlumotlarini aniqlashi va yorliqlashi kerak.
Nazorat ostidagi va nazoratsiz mashinani oʻrganish oʻrtasidagi oʻxshashlik nimada?
Nazorat ostidagi va nazoratsiz ta'lim Mashinani o'rganishning bir turi
Nazorat ostidagi va nazoratsiz mashinani oʻrganish oʻrtasidagi farq nima?
Nazorat ostida va nazoratsiz mashina oʻrganish |
|
Nazorat ostida oʻrganish - bu kirish-chiqish juftliklari asosida kirishni chiqish bilan taqqoslaydigan funktsiyani oʻrganishga moʻljallangan Machine Learning vazifasi. | Nazoratsiz oʻrganish - bu yorliqsiz maʼlumotlardan yashirin tuzilmani tavsiflash funksiyasini chiqarishga moʻljallangan Machine Learning vazifasi. |
Asosiy funksiya | |
Nazorat ostidagi ta'limda model belgilangan kirish ma'lumotlari asosida natijani bashorat qiladi. | Nazoratsiz oʻrganishda model oʻz-oʻzidan naqshlarni aniqlab, yorliqli maʼlumotlarsiz natijani bashorat qiladi. |
Natijalarning aniqligi | |
Nazorat ostidagi oʻrganish usullaridan olingan natijalar aniqroq va ishonchli. | Nazoratsiz oʻrganish usullaridan olingan natijalar unchalik aniq va ishonchli emas. |
Asosiy algoritmlar | |
Nazorat ostidagi ta'limda regressiya va tasniflash algoritmlari mavjud. | Nazoratsiz oʻrganishda klasterlash algoritmlari mavjud. |
Xulosa – nazorat ostida va nazoratsiz mashina oʻrganish
Nazorat ostidagi ta'lim va nazoratsiz o'rganish - Mashina o'rganishning ikki turi. Nazorat ostida oʻrganish - bu kirish-chiqish juftliklari asosida kirishni chiqishga moslashtiradigan funksiyani oʻrganish boʻyicha Machine Learning vazifasi. Nazorat qilinmagan o'rganish - bu yorliqsiz ma'lumotlardan yashirin tuzilmani tavsiflash uchun funktsiyani chiqarish uchun Mashinani o'rganish vazifasi. Nazorat ostidagi va nazoratsiz mashinani oʻrganish oʻrtasidagi farq shundaki, nazorat ostida oʻrganish yorliqli maʼlumotlardan, nazoratsiz tayanch esa yorliqsiz maʼlumotlardan foydalanadi.