Klasterlash va tasniflash oʻrtasidagi asosiy farq shundaki, klasterlash oʻxshash misollarni xususiyatlar asosida guruhlaydigan nazoratsiz oʻrganish usuli boʻlsa, klassifikatsiya esa funksiyalar asosida misollarga oldindan belgilangan teglarni tayinlaydigan nazorat ostidagi oʻrganish usulidir.
Klasterlash va tasniflash oʻxshash jarayonlar boʻlib koʻrinsa-da, ularning maʼnosiga koʻra ular oʻrtasida farq bor. Ma'lumotlar qazib olish dunyosida klasterlash va tasniflash o'rganishning ikki turidir. Bu ikkala usul ham obyektlarni bir yoki bir nechta xususiyatga ko‘ra guruhlarga ajratadi.
Klasterlash nima?
Klasterlash - ob'ektlarni shunday guruhlash usuliki, o'xshash xususiyatlarga ega bo'lgan ob'ektlar birlashadi va bir-biriga o'xshamaydigan ob'ektlar ajralib chiqadi. Bu mashinani o'rganish va ma'lumotlarni qazib olish uchun statistik ma'lumotlarni tahlil qilishning keng tarqalgan usuli. Maʼlumotlarni tahliliy tahlil qilish va umumlashtirish ham klasterlashdan foydalanadigan sohadir.
01-rasm: Klasterlash
Klasterlash nazoratsiz ma'lumotlarni qidirishga tegishli. Bu bitta aniq algoritm emas, balki vazifani hal qilishning umumiy usulidir. Shuning uchun turli algoritmlar yordamida klasterlashtirishga erishish mumkin. Tegishli klaster algoritmi va parametr sozlamalari alohida ma'lumotlar to'plamlariga bog'liq. Bu avtomatik vazifa emas, lekin bu takrorlanuvchi kashfiyot jarayonidir. Shuning uchun, natija kerakli xususiyatlarga erishguncha ma'lumotlarni qayta ishlash va parametrlarni modellashtirishni o'zgartirish kerak. K-klasterlash va ierarxik klasterlash ma'lumotlar qazib olishda ikkita keng tarqalgan klasterlash algoritmidir.
Tasniflash nima?
Tasniflash - bu ob'ektlarni tanib olish, farqlash va tushunish uchun o'quv ma'lumotlar to'plamidan foydalanadigan toifalash jarayoni. Tasniflash - bu oʻquv majmuasi va toʻgʻri belgilangan kuzatuvlar mavjud boʻlgan nazorat ostida oʻrganish usuli.
02-rasm: Tasniflash
Tasniflashni amalga oshiradigan algoritm klassifikator, kuzatishlar esa misollardir. K-Yaqin qoʻshni algoritmi va qarorlar daraxti algoritmlari maʼlumotlarni qazib olishda eng mashhur tasniflash algoritmlaridir.
Klasterlash va tasniflash oʻrtasidagi farq nima?
Klasterlash - bu nazoratsiz o'rganish, Tasniflash - bu nazorat ostida o'rganish usuli. U o'xshash misollarni xususiyatlar asosida guruhlaydi, tasniflash esa xususiyatlar asosida namunalarga oldindan belgilangan teglarni tayinlaydi. Klasterlash o'xshash xususiyatlarga ega misollarni guruhlash uchun ma'lumotlar to'plamini kichik to'plamlarga ajratadi. Unda yorliqli maʼlumotlar yoki oʻquv majmuasidan foydalanilmaydi. Boshqa tomondan, yangi ma'lumotlarni o'quv majmuasi kuzatuvlariga ko'ra tasniflang. Trening to‘plami yorliqlangan.
Klasterlashdan maqsad ob'ektlar to'plamini guruhlash va ular o'rtasida qandaydir bog'liqlik mavjudligini aniqlashdir, tasniflash esa oldindan belgilangan sinflar to'plamidan yangi ob'ekt qaysi sinfga tegishli ekanligini aniqlashga qaratilgan.
Xulosa – Klasterlash va tasniflash
Klasterlash va tasniflash oʻxshash koʻrinishi mumkin, chunki har ikkala maʼlumot qazib olish algoritmi ham maʼlumotlar toʻplamini kichik toʻplamlarga ajratadi, biroq ular xom maʼlumotlar toʻplamidan ishonchli maʼlumot olish uchun maʼlumotlarni qazib olishda ikki xil oʻrganish texnikasi. Klasterlash va tasniflash o'rtasidagi farq shundaki, klasterlash - bu o'xshash misollarni xususiyatlar asosida guruhlaydigan nazoratsiz o'rganish usuli, tasniflash esa xususiyatlar asosida misollarga oldindan belgilangan teglarni tayinlaydigan nazorat ostida o'rganish usulidir.
Rasm uchun ruxsat:
1.”Cluster-2″ by Cluster-2.gif: hellisp lotin ishi: (Ommaviy domen) Wikimedia Commons 2 orqali. “Magnetizm” Jon Aplessed – Oʻz ishim. (Ommaviy domen) Wikimedia Commonsorqali