KDD va ma'lumotlarni qazib olish o'rtasidagi farq

KDD va ma'lumotlarni qazib olish o'rtasidagi farq
KDD va ma'lumotlarni qazib olish o'rtasidagi farq

Video: KDD va ma'lumotlarni qazib olish o'rtasidagi farq

Video: KDD va ma'lumotlarni qazib olish o'rtasidagi farq
Video: Iphone 13 bo'yicha ilk ma'lumotlar: Dizayni, xotirasi va h.k. Eksklyuziv o'zbekcha texno blog 2024, Iyul
Anonim

KDD va Data mining

KDD (Ma'lumotlar bazalarida bilimlarni kashf etish) - raqamli ma'lumotlarning katta to'plamlaridan foydali va ilgari noma'lum ma'lumotlarni (ya'ni bilimlarni) olishda odamlarga yordam beradigan vositalar va nazariyalarni o'z ichiga olgan kompyuter fanining sohasi. KDD bir necha bosqichlardan iborat va Data Mining ulardan biridir. Ma'lumotni qazib olish - bu ma'lumotlardan naqshlarni olish uchun ma'lum bir algoritmni qo'llash. Shunga qaramay, KDD va Data Mining bir-birining o'rnida ishlatiladi.

KDD nima?

Yuqorida ta'kidlab o'tilganidek, KDD informatika sohasi bo'lib, u ilgari noma'lum va qiziqarli ma'lumotlarni xom ma'lumotlardan ajratib olish bilan shug'ullanadi. KDD - bu tegishli usullar yoki usullarni ishlab chiqish orqali ma'lumotlarni tushunishga urinishning butun jarayoni. Bu jarayon past darajadagi ma'lumotlarni ixchamroq, mavhum va foydaliroq bo'lgan boshqa shakllarga solish bilan shug'ullanadi. Bunga qisqa hisobotlarni yaratish, ma'lumotlarni ishlab chiqarish jarayonini modellashtirish va kelajakdagi holatlarni bashorat qila oladigan bashoratli modellarni ishlab chiqish orqali erishiladi. Ma'lumotlarning eksponentsial o'sishi tufayli, ayniqsa biznes kabi sohalarda, KDD bu katta ma'lumotlar boyligini biznes razvedkasiga aylantirish uchun juda muhim jarayonga aylandi, chunki so'nggi bir necha o'n yilliklarda naqshlarni qo'lda olish imkonsiz bo'lib tuyuldi. Masalan, u hozirda ijtimoiy tarmoqlarni tahlil qilish, firibgarlikni aniqlash, fan, sarmoya, ishlab chiqarish, telekommunikatsiya, ma'lumotlarni tozalash, sport, ma'lumot qidirish va asosan marketing kabi turli xil ilovalar uchun qo'llaniladi. KDD odatda Wal-Mart-da kelasi yili yuqori daromad olishga yordam beradigan asosiy mahsulotlar nima kabi savollarga javob berish uchun ishlatiladi. Bu jarayon bir necha bosqichlardan iborat. Bu dastur domenini va maqsadini tushunishni rivojlantirish va keyin maqsadli ma'lumotlar to'plamini yaratish bilan boshlanadi. Shundan so'ng ma'lumotlarni tozalash, oldindan qayta ishlash, qisqartirish va proyeksiya qilish amalga oshiriladi. Keyingi qadam naqshni aniqlash uchun Data Mining (quyida tushuntirilgan) dan foydalanishdir. Va nihoyat, kashf etilgan bilimlar vizualizatsiya va/yoki talqin qilish orqali mustahkamlanadi.

Data Mining nima?

Yuqorida aytib o'tilganidek, Data Mining - bu umumiy KDD jarayonidagi bir qadamdir. Ilovaning maqsadiga ko'ra aniqlangan ikkita asosiy Ma'lumot Mining maqsadi mavjud va ular tekshirish yoki kashfiyotdir. Tekshirish foydalanuvchining ma'lumotlar haqidagi gipotezasini tasdiqlaydi, kashfiyot esa avtomatik ravishda qiziqarli naqshlarni topadi. Ma'lumotlarni qidirishda to'rtta asosiy vazifa mavjud: klasterlash, tasniflash, regressiya va assotsiatsiya (jamlash). Klasterlash - tuzilmagan ma'lumotlardan o'xshash guruhlarni aniqlash. Tasniflash - bu yangi ma'lumotlarga qo'llanilishi mumkin bo'lgan o'rganish qoidalari. Regressiya - bu ma'lumotlarni modellashtirishda minimal xato bilan funktsiyalarni topish. Va assotsiatsiya o'zgaruvchilar orasidagi munosabatlarni qidiradi. Shundan so'ng, maxsus ma'lumotlarni qazib olish algoritmini tanlash kerak. Maqsadga qarab, chiziqli regressiya, logistik regressiya, qaror daraxtlari va Naive Bayes kabi turli xil algoritmlarni tanlash mumkin. Keyin bir yoki bir nechta vakillik shakllariga qiziqish namunalari qidiriladi. Nihoyat, modellar bashoratli aniqlik yoki tushunarlilik asosida baholanadi.

KDD va Data Mining oʻrtasidagi farq nima?

Garchi KDD va Data Mining atamalari bir-birining oʻrnida koʻp ishlatilsa-da, ular bir-biriga bogʻliq boʻlsa-da, bir-biridan farq qiluvchi ikkita tushunchaga ishora qiladi. KDD - bu ma'lumotlardan bilim olishning umumiy jarayoni, Data Mining esa ma'lumotlardagi naqshlarni aniqlash bilan shug'ullanadigan KDD jarayonining bir bosqichidir. Boshqacha qilib aytganda, Data Mining bu faqat KDD jarayonining umumiy maqsadiga asoslangan ma'lum bir algoritmni qo'llashdir.

Tavsiya: