Data Mining va OLAP
Ham ma'lumotni qazib olish, ham OLAP ikkita umumiy Business Intelligence (BI) texnologiyalaridir. Biznes razvedkasi biznes ma'lumotlaridan foydali ma'lumotlarni aniqlash va olish uchun kompyuterga asoslangan usullarni anglatadi. Ma'lumotni qazib olish - bu katta ma'lumotlar to'plamidan qiziqarli naqshlarni olish bilan shug'ullanadigan informatika sohasi. U sun'iy intellekt, statistika va ma'lumotlar bazasini boshqarishning ko'plab usullarini birlashtiradi. Nomidan ko'rinib turibdiki, OLAP (onlayn analitik ishlov berish) ko'p o'lchovli ma'lumotlar bazalarini so'rash usullari to'plamidir.
Ma'lumotni qazib olish, shuningdek, ma'lumotlarda bilimlarni aniqlash (KDD) sifatida ham tanilgan. Yuqorida aytib o'tilganidek, bu informatika sohasi bo'lib, u ilgari noma'lum va qiziqarli ma'lumotlarni xom ma'lumotlardan ajratib olish bilan shug'ullanadi. Ma'lumotlarning eksponensial o'sishi tufayli, ayniqsa biznes kabi sohalarda, ma'lumotlarni qazib olish ushbu katta ma'lumotlar boyligini biznes razvedkasiga aylantirish uchun juda muhim vositaga aylandi, chunki so'nggi bir necha o'n yilliklarda naqshlarni qo'lda olish imkonsiz bo'lib tuyuldi. Misol uchun, u hozirda ijtimoiy tarmoqlarni tahlil qilish, firibgarlikni aniqlash va marketing kabi turli xil ilovalar uchun ishlatiladi. Ma'lumotlarni qidirish odatda quyidagi to'rtta vazifa bilan shug'ullanadi: klasterlash, tasniflash, regressiya va assotsiatsiya. Klasterlash - tuzilmagan ma'lumotlardan o'xshash guruhlarni aniqlash. Tasniflash - bu yangi ma'lumotlarga qo'llanilishi mumkin bo'lgan o'rganish qoidalari va odatda quyidagi bosqichlarni o'z ichiga oladi: ma'lumotlarni oldindan qayta ishlash, modellashtirishni loyihalash, o'rganish/xususiyatlarni tanlash va baholash/tasdiqlash. Regressiya - bu ma'lumotlarni modellashtirishda minimal xato bilan funktsiyalarni topish. Va assotsiatsiya o'zgaruvchilar orasidagi munosabatlarni qidiradi. Wal-Mart-da kelasi yili yuqori daromad olishga yordam beradigan asosiy mahsulotlar nima kabi savollarga javob berish uchun odatda maʼlumotlarni qidirishdan foydalaniladi.
OLAP - bu ko'p o'lchovli so'rovlarga javob beradigan tizimlar sinfidir. Odatda OLAP marketing, byudjetlashtirish, prognozlash va shunga o'xshash ilovalar uchun ishlatiladi. O'z-o'zidan ma'lumki, OLAP uchun ishlatiladigan ma'lumotlar bazalari tezkor ishlashni hisobga olgan holda murakkab va maxsus so'rovlar uchun tuzilgan. Odatda OLAP chiqishini ko'rsatish uchun matritsadan foydalaniladi. Satrlar va ustunlar so'rovning o'lchamlari bo'yicha shakllanadi. Xulosalarni olish uchun ular ko'pincha bir nechta jadvallarni yig'ish usullaridan foydalanadilar. Masalan, Wal-Mart-da o'tgan yilga nisbatan bu yilgi sotuvlar haqida bilish uchun foydalanish mumkinmi? Keyingi chorakda sotuvlar bo'yicha bashorat qanday? Foiz oʻzgarishiga qarab, trend haqida nima deyish mumkin?
Ma'lumotni qazib olish va OLAP bir-biriga o'xshashligi aniq bo'lsa-da, chunki ular razvedka olish uchun ma'lumotlar ustida ishlaydi, asosiy farq ularning ma'lumotlar bilan qanday ishlashidadir. OLAP vositalari ko'p o'lchovli ma'lumotlar tahlilini ta'minlaydi va ular ma'lumotlarning qisqacha mazmunini taqdim etadi, ammo aksincha, ma'lumotlarni qazib olish ma'lumotlar to'plamidagi nisbatlar, naqshlar va ta'sirlarga qaratilgan. Bu OLAP agregatsiyasi bo'lib, u "qo'shish" orqali ma'lumotlarning ishlashiga to'g'ri keladi, ammo ma'lumotlarni yig'ish "bo'linish" ga to'g'ri keladi. Yana bir e'tiborga molik farq shundaki, ma'lumotlarni qazib olish vositalari ma'lumotlarni modellashtirish va amalda qo'llash mumkin bo'lgan qoidalarni qaytarish bilan birga, OLAP real vaqtda biznes hajmi bo'yicha taqqoslash va kontrast usullarini amalga oshiradi.