Ma'lumotlarni qidirish va ma'lumotlar ombori
Ma'lumotni qazib olish va ma'lumotlar ombori ma'lumotlarni tahlil qilish uchun juda kuchli va mashhur usullardir. Statistikaga moyil bo'lgan foydalanuvchilar Data Mining-dan foydalanadilar. Ular ma'lumotlardagi yashirin naqshlarni izlash uchun statistik modellardan foydalanadilar. Ma'lumotlar konchilari turli xil ma'lumotlar elementlari o'rtasida foydali munosabatlarni topishdan manfaatdor, bu esa oxir-oqibat biznes uchun foydalidir. Boshqa tomondan, biznesning o'lchamlarini bevosita tahlil qila oladigan ma'lumotlar ekspertlari odatda ma'lumotlar omboridan foydalanadilar.
Ma'lumotni qazib olish, shuningdek, ma'lumotlarda bilimlarni aniqlash (KDD) sifatida ham tanilgan. Yuqorida aytib o'tilganidek, bu informatika sohasi bo'lib, u ilgari noma'lum va qiziqarli ma'lumotlarni xom ma'lumotlardan ajratib olish bilan shug'ullanadi. Ma'lumotlarning eksponensial o'sishi tufayli, ayniqsa biznes kabi sohalarda, ma'lumotlarni qazib olish ushbu katta ma'lumotlar boyligini biznes razvedkasiga aylantirish uchun juda muhim vositaga aylandi, chunki so'nggi bir necha o'n yilliklarda naqshlarni qo'lda olish imkonsiz bo'lib tuyuldi. Misol uchun, u hozirda ijtimoiy tarmoqlarni tahlil qilish, firibgarlikni aniqlash va marketing kabi turli xil ilovalar uchun ishlatiladi. Ma'lumotlarni qidirish odatda quyidagi to'rtta vazifa bilan shug'ullanadi: klasterlash, tasniflash, regressiya va assotsiatsiya. Klasterlash - tuzilmagan ma'lumotlardan o'xshash guruhlarni aniqlash. Tasniflash - bu yangi ma'lumotlarga qo'llanilishi mumkin bo'lgan o'rganish qoidalari va odatda quyidagi bosqichlarni o'z ichiga oladi: ma'lumotlarni oldindan qayta ishlash, modellashtirishni loyihalash, o'rganish/xususiyatlarni tanlash va baholash/tasdiqlash. Regressiya - bu ma'lumotlarni modellashtirishda minimal xato bilan funktsiyalarni topish. Va assotsiatsiya o'zgaruvchilar orasidagi munosabatlarni qidiradi. Ma'lumotlarni qidirish odatda Wal-Mart-da kelasi yili yuqori daromad olishga yordam beradigan asosiy mahsulotlar qanday? kabi savollarga javob berish uchun ishlatiladi.
Yuqorida aytib o'tilganidek, ma'lumotlar ombori ma'lumotlarni tahlil qilish uchun ham qo'llaniladi, lekin turli foydalanuvchilar to'plami va biroz boshqacha maqsadni ko'zlaydi. Misol uchun, chakana sektor haqida gap ketganda, ma'lumotlar ombori foydalanuvchilari xaridorlar orasida qaysi turdagi xaridlar mashhurligi bilan ko'proq qiziqishadi, shuning uchun tahlil natijalari mijozlar tajribasini yaxshilash orqali mijozga yordam berishi mumkin. Ammo ma'lumotlar konchilari birinchi navbatda xaridorlar ma'lum turdagi mahsulotni sotib olishlari va gipotezani tekshirish uchun ma'lumotlarni tahlil qilish kabi gipotezani taxmin qilishadi. Ma'lumotlarni saqlashni dastlab o'z do'konlarini bir xil o'lchamdagi mahsulotlar bilan to'ldiruvchi yirik chakana sotuvchi amalga oshirishi mumkin va keyinchalik Nyu-York do'konlari Chikagodagi do'konlarga qaraganda kichikroq inventarlarni tezroq sotayotganini bilib oladi. Shunday qilib, ushbu natijaga qarab, chakana sotuvchi Nyu-York doʻkonini Chikagodagi doʻkonlarga qaraganda kichikroq hajmda saqlashi mumkin.
Demak, siz aniq koʻrib turganingizdek, bu ikki turdagi tahlil oddiy koʻz bilan bir xil koʻrinadi. Ikkalasi ham tarixiy ma'lumotlarga asoslanib, daromadni oshirish haqida qayg'uradilar. Lekin, albatta, asosiy farqlar mavjud. Oddiy so'zlar bilan aytganda, ma'lumotlarni yig'ish va ma'lumotlar ombori har xil turdagi tahlillarni taqdim etishga bag'ishlangan, ammo, albatta, har xil turdagi foydalanuvchilar uchun. Boshqacha qilib aytadigan bo'lsak, Data Mining statistik gipotezani qo'llab-quvvatlash uchun korrelyatsiyalarni, naqshlarni qidiradi. Biroq, ma'lumotlar ombori nisbatan kengroq savolga javob beradi va kelajakda takomillashtirish yo'llarini aniqlash uchun ma'lumotlarni u yerdan ajratadi va ajratadi.