DBMS va Data Mining
DBMS (Ma'lumotlar bazasini boshqarish tizimi) raqamli ma'lumotlar bazalarini boshqarish uchun ishlatiladigan to'liq tizim bo'lib, ma'lumotlar bazasi tarkibini saqlash, ma'lumotlarni yaratish/xizmat ko'rsatish, qidirish va boshqa funktsiyalarni amalga oshirish imkonini beradi. Boshqa tomondan, Data Mining - bu kompyuter fanining bir sohasi bo'lib, u xom ma'lumotlardan ilgari noma'lum va qiziqarli ma'lumotlarni olish bilan shug'ullanadi. Odatda, ma'lumotlarni qidirish jarayoni uchun kirish sifatida ishlatiladigan ma'lumotlar ma'lumotlar bazalarida saqlanadi. Statistikaga moyil bo'lgan foydalanuvchilar Data Mining-dan foydalanadilar. Ular ma'lumotlardagi yashirin naqshlarni izlash uchun statistik modellardan foydalanadilar. Ma'lumotlar konchilari turli xil ma'lumotlar elementlari o'rtasida foydali munosabatlarni topishdan manfaatdor, bu esa oxir-oqibat biznes uchun foydalidir.
DBMS
DBMS, ba'zan shunchaki ma'lumotlar bazasi menejeri deb ataladi, bu tizimda o'rnatilgan (masalan, qattiq disk yoki tarmoq) barcha ma'lumotlar bazalarini boshqarish (ya'ni tashkil etish, saqlash va qidirish) uchun mo'ljallangan kompyuter dasturlari to'plamidir.. Dunyoda ma'lumotlar bazasini boshqarish tizimlarining har xil turlari mavjud va ularning ba'zilari ma'lum maqsadlar uchun tuzilgan ma'lumotlar bazalarini to'g'ri boshqarish uchun mo'ljallangan. Eng mashhur tijorat ma'lumotlar bazasini boshqarish tizimlari Oracle, DB2 va Microsoft Access. Ushbu mahsulotlarning barchasi turli foydalanuvchilar uchun turli darajadagi imtiyozlarni taqsimlash vositalarini taqdim etadi, bu esa ma'lumotlar bazasini bitta administrator tomonidan markazlashtirilgan holda boshqarish yoki bir nechta turli odamlarga taqsimlash imkonini beradi. Har qanday ma'lumotlar bazasini boshqarish tizimida to'rtta muhim element mavjud. Ular modellashtirish tili, ma'lumotlar tuzilmalari, so'rovlar tili va tranzaktsiyalar mexanizmi. Modellashtirish tili ma'lumotlar bazasida joylashgan har bir ma'lumotlar bazasining tilini belgilaydi. Hozirgi vaqtda ierarxal, tarmoq, relyatsion va ob'ekt kabi bir qancha mashhur yondashuvlar amalda. Ma'lumotlar tuzilmalari alohida yozuvlar, fayllar, maydonlar va ularning ta'riflari va vizual media kabi ob'ektlar kabi ma'lumotlarni tartibga solishga yordam beradi. Ma'lumotlar so'rovi tili login ma'lumotlarini, turli foydalanuvchilarga kirish huquqlarini va tizimga ma'lumotlarni qo'shish protokollarini kuzatish orqali ma'lumotlar bazasi xavfsizligini ta'minlaydi. SQL - relyatsion ma'lumotlar bazasini boshqarish tizimlarida qo'llaniladigan mashhur so'rovlar tili. Nihoyat, tranzaktsiyalarni amalga oshirishga imkon beruvchi mexanizm parallellik va ko'plikka yordam beradi. Ushbu mexanizm bir xil yozuvni bir vaqtning o'zida bir nechta foydalanuvchilar tomonidan o'zgartirilmasligini ta'minlaydi va shu bilan ma'lumotlar yaxlitligini saqlaydi. Bundan tashqari, DBMS zaxira va boshqa imkoniyatlarni ham taqdim etadi.
Data Mining
Ma'lumotni qazib olish, shuningdek, ma'lumotlarda bilimlarni aniqlash (KDD) sifatida ham tanilgan. Yuqorida aytib o'tilganidek, bu kompyuter fanining felidi bo'lib, xom ma'lumotlardan ilgari noma'lum va qiziqarli ma'lumotlarni ajratib olish bilan shug'ullanadi. Ma'lumotlarning eksponensial o'sishi tufayli, ayniqsa biznes kabi sohalarda, ma'lumotlarni qazib olish ushbu katta ma'lumotlar boyligini biznes razvedkasiga aylantirish uchun juda muhim vositaga aylandi, chunki so'nggi bir necha o'n yilliklarda naqshlarni qo'lda olish imkonsiz bo'lib tuyuldi. Misol uchun, u hozirda ijtimoiy tarmoqlarni tahlil qilish, firibgarlikni aniqlash va marketing kabi turli xil ilovalar uchun ishlatiladi. Ma'lumotlarni qidirish odatda quyidagi to'rtta vazifa bilan shug'ullanadi: klasterlash, tasniflash, regressiya va assotsiatsiya. Klasterlash - tuzilmagan ma'lumotlardan o'xshash guruhlarni aniqlash. Tasniflash - bu yangi ma'lumotlarga qo'llanilishi mumkin bo'lgan o'rganish qoidalari va odatda quyidagi bosqichlarni o'z ichiga oladi: ma'lumotlarni oldindan qayta ishlash, modellashtirishni loyihalash, o'rganish/xususiyatlarni tanlash va baholash/tasdiqlash. Regressiya - bu ma'lumotlarni modellashtirishda minimal xato bilan funktsiyalarni topish. Va assotsiatsiya o'zgaruvchilar orasidagi munosabatlarni qidiradi. Ma'lumotlarni qidirish odatda Wal-Mart-da kelasi yili yuqori daromad olishga yordam beradigan asosiy mahsulotlar qanday? kabi savollarga javob berish uchun ishlatiladi.
DBMS va Data Mining oʻrtasidagi farq nima?
DBMS - bu raqamli ma'lumotlar bazalarini joylashtirish va boshqarish uchun to'liq huquqli tizim. Biroq, ma'lumotlarni qazib olish - bu informatika fanidagi texnika yoki tushuncha bo'lib, u xom ma'lumotlardan foydali va ilgari noma'lum ma'lumotlarni olish bilan shug'ullanadi. Ko'pincha, bu xom ma'lumotlar juda katta ma'lumotlar bazalarida saqlanadi. Shu sababli, ma'lumotlar konchilari ma'lumotlar bazasini qayta ishlash, boshqarish va hatto ma'lumotlarni qazib olish jarayonidan oldin va davomida qayta ishlash uchun mavjud bo'lgan DBMS funktsiyalaridan foydalanadilar. Biroq, ma'lumotlarni tahlil qilish uchun faqat DBMS tizimidan foydalanish mumkin emas. Biroq, hozirda ba'zi ma'lumotlar bazasi ma'lumotlar bazasida o'rnatilgan ma'lumotlarni tahlil qilish vositalari yoki imkoniyatlari mavjud.