داده کاوی یا Data Mining چیست؟
داده کاوی یا Data Mining چیست؟
داده کاوی، پایگاهها و مجموعههای حجیم دادهها را در پی کشف واستخراج دانش، مورد تحلیل و کند و کاوهای ماشینی (و نیمهماشینی) قرار میدهد. این گونه مطالعات و کاوشها را به واقع میتوان همان امتداد و استمرار دانش کهن و همه جا گیر آمار دانست. تفاوت عمده در مقیاس، وسعت و گوناگونی زمینهها و کاربردها، و نیز ابعاد و اندازههای دادههای امروزین است که شیوههای ماشینی مربوط به یادگیری، مدلسازی، و آموزش را طلب مینماید.
امروزه در اکثر سازمان ها، داده ها به سرعت در حال جمع آوری و ذخیره شدن می باشند. اما می توان ادعا کرد که علیرغم این حجم انبوه داده ها، امروزه سازمان ها با فقر دانش در تصمیم گیری روبرو هستند. بنابر این علم داده کاوی مطرح می شود تا پاسخگوی این نیاز های مدیران شود.
داده کاوی یعنی استخراج اطلاعات گرانبها از حجم عظیم معادن داده ها. فلسفه ی داده کاوی این است که با شناخت درست از گذشته، آینده را می توان پیش بینی کرد.
در سال ۱۹۶۰ آماردانان اصطلاح “Data Fishing” یا “Data Dredging”به معنای “صید داده” را جهت کشف هر گونه ارتباط در حجم بسیار بزرگی از داده ها بدون در نظر گرفتن هیچگونه پیش فرضی بکار بردند. بعد از سی سال و با انباشته شدن داده ها در پایگاه های داده یا Database اصطلاح “Data Mining” یا داده کاوی در حدود سال ۱۹۹۰ رواج بیشتری یافت. اصطلاحات دیگری نظیر “Data Archaeology”یا “Information Harvesting” یا “Information Discovery” یا”Knowledge Extraction” نیز بکار رفته اند.
اصطلاح Data Mining همان طور که از ترجمه آن به معنی داده کاوی مشخص میشود به مفهوم استخراج اطلاعات نهان و یا الگوها وروابط مشخص در حجم زیادی از دادهها در یک یا چند بانک اطلاعاتی بزرگ است.
وظیفه ی داده کاوی، کاویدن و استخراج از منابع عظیم داده و بانک های اطلاعاتی است تا اطلاعات گران بهایی که در حجم انبوهی از اطلاعات سطحی پنهان شده است را استخراج کند. «داده کاوی» ترجمه ی عبارت «Data Mining» و به معنای «کاویدن معادن داده» است.
تفاوت اصلی داده کاوی و علم آمار، در حجم داده های مورد تحلیل، روش مدلسازی داده ها و استفاده از هوش مصنوعی است. فرآیند داده کاوی در استاندارد «کریسپ دی ام» در طول شش مرحله اجرا می شود.
در ابتدای فرایند داده کاوی، مشکلات شرکت یا سازمان شما پیدا خواهد شد و در پایان با کمک هوش مصنوعی، راهکارهایی برای حل آن مشکلات در اختیار شما قرار خواهد گرفت.
پس از یافتن مشکلات در ابتدای فرآیند داده کاوی، اطلاعات ریز ثبت شده در شرکت یا خط تولید شما دریافت می شود.
بر اساس این اطلاعات، مکانیزم های مرتبط در کسب و کار شما مدلسازی کامپیوتری می شود و سپس با کمک متدهای «یادگیری ماشین» راه حل هایی برای از بین بردن مشکلات شرکت شما در چارچوب گزارشات مستند و نرم افزار رایانه ای در اختیار شما قرار می گیرد.
فلسفه ی داده کاوی این است که آینده، بسیار به گذشته شبیه است. اگر گذشته را خوب بشناسید می توانید آینده را پیش بینی کنید. داده کاوی به شما کمک می کند تا رفتار کسب و کار خود را در گذشته دقیقاً بشناسید و بر اساس آن آینده را با تقریب بالا پیش بینی کنید. به عنوان مثال داده کاوی به شما کمک می کند تا حداقل دو مورد اساسی را در بخش فروش کسب و کار خود پیش بینی کنید:
پیش بینی نیاز های یک مشتری خاص در آینده و در نتیجه حفظ آن مشتری
پیش بینی نیاز بازار در زمان ها و مناطق مختلف و در نتیجه ساماندهی نظام توزیع برای آنها
در نهایت با داده کاوی شما مجبور می شوید تصمیمات احساسی را فراموش کنید و بر اساس واقعیت ها تصمیم بگیرید. بنابراین ضرر های ناشی از نا آگاهی مدیران حذف می شود.
از معروف ترین ابزار های Data Mining می توان رپیدماینر و نرمافزار وکا را نام برد .