شاید تصور شود که داده کاوی یک اختراع جدید مربوط به عصر دیجیتال است. این مفهوم به حدود یک قرن پیش بازمیگردد، اما در دهه 1930 توجه ویژهای به آن شد. یکی از نخستین مواردی که کاوش در دادهها در آن اتفاق افتاد مربوط به سال 1936 است وقتی که آلن تیورینگ ایده یک ماشین یونیورسال را پیش کشید که میتوانست در حد کامپیوترهای مدرن آن زمان، محاسبات پیچیدهای انجام دهد.
امروزه کسب و کارها از این رویکرد و از یادگیری ماشین برای بهبود هرچیزی، از فرآیندهای فروش گرفته تا تفسیر منابع مالی برای اهداف سرمایه گذاری، استفاده میکنند. در نتیجه متخصصان داده، برای سازمانهای تمام نقاط دنیا حیاتی شدهاند و شرکتها به دنبال دستیابی به اهداف بزرگتری با استفاده از علم داده کاوی هستند.
داده کاوی شامل فرآیند تجزیه و تحلیل حجم وسیعی از دادهها برای کشف هوش تجاری است که در حل مشکلات، کاهش ریسک و تصاحب فرصتهای جدید به سازمانها کمک کند.
در چه مواردی از داده کاوی استفاده میشود
- آنالیز سبد
این اصطلاح سبد خرید در دنیای واقعی یا مجازی بازمیگردد که مشتریان هنگام خرید از آن استفاده میکنند. تحلیلگر داده به ترجیحات مشتری نگاهی میاندازد و سعی میکند تمایل مشتری را برای خریدهای آتی بر اساس آنچه که تا کنون خریده، پیش بینی نماید. آنالیز سبد علاوه بر ردیابی خرید محصولات و سرویسها، در نظارت بر گزینههای پرداخت و کارتهای هدیه نیز مفید است.
به عنوان مثال خریداری به نام سام را در نظر بگیرید. سام به یک سوپرمارکت رفته و اقلامی را خریداری میکند که امتیازهای اضافی برای دریافت کارتهای هدایای فروشگاه دارند. سپس مبلغ آنها را با کارت اعتباری میپردازد. حال شرکت میتواند استفاده از کارت اعتباری را با برنامه پاداش و سطح موجودی مرتبط نموده و موجودی خود را به طور موثر مدیریت نماید.
- پیش بینی فروش
اگرچه این مفهوم مشابه آنالیز سبد است، اما به جای اینکه حدس بزنند مشتری چه چیزی را خریداری میکند، تلاش میکنند بفهمند مشتری چه زمانی در آینده دوباره کالاهای خاصی را خریداری خواهد کرد. به عنوان مثال، اگر سام همزنی را خریداری کند که بر اساس بررسی عملکرد سه سال دوام میکند، فروشگاهی که سام همزن را از آن خریده قصد دارد سه سال دیگر همزنهای مشابهی عرضه کند که سام یکی از آنها را حتی اگر مشابه قبلی نباشند، خریداری کند. یک فروشگاه همچنین میتواند خریدهای مشابهی را که مشتریان از فروشگاههای دیگر انجام میدهند، بررسی نموده و در تلاش برای جلب مشتری، رویکردی مشابه سایر فروشگاهها برگزیند.
- بازاریابی بر اساس پایگاه داده
با استفاده از این استراتژی داده کاوی، یک شرکت میتواند مجموعهای از محصولات و خدمات ایجاد کند که خودشان را میفروشند. این شرکت به جای اینکه به خواستههای سام بپردازد، از طریق داده کاوی، آنچه که صدها هزار “سام” میخواهند را تجزیه و تحلیل میکند. فرض کنید سام یک بومی آمریکایی دارای وزن بالا و 60 ساله است. این شرکت ترجیحات افراد بومی آمریکایی 60 ساله و دارای اضافه وزن را مورد بررسی قرار داده و برنامههای تبلیغاتی ایجاد خواهد کرد که با آن ناحیه خاص از جمعیت صحبت کند. حتی اگر یک “سام” خاص به تبلیغات پاسخ ندهد، ایده موجود این است که به اندازه کافی “سام” وجود دارد که به آن پاسخ میدهند و باعث ارزشمند بودن استراتژی بازاریابی برای شرکت میشود.
- برنامه ریزی موجودی
درک این کاربرد برای داده کاوی آسان است. اگر فروشگاهی از سال 2003 حداقل 2500 عدد از یک محصول در هر تابستان فروخته باشد، دلیل بر این است که فروشگاه میتواند در تابستان سال آینده نیز حداقل 2500 عدد از همان بفروشد. همچنین ارزیابی روند افزایش یا کاهش میزان فروش به صورت ماه به ماه یا حتی هفته به هفته و تصمیم گیری کاملاً منطقی درمورد اینکه کدام محصول را برای انبار کردن خریداری میکنیم، کاملاً ساده است.
- وفاداری مشتری
یک شرکت میتواند دادههای مربوط به مشتریان خود را بررسی کند تا ببیند که چگونه تغییرات قیمت آنها را جذب میکند و یا به سمت رقبا میفرستد. این استراتژی داده کاوی ارتباط تنگاتنگی با برنامه پاداش فروشگاه دارد.
به عنوان مثال، اگر سام طی سالهای گذشته برای همزن خود، یک پلوپز، سفر به جزیره ایستر و 1000 دلار خرید مواد غذایی، پاداش گرفته باشد، به راحتی میتوان گفت که او یک مشتری وفادار است. فروشگاه میتواند پیشنهادات خود را با توجه به موارد دلخواه سام برنامه ریزی نموده و بداند که او باز خواهد گشت. علاوه برآن، با بررسی آمار وفاداری مشتری، یک شرکت میتواند آنچه مشتریان آن را با ارزش میدانند تعیین کند و در جهت ایجاد ارزش اضافی متناسب با ترجیحات مشتری صرف نظر از قیمت گذاری، تلاش نماید.
مزایا
مدیریت ارتباط با مشتری: داده کاوی با هدف ایجاد روابط یک به یک با مشتریان از طریق درک صحیح نیازها و خواستههای آنها، میتواند بسیار مفید واقع شود. این رویکرد میتواند با دادههای تولید شده از رویدادهای مختلف (سوالات مربوط به محصول، فروش، بررسی محصولات)، به روشهای مختلف بینش بیشتری ایجاد کند.
- شناسایی خریداران احتمالی محصولات و خدمات جدید
- دلایل اصلی ناامید شدن مشتری جهت بهبود حفظ مشتریان
- کشف ارتباطات متغیر بین محصولات و خدمات برای به حداکثر رساندن فروش و ارزش مشتری
- شناسایی سودآورترین مشتریان و نیازهای ترجیحی آنها برای تقویت روابط و به حداکثر رساندن فروش
صنعت خرده فروشی:
- پیش بینی حجم دقیق فروش در سطوح خاص موجودی
- شناسایی روابط فروش بین انواع مختلف محصول (آنالیز سبد بازار)
- پیش بینی سطح مصرف انواع مختلف محصول (بر اساس شرایط فصلی و محیطی) برای بهینه سازی تدارکات و در نتیجه به حداکثر رساندن درآمد
- کشف الگوهای جالب توجه در حرکت محصولات، به ویژه محصولات با ماندگاری کوتاه، در یک زنجیره تأمین با تجزیه و تحلیل دادههای حسی و RFID
ساخت و تولید:
- پیش بینی خرابی ماشین آلات قبل از وقوع آنها با استفاده از دادههای حسی، که امکان تعمیر و نگهداری مبتنی بر شرایط را فراهم میکند.
- شناسایی اشتراکات و ناهنجاریها در سیستمهای تولید برای بهینه سازی ظرفیت تولید
- کشف الگوهای جدید برای شناسایی و بهبود کیفیت محصول
صنعت مسافرت (خطوط هوایی یا هتلها):
- پیش بینی فروش خدمات مختلف (انواع صندلی در هواپیما، نوع اتاق هتل) جهت یافتن قیمت بهینه خدمات برای به حداکثر رساندن درآمد به عنوان تابعی از مدیریت عملکرد
- پیش بینی تقاضا در مکانهای مختلف برای تخصیص بهتر منابع محدود سازمان
- شناسایی سودآورترین مشتریها و ارائه خدمات شخصی برای حفظ آنها
- شناسایی و بهبود دلایل اصلی فرسایش کارمندان با ارزش به منظور حفظ آنها
مراحل انجام داده کاوی
مراحل داده کاوی ممکن است متفاوت باشد. تعداد دقیق مراحل درگیر در این رویکرد میتواند براساس متخصص، دامنه مشکل و نحوه جمع آوری مراحل و نامگذاری آنها متفاوت باشد. صرف نظر از این موضوع، معمولا مراحل زیر بخشی از فرآیند داده کاوی به حساب میآیند:
- تعریف مشکل این مرحله حتی اگر هیچ ارتباطی با جنبههای فنی داده کاوی نداشته باشد، یکی از مهمترین مراحل است. این مرحله شامل دو بخش است:
- شناسایی اهداف تجاری: کدام مشکل کسب و کار را میخواهید حل کنید؟ به دست آوردن مشتری؟ حفظ مشتری؟ کاهش هزینههای نگهداری یا هزینههای عملیاتی؟ برای دریافت ایده، برخی از نمونههای دادهکاوی را بررسی کنید.
- شناسایی اهداف داده کاوی: اهداف تجاری انتخاب شده چگونه به اهداف خاص پروژه دادهکاوی تبدیل میشوند؟ پاسخ به این سوال منجر به کشف این خواهد شد که چه مجموعه داده ای ممکن است لازم باشد، چه چیزی در آن مجموعه داده است و غیره.
- شناسایی دادههای مورد نیاز: پس از اتمام مرحله 1، دادههای مورد نیاز را جمع آوری کرده و بررسی کنید. آیا همه صفات قابل درک هستند؟ کیفیت دادههای ضبط شده چگونه است؟ مقداری بازرسی بصری از دادهها انجام داده و بررسیهای نقطهای انجام دهید. این کار به شما ایده میدهد که دادهها چه مقدار آماده سازی و پیش پردازش نیاز دارند.
- آماده سازی و پیش پردازش: کار دشوار از اینجا آغاز میشود. دادههای مورد نیاز را از کل مجموعه انتخاب کرده و در صورت لزوم مراحل پاکسازی و قالب بندی را پیاده کنید. ممکن است متوجه شوید که برای پروژهای که سازمان در مرحله 1 سنجیده است، فقط به مجموعه دادههای جزئی نیاز دارید. ممکن است نیاز به ادغام چندین منبع داده برای تهیه دادههای نهایی باشد. حتی ممکن است برخی از این منابع داده خارجی بوده و برای تکمیل برخی از مشخصات باشند.
- مدلسازی: کاوش واقعی در این مرحله آغاز میشود. الگوریتمهای مناسب برای کار مورد نیاز و پارامترهای لازم انتخاب کنید. برای یافتن الگوریتم مناسب، تکنیکهای داده کاوی را بررسی نمایید. به این ترتیب ابزاری برای افزایش بهرهوری خود انتخاب مینمایید. با استفاده از این ابزارها، مدل را بسازید و نتایج اولیه را ارزیابی کنید. با توجه به اینکه هدف نهایی کاوش در دادهها پیش بینی برخی موارد است، اگر پیش بینیها خارج از فرضیه قبلی باشند، نتایج ممکن است مفروضات قبلی را باطل نمایند. خود مدلسازی با توجه به توصیف دادهها، ممکن است شامل چندین مرحله باشد.
- آموزش و آزمایش: نتایج اولیه را ارزیابی نموده، مدل را روی مجموعه دادههای مختلف آزمایش کرده و نتایج را مرور کنید. آیا نتایج در نمونههای مختلف با هم ارتباط دارند؟ آیا تناقضی وجود دارد؟ تکرار را ادامه دهید تا زمانی که از ثبات نتایج راضی باشید.
- تأیید و استقرار: مدل نهایی را تأیید و برای استقرار آن برنامه ریزی کنید. به تجسمهای مورد نیاز برای بیان داستان فکر کنید. به یاد داشته باشید که این رویکرد نیز به اندازه مدلسازی است نیاز به شرح ماجرا دارد. یافتهها را گزارش کرده و فرایند را عملیاتی کنید.
مناطقی که داده کاوی در آنها به طور گسترده استفاده میشود
بهداشت و درمان آینده
داده کاوی پتانسیل زیادی برای بهبود سیستمهای بهداشتی دارد. از دادهها و تجزیه و تحلیل برای شناسایی بهترین روشهای بهبود و کاهش هزینهها در سیستم بهداشت استفاده میشود. محققان از تکنیکهای این رویکرد مانند پایگاه دادههای چند بعدی، یادگیری ماشین، محاسبات نرم، تجسم دادهها و آمار استفاده میکنند. از این رویکرد میتوان برای پیش بینی میزان بیماران در هر گروه نیز استفاده کرد. به کمک آن فرآیندهایی ایجاد شده است که اطمینان حاصل میکند بیماران از مراقبتهای مناسب در مکان مناسب و در زمان مناسب برخوردار میشوند.
آنالیز سبد بازار
تجزیه و تحلیل سبد بازار یک تکنیک مدلسازی بوده و نظریه اساسی آن این است که اگر گروه خاصی از اقلام را خریداری کنید، احتمال خرید گروه دیگری از اقلام نیز وجود دارد. این روش در همین مطلب توضیح داده شده است.
تحصیلات
یک زمینه جدید در حال ظهور به نام استخراج دادههای آموزشی(EDM)، وجود دارد و به توسعه روشهایی میپردازد که دانشی را از دادههای ناشی از محیطهای آموزشی کشف میکنند. اهداف EDM به صورت پیش بینی رفتار یادگیری دانش آموزان در آینده، مطالعه تأثیرات پشتیبانی آموزشی و پیشرفت دانش علمی در مورد یادگیری، مشخص میشود. با استفاده از نتایج، میتوان بر روی نحوه آموزش و آنچه باید آموزش داده شود، تمرکز نمود. الگوی یادگیری دانش آموزان را میتوان ضبط و برای توسعه تکنیکهای آموزش آنها استفاده کرد.
مهندسی ساخت
دانش بهترین دارایی است که یک بنگاه تولیدی در اختیار دارد. ابزارهای داده کاوی میتوانند برای کشف الگوها در فرآیندهای پیچیده تولید بسیار مفید باشند. میتوان آن را در طراحی سطح سیستم برای استخراج روابط بین معماری محصولات، سبد محصولات و دادههای مربوط به نیاز مشتری استفاده کرد. همچنین میتوان از آن برای پیش بینی محدوده زمانی توسعه تولید، هزینه و وابستگی میان سایر کارها استفاده نمود.
CRM
مدیریت ارتباط با مشتری همه چیز در مورد به دست آوردن و حفظ مشتریان است. برای حفظ ارتباط مناسب با مشتری، مشاغل نیاز به جمع آوری دادهها و تجزیه و تحلیل اطلاعات دارند. اینجاست که داده کاوی نقش خود را ایفا میکند. با استفاده از فناوریهای داده کاوی میتوان از دادههای جمع آوری شده برای تجزیه و تحلیل استفاده نمود. متقاضیان راه حل به جای سردرگمی در مورد اینکه برای حفظ مشتری در کدام قسمت تمرکز کنند، نتایج فیلتر شدهای را بدست میآورند.
تشخیص تقلب
روشهای سنتی کشف تقلب زمان بر و پیچیده است. داده کاوی در ارائه الگوهای معنی دار و تبدیل دادهها به اطلاعات کمک میکند. هر اطلاعاتی که معتبر و مفید باشد، نوعی دانش محسوب میشود. یک روش برای نظارت، شامل مجموعهای از سوابق نمونه است که به دستههای کلاهبرداری و غیر کلاهبرداری طبقه بندی میشوند. با استفاده از این دادهها یک مدل و الگوریتم ساخته میشود تا تشخیص دهد که رکورد جعلی است یا خیر.
تشخیص نفوذ
هر اقدامی که یکپارچگی و قابلیت اطمینان یک منبع را به خطر بیاندازد، نفوذ نامیده میشود. اقدامات دفاعی برای جلوگیری از نفوذ شامل احراز هویت کاربر، جلوگیری از خطاهای برنامه نویسی و محافظت از اطلاعات است. داده کاوی میتواند با افزودن تمرکز بر تشخیص ناهنجاری، به تشخیص نفوذ کمک کند. این امر به تحلیلگر کمک میکند تا یک فعالیت خاص را از فعالیتهای رایج و روزمره شبکه تشخیص دهد.
تقسیم بندی مشتری
تحقیقات سنتی بازار ممکن است به ما در تقسیم بندی مشتریان کمک کند؛ اما داده کاوی عمیقتر شده و اثربخشی بازار را افزایش میدهد. دادهکاوی به همسویی مشتری در یک بخش مشخص کمک میکند و میتواند نیازها را مطابق با خواست مشتری تنظیم نماید. بازار همواره در پی حفظ مشتری است. دادهکاوی این امکان را ایجاد میکند تا بخشی از مشتریان آسیب پذیر را یافته و با ارائه پیشنهادات ویژه، میزان رضایت را در آنها افزایش دهید.
بانکداری و مالی
به دلیل استفاده از بانکداری رایانه ای در همه جا، حجم عظیمی از دادههای مربوط به تراکنشهای جدید تولید میشوند. داده کاوی میتواند با یافتن الگوها، علل و همبستگی میان اطلاعات کسب و کار و قیمتهای بازار که به دلیل حجم بسیار زیاد دادهها بلافاصله برای مدیران مشخص نیست، به حل مشکلات کسب و کار در زمینه امور بانکی و مالی کمک نماید. مدیران احتمالا این اطلاعات را برای تقسیم بندی بهتر، هدف گیری، کسب، حفظ و نگهداری مشتری مفید خواهند یافت.
نظارت شرکت
نظارت شرکت به معنی نظارت بر رفتار یک شخص یا گروه توسط یک شرکت است. دادههای جمع آوری شده اغلب برای اهداف بازاریابی استفاده شده و یا به شرکتهای دیگر فروخته میشوند. این کار میتواند توسط کسب و کار مورد استفاده قرار گیرد تا محصولات خود را مطابق با سلیقه مشتریان خود تنظیم کند. از این دادهها میتوان برای اهداف بازاریابی مستقیم استفاده کرد، مانند تبلیغات هدفمند در Google و Yahoo، که در آن با تجزیه و تحلیل History جستجوها و ایمیلهای افراد تبلیغات مناسب برای کاربر موتور جستجو ارسال میشود.
تحقیقات جنایی
جرم شناسی فرآیندی است که هدف آن شناسایی ویژگیهای جرم است. در واقع تجزیه و تحلیل جرم شامل کاوش و کشف جرایم و روابط آنها با مجرمان است. حجم بالای مجموعه دادههای جرم و همچنین پیچیدگی روابط بین این نوع دادهها، جرم شناسی را به زمینهای مناسب برای استفاده از تکنیکهای داده کاوی تبدیل کرده است. گزارشهای جرم متنی را میتوان به فایلهای پردازش متن تبدیل کرد و از این اطلاعات برای انجام فرآیند تطبیق جرم استفاده نمود.
بیوانفورماتیک
به نظر میرسد رویکردهای دادهکاوی برای بیوانفورماتیک کاملاً مناسب هستند، زیرا از دادههای غنی برخوردارند. استخراج دادههای بیولوژیکی به استخراج دانش مفید از مجموعه دادههای عظیم جمع آوری شده در زیست شناسی و سایر علوم مرتبط مانند پزشکی و علوم اعصاب کمک میکند. از کاربردهای داده کاوی در بیوانفورماتیک میتوان به یافتن ژن، استنباط عملکرد پروتئین، تشخیص بیماری، پیش بینی بیماری، بهینه سازی درمان بیماری، بازسازی شبکه تعامل پروتئین و ژن، پاکسازی دادهها و پیش بینی محل سلولی پروتئین اشاره کرد.
منابع:
https://www.talend.com/resources/what-is-data-mining/
https://www.computersciencedegreehub.com/lists/5-uses-for-data-mining/
https://blog.datumize.com/the-15-benefits-of-data-mining
https://digitaltransformationpro.com/data-mining-steps/
https://bigdata-madesimple.com/14-useful-applications-of-data-mining/
بدون دیدگاه