داده کاوی

شاید تصور شود که داده کاوی یک اختراع جدید مربوط به عصر دیجیتال است. این مفهوم به حدود یک قرن پیش بازمی‎گردد، اما در دهه 1930 توجه ویژه‎ای به آن شد. یکی از نخستین مواردی که کاوش در داده‎ها در آن اتفاق افتاد مربوط به سال 1936 است وقتی که آلن تیورینگ ایده یک ماشین یونیورسال را پیش کشید که می‏توانست در حد کامپیوترهای مدرن آن زمان، محاسبات پیچیده‎ای انجام دهد.

امروزه کسب و کارها از این رویکرد و از یادگیری ماشین برای بهبود هرچیزی، از فرآیندهای فروش گرفته تا تفسیر منابع مالی برای اهداف سرمایه گذاری، استفاده می‎کنند. در نتیجه متخصصان داده، برای سازمانهای تمام نقاط دنیا حیاتی شده‎اند و شرکت‎ها به دنبال دستیابی به اهداف بزرگتری با استفاده از علم داده کاوی هستند.

داده کاوی شامل فرآیند تجزیه و تحلیل حجم وسیعی از داده‎ها برای کشف هوش تجاری است که در حل مشکلات، کاهش ریسک و تصاحب فرصت‎های جدید به سازمان‎ها کمک کند.

در چه مواردی از داده کاوی استفاده می‎شود

  • آنالیز سبد

این اصطلاح سبد خرید در دنیای واقعی یا مجازی بازمی‎گردد که مشتریان هنگام خرید از آن استفاده می‎کنند. تحلیلگر داده به ترجیحات مشتری نگاهی میاندازد و سعی می‎کند تمایل مشتری را برای خریدهای آتی بر اساس آنچه که تا کنون خریده، پیش بینی نماید. آنالیز سبد علاوه بر ردیابی خرید محصولات و سرویس‎ها، در نظارت بر گزینه‎های پرداخت و کارت‎های هدیه نیز مفید است.

به عنوان مثال خریداری به نام سام را در نظر بگیرید. سام به یک سوپرمارکت رفته و اقلامی ‎را خریداری می‎کند که امتیازهای اضافی برای دریافت کارتهای هدایای فروشگاه دارند. سپس مبلغ آنها را با کارت اعتباری می‎پردازد.  حال شرکت می‎تواند استفاده از کارت اعتباری را با برنامه پاداش و سطح موجودی مرتبط نموده و موجودی خود را به طور موثر مدیریت نماید.

  • پیش بینی فروش

اگرچه این مفهوم مشابه آنالیز سبد است، اما به جای اینکه حدس بزنند مشتری چه چیزی را خریداری می‎کند، تلاش می‎کنند بفهمند مشتری چه زمانی در آینده دوباره کالاهای خاصی را خریداری خواهد کرد. به عنوان مثال، اگر سام همزنی را خریداری کند که بر اساس بررسی عملکرد سه سال دوام می‎کند، فروشگاهی که سام همزن را از آن خریده قصد دارد سه سال دیگر همزن‎ها‎ی مشابهی عرضه کند که سام یکی از آنها را حتی اگر مشابه قبلی نباشند، خریداری کند. یک فروشگاه همچنین می‎تواند خریدهای مشابهی را که مشتریان از فروشگاه‎ها‎ی دیگر انجام می‎دهند، بررسی نموده و در تلاش برای جلب مشتری، رویکردی مشابه سایر فروشگاه‎ها‎ برگزیند.

  • بازاریابی بر اساس پایگاه داده

 با استفاده از این استراتژی داده کاوی، یک شرکت می‎تواند مجموعه‎ای از محصولات و خدمات ایجاد کند که خودشان را می‎فروشند. این شرکت به جای اینکه به خواسته‎ها‎ی سام بپردازد، از طریق داده کاوی، آنچه که صدها هزار “سام” می‎خواهند را تجزیه و تحلیل می‎کند. فرض کنید سام یک بومی ‎آمریکایی دارای وزن بالا و 60 ساله است. این شرکت ترجیحات افراد بومی ‎آمریکایی 60 ساله و دارای اضافه وزن را مورد بررسی قرار داده و برنامه‎ها‎ی تبلیغاتی ایجاد خواهد کرد که با آن ناحیه خاص از جمعیت صحبت کند. حتی اگر یک “سام” خاص به تبلیغات پاسخ ندهد، ایده موجود این است که به اندازه کافی “سام” وجود دارد که به آن پاسخ می‎دهند و باعث ارزشمند بودن استراتژی بازاریابی برای شرکت می‎شود.

  • برنامه ریزی موجودی

درک این کاربرد برای داده کاوی آسان است. اگر فروشگاهی از سال 2003 حداقل 2500 عدد از یک محصول در هر تابستان فروخته باشد، دلیل بر این است که فروشگاه می‎تواند در تابستان سال آینده نیز حداقل 2500 عدد از همان بفروشد. همچنین ارزیابی روند افزایش یا کاهش میزان فروش به صورت ماه به ماه یا حتی هفته به هفته و تصمیم گیری کاملاً منطقی درمورد اینکه کدام محصول را برای انبار کردن خریداری می‎کنیم، کاملاً ساده است.

  • وفاداری مشتری

یک شرکت می‎تواند داده‎ها‎ی مربوط به مشتریان خود را بررسی کند تا ببیند که چگونه تغییرات قیمت آنها را جذب می‎کند و یا به سمت رقبا می‎فرستد. این استراتژی داده کاوی ارتباط تنگاتنگی با برنامه پاداش فروشگاه دارد.

 به عنوان مثال، اگر سام طی سالهای گذشته برای همزن خود، یک پلوپز، سفر به جزیره ایستر و 1000 دلار خرید مواد غذایی، پاداش گرفته باشد، به راحتی می‎توان گفت که او یک مشتری وفادار است. فروشگاه می‎تواند پیشنهادات خود را با توجه به موارد دلخواه سام برنامه ریزی نموده و بداند که او باز خواهد گشت. علاوه برآن، با بررسی آمار وفاداری مشتری، یک شرکت می‎تواند آنچه مشتریان آن را با ارزش می‎دانند تعیین کند و در جهت ایجاد ارزش اضافی متناسب با ترجیحات مشتری صرف نظر از قیمت گذاری، تلاش نماید.

مزایا

مدیریت ارتباط با مشتری: داده کاوی با هدف ایجاد روابط یک به یک با مشتریان از طریق درک صحیح نیازها و خواسته‎ها‎ی آنها، می‎تواند بسیار مفید واقع شود. این رویکرد می‎تواند با داده‎ها‎ی تولید شده از رویدادهای مختلف (سوالات مربوط به محصول، فروش، بررسی محصولات)، به روش‎ها‎ی مختلف بینش بیشتری ایجاد کند.

  • شناسایی خریداران احتمالی محصولات و خدمات جدید
  • دلایل اصلی ناامید شدن مشتری جهت بهبود حفظ مشتریان
  • کشف ارتباطات متغیر بین محصولات و خدمات برای به حداکثر رساندن فروش و ارزش مشتری
  • شناسایی سودآورترین مشتریان و نیازهای ترجیحی آنها برای تقویت روابط و به حداکثر رساندن فروش

صنعت خرده فروشی:

  • پیش بینی حجم دقیق فروش در سطوح خاص موجودی
  • شناسایی روابط فروش بین انواع مختلف محصول (آنالیز سبد بازار)
  • پیش بینی سطح مصرف انواع مختلف محصول (بر اساس شرایط فصلی و محیطی) برای بهینه سازی تدارکات و در نتیجه به حداکثر رساندن درآمد
  • کشف الگوهای جالب توجه در حرکت محصولات، به ویژه محصولات با ماندگاری کوتاه، در یک زنجیره تأمین با تجزیه و تحلیل داده‎ها‎ی حسی و RFID

ساخت و تولید:

  • پیش بینی خرابی ماشین آلات قبل از وقوع آنها با استفاده از داده‎ها‎ی حسی، که امکان تعمیر و نگهداری مبتنی بر شرایط را فراهم می‎کند.
  • شناسایی اشتراکات و ناهنجاری‎ها‎ در سیستم‎ها‎ی تولید برای بهینه سازی ظرفیت تولید
  • کشف الگوهای جدید برای شناسایی و بهبود کیفیت محصول

صنعت مسافرت (خطوط هوایی یا هتل‎ها‎):

  • پیش بینی فروش خدمات مختلف (انواع صندلی در هواپیما، نوع اتاق هتل) جهت یافتن قیمت بهینه خدمات برای به حداکثر رساندن درآمد به عنوان تابعی از مدیریت عملکرد
  • پیش بینی تقاضا در مکان‎ها‎ی مختلف برای تخصیص بهتر منابع محدود سازمان
  • شناسایی سودآورترین مشتری‎ها‎ و ارائه خدمات شخصی برای حفظ آنها
  • شناسایی و بهبود دلایل اصلی فرسایش کارمندان با ارزش به منظور حفظ آنهاداده کاوی

مراحل انجام داده کاوی

 مراحل داده کاوی ممکن است متفاوت باشد. تعداد دقیق مراحل درگیر در این رویکرد می‎تواند براساس متخصص، دامنه مشکل و نحوه جمع آوری مراحل و نامگذاری آنها متفاوت باشد. صرف نظر از این موضوع، معمولا مراحل زیر بخشی از فرآیند داده کاوی به حساب می‎آیند:

  • تعریف مشکل این مرحله حتی اگر هیچ ارتباطی با جنبه‎ها‎ی فنی داده کاوی نداشته باشد، یکی از مهمترین مراحل است. این مرحله شامل دو بخش است:
  • شناسایی اهداف تجاری: کدام مشکل کسب و کار را می‎خواهید حل کنید؟ به دست آوردن مشتری؟ حفظ مشتری؟ کاهش هزینه‎ها‎ی نگهداری یا هزینه‎ها‎ی عملیاتی؟ برای دریافت ایده، برخی از نمونه‎ها‎ی داده‎کاوی را بررسی کنید.
  • شناسایی اهداف داده کاوی: اهداف تجاری انتخاب شده چگونه به اهداف خاص پروژه داده‎کاوی تبدیل می‎شوند؟ پاسخ به این سوال منجر به کشف این خواهد شد که چه مجموعه داده ای ممکن است لازم باشد، چه چیزی در آن مجموعه داده است و غیره.
  • شناسایی دادههای مورد نیاز: پس از اتمام مرحله 1، داده‎ها‎ی مورد نیاز را جمع آوری کرده و بررسی کنید. آیا همه صفات قابل درک هستند؟ کیفیت داده‎ها‎ی ضبط شده چگونه است؟ مقداری بازرسی بصری از داده‎ها‎ انجام داده و بررسی‎ها‎ی نقطه‎ای انجام دهید. این کار به شما ایده می‎دهد که داده‎ها چه مقدار آماده سازی و پیش پردازش نیاز دارند.
  • آماده سازی و پیش پردازش: کار دشوار از اینجا آغاز می‎شود. داده‎ها‎ی مورد نیاز را از کل مجموعه انتخاب کرده و در صورت لزوم مراحل پاکسازی و قالب بندی را پیاده کنید. ممکن است متوجه شوید که برای پروژه‎ای که سازمان در مرحله 1 سنجیده است، فقط به مجموعه داده‎ها‎ی جزئی نیاز دارید. ممکن است نیاز به ادغام چندین منبع داده برای تهیه داده‎ها‎ی نهایی باشد. حتی ممکن است برخی از این منابع داده خارجی بوده و برای تکمیل برخی از مشخصات باشند.
  • مدلسازی: کاوش واقعی در این مرحله آغاز می‎شود. الگوریتم‎ها‎ی مناسب برای کار مورد نیاز و پارامترهای لازم انتخاب کنید. برای یافتن الگوریتم‎ مناسب‎، تکنیک‎ها‎ی داده کاوی را بررسی نمایید. به این ترتیب ابزاری برای افزایش بهره‎وری خود انتخاب می‎نمایید. با استفاده از این ابزارها، مدل را بسازید و نتایج اولیه را ارزیابی کنید. با توجه به اینکه هدف نهایی کاوش در داده‎ها پیش بینی برخی موارد است، اگر پیش بینی‎ها‎ خارج از فرضیه قبلی باشند، نتایج ممکن است مفروضات قبلی را باطل نمایند. خود مدلسازی با توجه به توصیف داده‎ها، ممکن است شامل چندین مرحله باشد.
  • آموزش و آزمایش: نتایج اولیه را ارزیابی نموده، مدل را روی مجموعه داده‎ها‎ی مختلف آزمایش کرده و نتایج را مرور کنید. آیا نتایج در نمونه‎ها‎ی مختلف با هم ارتباط دارند؟ آیا تناقضی وجود دارد؟ تکرار را ادامه دهید تا زمانی که از ثبات نتایج راضی باشید.
  • تأیید و استقرار: مدل نهایی را تأیید و برای استقرار آن برنامه ریزی کنید. به تجسم‎ها‎ی مورد نیاز برای بیان داستان فکر کنید. به یاد داشته باشید که این رویکرد نیز به اندازه مدلسازی است نیاز به شرح ماجرا دارد. یافته‎ها‎ را گزارش کرده و فرایند را عملیاتی کنید.

مناطقی که داده کاوی در آنها به طور گسترده استفاده میشود

بهداشت و درمان آینده

 داده کاوی پتانسیل زیادی برای بهبود سیستم‎ها‎ی بهداشتی دارد. از داده‎ها‎ و تجزیه و تحلیل برای شناسایی بهترین روش‎ها‎ی بهبود و کاهش هزینه‎ها‎ در سیستم بهداشت استفاده می‎شود. محققان از تکنیک‎های این رویکرد مانند پایگاه داده‎ها‎ی چند بعدی، یادگیری ماشین، محاسبات نرم، تجسم داده‎ها‎ و آمار استفاده می‎کنند. از این رویکرد می‎توان برای پیش بینی میزان بیماران در هر گروه نیز استفاده کرد. به کمک آن فرآیندهایی ایجاد شده است که اطمینان حاصل می‎کند بیماران از مراقبت‎ها‎ی مناسب در مکان مناسب و در زمان مناسب برخوردار می‎شوند.

آنالیز سبد بازار

تجزیه و تحلیل سبد بازار یک تکنیک مدلسازی بوده و نظریه اساسی آن این است که اگر گروه خاصی از اقلام را خریداری کنید، احتمال خرید گروه دیگری از اقلام نیز وجود دارد. این روش در همین مطلب توضیح داده شده است.

تحصیلات

یک زمینه جدید در حال ظهور به نام استخراج داده‎ها‎ی آموزشی(EDM)، وجود دارد و به توسعه روش‎ها‎یی می‎پردازد که دانشی را از داده‎ها‎ی ناشی از محیط‎ها‎ی آموزشی کشف می‎کنند. اهداف EDM به صورت پیش بینی رفتار یادگیری دانش آموزان در آینده، مطالعه تأثیرات پشتیبانی آموزشی و پیشرفت دانش علمی‎ در مورد یادگیری، مشخص می‎شود. با استفاده از نتایج، می‎توان بر روی نحوه آموزش و آنچه باید آموزش داده شود، تمرکز نمود. الگوی یادگیری دانش آموزان را می‎توان ضبط و برای توسعه تکنیک‎ها‎ی آموزش آنها استفاده کرد.

 مهندسی ساخت

دانش بهترین دارایی است که یک بنگاه تولیدی در اختیار دارد. ابزارهای داده کاوی می‎توانند برای کشف الگوها در فرآیندهای پیچیده تولید بسیار مفید باشند. می‎توان آن را در طراحی سطح سیستم برای استخراج روابط بین معماری محصولات، سبد محصولات و داده‎ها‎ی مربوط به نیاز مشتری استفاده کرد. همچنین می‎توان از آن برای پیش بینی محدوده زمانی توسعه تولید، هزینه و وابستگی میان سایر کارها استفاده نمود.

CRM

مدیریت ارتباط با مشتری همه چیز در مورد به دست آوردن و حفظ مشتریان است. برای حفظ ارتباط مناسب با مشتری، مشاغل نیاز به جمع آوری داده‎ها‎ و تجزیه و تحلیل اطلاعات دارند. اینجاست که داده کاوی نقش خود را ایفا می‎کند. با استفاده از فناوری‎ها‎ی داده کاوی می‎توان از داده‎ها‎ی جمع آوری شده برای تجزیه و تحلیل استفاده نمود. متقاضیان راه حل به جای سردرگمی در مورد اینکه برای حفظ مشتری در کدام قسمت تمرکز کنند، نتایج فیلتر شده‎ای را بدست می‎آورند.

تشخیص تقلب

روش‎ها‎ی سنتی کشف تقلب زمان بر و پیچیده است. داده کاوی در ارائه الگوهای معنی دار و تبدیل داده‎ها‎ به اطلاعات کمک می‎کند. هر اطلاعاتی که معتبر و مفید باشد، نوعی دانش محسوب می‎شود. یک روش برای نظارت، شامل مجموعه‎ای از سوابق نمونه است که به دسته‎های کلاهبرداری و غیر کلاهبرداری طبقه بندی می‎شوند. با استفاده از این داده‎ها‎ یک مدل و الگوریتم ساخته می‎شود تا تشخیص دهد که رکورد جعلی است یا خیر.

تشخیص نفوذ

هر اقدامی ‎که یکپارچگی و قابلیت اطمینان یک منبع را به خطر بیاندازد، نفوذ نامیده می‎شود. اقدامات دفاعی برای جلوگیری از نفوذ شامل احراز هویت کاربر، جلوگیری از خطاهای برنامه نویسی و محافظت از اطلاعات است. داده کاوی می‎تواند با افزودن تمرکز بر تشخیص ناهنجاری، به تشخیص نفوذ کمک کند. این امر به تحلیلگر کمک می‎کند تا یک فعالیت خاص را از فعالیت‎های رایج و روزمره شبکه تشخیص دهد.

 تقسیم بندی مشتری

تحقیقات سنتی بازار ممکن است به ما در تقسیم بندی مشتریان کمک کند؛ اما داده کاوی عمیقتر شده و اثربخشی بازار را افزایش می‎دهد. داده‎کاوی به همسویی مشتری در یک بخش مشخص کمک می‎کند و می‎تواند نیازها را مطابق با خواست مشتری تنظیم نماید. بازار همواره در پی حفظ مشتری است. داده‎کاوی این امکان را ایجاد می‎کند تا بخشی از مشتریان آسیب پذیر را یافته و با ارائه پیشنهادات ویژه، میزان رضایت را در آنها افزایش دهید.

بانکداری و مالی

به دلیل استفاده از بانکداری رایانه ای در همه جا، حجم عظیمی ‎از داده‎های‎ مربوط به تراکنش‎های جدید تولید می‎شوند. داده کاوی می‎تواند با یافتن الگوها، علل و همبستگی میان اطلاعات کسب و کار و قیمت‎ها‎ی بازار که به دلیل حجم بسیار زیاد داده‎ها بلافاصله برای مدیران مشخص نیست، به حل مشکلات کسب و کار در زمینه امور بانکی و مالی کمک نماید. مدیران احتمالا این اطلاعات را برای تقسیم بندی بهتر، هدف گیری، کسب، حفظ و نگهداری مشتری مفید خواهند یافت.

نظارت شرکت

نظارت شرکت به معنی نظارت بر رفتار یک شخص یا گروه توسط یک شرکت است. داده‎ها‎ی جمع آوری شده اغلب برای اهداف بازاریابی استفاده شده و یا به شرکت‎ها‎ی دیگر فروخته می‎شوند. این کار می‎تواند توسط کسب و کار مورد استفاده قرار گیرد تا محصولات خود را مطابق با سلیقه مشتریان خود تنظیم کند. از این داده‎ها‎ می‎توان برای اهداف بازاریابی مستقیم استفاده کرد، مانند تبلیغات هدفمند در Google و Yahoo، که در آن با تجزیه و تحلیل History جستجوها و ایمیل‎ها‎ی افراد تبلیغات مناسب برای کاربر موتور جستجو ارسال می‎شود.

تحقیقات جنایی

 جرم شناسی فرآیندی است که هدف آن شناسایی ویژگی‎های جرم است. در واقع تجزیه و تحلیل جرم شامل کاوش و کشف جرایم و روابط آنها با مجرمان است. حجم بالای مجموعه داده‎ها‎ی جرم و همچنین پیچیدگی روابط بین این نوع داده‎ها‎، جرم شناسی را به زمینه‎ای مناسب برای استفاده از تکنیک‎ها‎ی داده کاوی تبدیل کرده است. گزارش‎ها‎ی جرم متنی را می‎توان به فایل‎ها‎ی پردازش متن تبدیل کرد و از این اطلاعات برای انجام فرآیند تطبیق جرم استفاده نمود.

بیوانفورماتیک

به نظر می‎رسد رویکردهای داده‎کاوی برای بیوانفورماتیک کاملاً مناسب هستند، زیرا از داده‎ها‎ی غنی برخوردارند. استخراج داده‎ها‎ی بیولوژیکی به استخراج دانش مفید از مجموعه داده‎ها‎ی عظیم جمع آوری شده در زیست شناسی و سایر علوم مرتبط مانند پزشکی و علوم اعصاب کمک می‎کند. از کاربردهای داده کاوی در بیوانفورماتیک می‎توان به یافتن ژن، استنباط عملکرد پروتئین، تشخیص بیماری، پیش بینی بیماری، بهینه سازی درمان بیماری، بازسازی شبکه تعامل پروتئین و ژن، پاکسازی داده‎ها‎ و پیش بینی محل سلولی پروتئین اشاره کرد.


منابع:

https://www.talend.com/resources/what-is-data-mining/

https://www.computersciencedegreehub.com/lists/5-uses-for-data-mining/

https://blog.datumize.com/the-15-benefits-of-data-mining

https://digitaltransformationpro.com/data-mining-steps/

https://bigdata-madesimple.com/14-useful-applications-of-data-mining/

بدون دیدگاه

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *