
ادامه به بررسی اجمالی گامهای فرآیند دادهکاوی میپردازیم (غفاری و سلماسی، 1388):
شکل 2-25: متدولوژی CRISP-DM
2-5-6-1 فاز درک کسب و کار
این فاز ابتدایی روی درک اهداف پروژه و نیازمندیهای آن و سپس تبدیل این دانش به تعریف مسأله دادهکاوی و یک برنامه طراحی شده اولیه برای دستیابی به اهداف تمرکز میکند.
2-5-6-2 فاز درک داده
این فاز با جمعآوری داده اولیه آغاز گردیده و با فعالیتهایی که شما را قادر میسازد با داده آشنا شوید، مشکلات کیفیتی داده را شناسایی نمایید، اولین شناخت در داده را کشف نمایید، و ردیابی زیرمجموعههای جالبی از داده که فرضیههایی را در رابطه با اطلاعات نهان شکل دهد، پیش میرود.
2-5-6-3 فاز آماده سازی داده
فاز آمادهسازی داده، تمام فعالیتهای لازم برای ساختن مجموعه داده نهایی از دادههای خام اولیه را دربرمیگیرد. وظایف آمادهسازی داده احتمالا در چندین نوبت شکل میگیرد و هیچگونه ترتیب معینی ندارد. وظایفی شامل جدولبندی، ثبت، انتخاب مشخصه، همچنین انتقال و پاکسازی داده برای ابزار مدلسازی.
خروجی فاز آمادهسازی داده مجموعه دادههایی هستند که توسط این فاز ساخته شدهاند و برای مدلسازی یا کار آنالیز اصلی پروژه استفاده میشوند.
2-5-6-4 فاز مدلسازی
در این فاز تکنیکهای مدلسازی مختلفی انتخاب و اعمال میگردند و پارامترهایشان به مقادیر بهینه مدرج شدهاند. بطور نمونه چندین تکنیک برای یک مساله دادهکاوی وجود دارند. بعضی از تکنیکها نیازمندیهای خاصی را برای فرم داده دارند بنابراین برگشت به فاز آمادهسازی داده اغلب مورد نیاز است.
2-5-6-5 فاز پیاده سازی
در این مرحله از پروژه، ما یک مدل ساختهایم که به نظر میرسد کیفیت بالایی از یک پرسپکتیو آنالیز داده را داشته باشد. قبل از پیادهسازی نهایی مدل، مهم است به منظور اطمینان از اینکه مدل بطور مناسب به اهداف دست یابد، بطور کلی ارزیابی گردد و مراحل اجرا شده برای خلق آن بازبینی شود. یک هدف کلیدی تعیین این است که آیا جنبههای مهم مساله بمیزان کافی در نظر گرفته شدهاند. در انتهای این فاز یک تصمیم در رابطه با استفاده از نتایج دادهکاوی میبایست اتخاذ گردد.
2-5-6-6 فاز پیاده سازی
بطور کلی خلق مدل انتهای پروژه نیست. حتی اگر هدف مدل افزایش دانش داده باشد، دانش بدست آمده نیاز دارد که سازماندهی شده و به صورتی که برای مشتری قابل استفاده باشد ارائه گردد. این اغلب در اعمال مدلهای “زنده” درون فرآیند تصمیم گیری سازمان لازم است. بسته به نیازمندیها، فاز پیاده سازی میتواند به سادگی ایجاد یک گزارش یا به پیچیدگی اجرای یک فرآیند داده کاوی قابل تکرار در شرکت باشد. در بسیاری از حالات این مشتری است که مراحل پیاده سازی را متحمل می شود نه تحلیلگر داده.
2-5-7 کاربردهای دادهکاوی
دادهکاوی در بسیاری از شاخهها همچون بازاریابی، امور مالی، بانکداری، تولید، پزشکی، مدیریت ارتباط با مشتری، ردیابی، پیشبینی خرابیها و آموزش سازمانی کاربرد دارد. بعضی از کاربردهای کلیدی دادهکاوی بهطور خلاصه به شرح ذیل است (محمدیپور، 1388):
• کاربردهای معمول تجاری: از قبیل تحلیل و مدیریت بازار، تحلیل سبد بازار، بازاریابی هدف، فهم رفتار مشتری، تحلیل و مدیریت ریسک
• مدیریت و کشف فریب: کشف فریب تلفنی، کشف فریبهای بیمهای و اتومبیل، کشف حقههای کارت اعتباری، کشف تراکنشهای مشکوک مالی(پولشویی)
• متنکاوی: پالایش متن (نامههای الکترونیکی، گروههای خبری، جستجوی مقالات و موضوعات خاص و غیره)
• پزشکی: کشف ارتباط علامت و بیماری، تحلیل آرایههای DNA و تصاویر پزشکی.
• ورزش: آمارهای ورزشی
• وبکاوی: پیشنهاد صفحات مرتبط، بهبود ماشینهای جستجوگر یا شخصی سازی حرکت در وب سایت.
جدول زیر بیانگر میزان نفوذ کاربرد دادهکاوی در صنایع مختلف است که آمار موجود نشانگر استفاده از دادهکاوی بهعنوان یکی از مهمترین ابزار در مدیریت ارتباط با مشتریان میباشد.
مدیریت ارتباط با مشتری
26.1%
بانکداری
23.9%
بازاریابی مستقیم
20.3%
شناسایی جرم
18.8%
وبکاوی
10.1%
خرده فروشی
10.1%
بیمه
8.7%
مالی و لیزینگ
7.2%
تجارت الکترونیک
5.8%
امنیت و ضد تروریسم
6.3%
سرمایهگذاری و بورس
2.9%
جدول 2-2: میزان نفوذ کاربرد دادهکاوی در صنایع مختلف
امروزه دانش دادهکاوی بهطور گستردهای در علوم مختلف بکار گرفته میشود. تاکنون تعاریف متعددی در خصوص دادهکاوی ارائه شده است. در تعریف مؤسسه گارتنر، دادهکاوی کشف وابستگیها، الگوها و روندهای با معنی و جدید با وارسی مقادیر زیاد دادههای ذخیره شده در انبارهها با استفاده از تکنیکهای تشخیص الگو به همراه روشهای ریاضی و آماری میباشد. دادهکاوی عبارت است از فرآیند استخراج اطلاعات معتبر، از پیش ناشناخته، قابل فهم و قابل اعتماد از پایگاه دادههای بزرگ و استفاده از آن در تصمیمگیری در فعالیتهای تجاری. به عبارت دیگر، دادهکاوی به معنای جستجو در یک پایگاه داده برای یافتن الگوهایی میان دادهها است. دادهکاوی یکی از مهمترین روشهایی است که به وسیله آن الگوهای مفید در دادهها با حداقل دخالت کاربر شناخته میشود و اطلاعاتی را در اختیار کاربران و تحلیلگران قرار میدهد اما براساس آنها تصمیمات مهم و حیاتی برای سازمانها اتخاذ گردد. مزیت دادهکاوی، قابلیت فهم عمیقتر الگوهایی است که با تکنولوژیهای گزارشگیری موجود قابل مشاهده نیستند. (باغچهبند و همکاران، 1388)
ریشههای پیدایش دادهکاوی را میتوان در سه محور ذیل جستجو کرد (باغچهبند و همکاران، 1388):
• سهولت جمعآوری و ذخیرهسازی دادهها
• توان محاسباتی بالا در پردازشگرهای امروزی
• نیاز به بررسی دادهها و استخراج بلادرنگ الگوها و قواعد
از ویژگیهای منحصر بفرد دادهکاوی این است که دادهکاوی نه تنها بر فاز تحلیل، بلکه بر طراحی، مطالعه و جمعآوری دادهها نیز تاثیرگذار میباشد. همچنین قادر است اثر متغیرهای مختلف بر متغیرهای وابسته را بسنجد. در مسائل واقعی چندین متغیر به صورت همزمان بر روی پاسخ اثر میگذارند؛ از اینرو آنالیزهای چند متغیره جوابهای دقیقتر و نزدیک به واقعی را فراهم میکنند. (باغچهبند و همکاران، 1388)
2-5-8 نقش دادهکاوی در مدیریت ارتباط با مشتریان
درک مشتری، هسته اصلی مدیریت ارتباط با مشتریان است که اساسی برای افزایش ارزش عمر مشتری است. بهمنظور تقسیمبندی مشتریان و فعالیتهایی برای بیشینه ساختن تغییر مشتری، نگهداری، وظیفهشناسی و سودبخشی دربرگرفته میشود. درک مناسب مشتری و قابلیت پیگیری قانونی منجر به افزایش ارزش عمر مشتری میشود. درک نادرست مشتری میتواند منجر به فعالیتهای پرخطر شود. به طور مشابه، فعالیتهای متمرکز نشده، همچون تلاشهای نامحدود برای دسترسی یا به دست آوردن همه مشتریها، میتواند منجر به کاهش ارزش عمر مشتری (قانون برگشت نزولی) شود. بنابراین، تکیه اساسی خود را بایستی بر روی درک صحیح مشتری و فعالیتهای مرتبط با آن گذاشت. (امتیاز و همکاران، 1388)
در بررسی ادبیات موضوع مرتبط با این حوزه، نیاز به یک طبقهبندی از جنبههای مختلف مدیریت دانش مشتری، به منظور موشکافی چگونگی کاربرد تکنیکهای دادهکاوی میباشد. در این راستا یکی از مدلهای کاربردی توسط شامی و همکاران (2008) ارائه شده است. در این مدل طبقهبندی روی انواع دانش مشتری در سه لایه صورت گرفته است (یقینی و همکاران، 1388):
در مرحله نخست، برای پشتیبانی از مشتریان در چرخه خریدشان، یک جریان دانش پیوسته که از شرکت به مشتریان هدایت میشود (دانش برای مشتری) پیش نیاز است. دانش برای مشتریان شامل اطلاعاتی در مورد محصولات، بازارها و تامین کنندگان است. این بعد دانش همچنین بر روی درک مشتری از کیفیت خدمات، تاثیر میگذارد.
در همین زمان، دانش از مشتریان میباید در جهت خلق نوآوری در خدمات و محصول، تولید ایده و بهبود مستمر برای محصولات و خدمات، توسط سازمان به هم پیوند داده شود. تسخیر کردن دانش مشتری و دخیل کردن مشتریان در فرآیند نوآوری از طرق مختلفی قابل دستیابی است. برای مثال دانش مشتریان در مورد محصولات، تامین کنندگان و گرایشهای بازار میتواند از طریق مکانیزم بازخورد مناسب برای فراهم کردن یک بهبود سیستماتیک و نوآوری محصولات، استفاده شود. جمع آوری و تحلیل دانش درباره مشتری قطعا یکی از قدیمیترین اشکال فعالیت مدیریت دانش در حوزه CRM است. علاوه بر دادههای خام مشتریان و معاملات گذشته، دانش در مورد مشتری، نیازهای کنونی مشتریان، خواستههای آتی، ارتباط، فعالیت خرید و توانایی مالی را هم در نظر میگیرد. دانش درباره مشتریان در فرآیند پشتیبانی و خدمات CRM جمع آوری میشود و در فرآیند آنالیز CRM مورد تجزیه و تحلیل قرار میگیرد. (یقینی و همکاران، 1388)
بر اساس مدل مذکور، سه نوع اصلی دانش مشتری وجود دارد، دانش برای مشتری، دانش از مشتری و دانش درباره مشتری، در این تقسیمبندی هر یک از این انواع نیز از جنبههای مختلف دانش مشتری تشکیل شدهاند که انواع عمده دانش مشتری این مدل در ادامه تشریح گردیده است (یقینی و همکاران، 1388):
انواع دانش برای مشتری
دانش و اطلاعات محصولات و خدمات شرکت
( نیازمندیهای دانشی و اطلاعاتی مشتریان فعلی
( نیازمندیهای دانشی و اطلاعاتی مشتریان بالقوه
دانش و اطلاعات عمومی شرکت
( اطلاعات معرف شرکت
( محصولات دانشی شرکت
دانش و اطلاعات محیطی شرکت
( دانش و اطلاعات بازار
( دانش و اطلاعات در خصوص محصولات و خدمات رقبا
دانش و اطلاعات تکمیلی شرکت
انواع عمده دانش درباره مشتری
دانش، اطلاعات و داده در مورد مشتریان فعلی
( دادهها و اطلاعات تاریخی مشتریان
(دادهها و اطلاعات مربوط به نیازمندیهای آنها
دانش، اطلاعات و داده در مورد مشتریان بالقوه
(دادهها و اطلاعات شخصی مشتریان
(دادهها و اطلاعات مربوط به علایق و ترجیحات آنها
انواع عمده دانش از مشتری
دانش و اطلاعات در حوزه شرکت
( دانش و اطلاعات در مورد محصولات و خدمات شرکت
( دانش و اطلاعات در خصوص جایگاه و وضعیت برند شرکت
دانش و اطلاعات در حوزه محیط شرکت
( دانش و اطلاعات در مورد محصولات و خدمات رقبا
( دانش و اطلاعات در مورد بازار و تحولات آن
شکل 2-26: چارچوپ دستهبندی تکنیکهای دادهکاوی در مدیریت ارتباط با مشتریان
فرآیند مدیریت ارتباط با مشتری از نتایج به دست آمده توسط فرآیند داده کاوی استفاده میکند که در آن تمرکز اصلی بر روی مشتریان هستند که به موجب آن نرخهای پاسخگویی و اثر بخشیهای شرکت رونق پیدا میکند. شکل ذیل نمایانگر کاربرد دادهکاوی در حوزه مدیریت ارتباط با مشتریان میباشد (امتیاز و همکاران، 1388):
شکل 2-27: نقش و جایگاه دادهکاوی در مدیریت ارتباط با مشتریان
• فرآیند جمعآوری دادهها: قابلیت نمایش مناسب که توسط الگوریتمهای کاوش در مرحله بعد قابل خواندن است. این فرآیند این اطمینان را به وجود میآورد که مجموعه دادهها برای اهداف و تکنیکهای کاوشی خاص آماده هستند. در این فرآیند بهطور عمومی میتوان از بین مشخصههای جداشدنی یا عمومی بعضی از رکوردها را اضافه و مقدار کلی را عوض نمود.
• فرآیند دادهکاوی: فرآیندهای الگوریتم قبلی در این روش جستجو، مجموعه آیتمهای تکرار شونده توسط قوانین ارتباطی هستند. این الگوریتمها مبتنی بر دانش قبلی از مجموعه آیتمهای تکرار شونده هستند و توالی درست آن توسط روشهای هوشمند مرتب میشوند و با مشخصههای الگوریتمهای پیشین برای اصلاح کارآیی جستجو با یکدیگر همکاری میکنند. آیتمهای تکرار شونده مجموعهای از نیازمندیها برای تبدیل قوانین ارتباط قوی و ذخیره شده بر مبنای دانش هستند. قوانین ارتباط قوی، میتواند بیشترین رضایت را برای دستیابی به حداقل نیاز پشتیبانی و اطمینان در همان زمان به وجود آورد. حداقل نیاز اطمینان شامل: اولین قدم، تصمیم گیری منابع داده برای کاوش است.
• فرآیند مدیریت ارتباط با مشتری: انبار داده، کاوش داده، برای برآورده کردن اهدافی نظیر کشف، فروش بیشتر و بقای مشتری استفاده میشود. با اجرای الگوریتمهای کاوش داده روی جدولهای وب
