
م دادهکاوی بر روی دادههای تحقیق، گامهای ذیل طی گردید:
گام نخست: آمادهسازی دادهها (Data Preparation)
یکی از ابتداییترین و در عین حال کلیدیترین گامهایی که میبایست جهت دادهکاوی دادههای پژوهش طی شود، آمادهسازی دادهها میباشد که در حقیقت هدف کلی از آن انتخاب مشخصههای مناسب از منبع دادهای و بکارگیری آنها در فرمتی مناسب برای انجام دادهکاوی میباشد. این انتخاب مناسب و دقیق مشخصههاسبب حصول نتایجی با میزان اعتبارپذیری بالا خواهد گردید. جهت آمادهسازی دادههای این تحقیق سه اقدام اساسی صورت پذیرفته است:
پایش دادهها11: در این تحقیق 240 رکورد اطلاعاتی جهت انجام دادهکاوی موجود میباشد و طبیعتاً زمانیکه حجم بالایی از دادهها جهت پایش و تبیین الگوها دردسترس باشد، رسیدن به این الگوها امری دشوار و چالشبرانگیز میباشد. از اینرو، ابتدا میبایست پایشی بر روی آنها انجام پذیرد. این اقدام سبب ایجاد اطلاعات آماری اولیه در خصوص این دادهها میگردد. بهعبارتی دیگر هدف اساسی از پایش دادهها، شناسایی و شکلدهی کلاسترهایی از دادههای تحقیق است. این مولفه با ارائه هیستوگرامهای عددی و غیرعددی از دادهها و نیز گروهبندی دادههای عددی در قالب باکتهای با اندازه همسان، دادههای موجود را جهت انجام دادهکاوی آماده و طبقهبندی میسازد.
از اینرو، بهمنظور پایش دادههای تحقیق ابتدا دادههای مورد نظر انتخاب شده و سپس بر اساس مشخصه عددی امتیاز (Score) پایش گردیده است که در نتیجه این پایش، دادهها در قالب 8 باکت طبقهبندی شدند.
شکل 3-7: پایش دادههای تحقیق بر مبنای مشخصه امتیاز
پاکسازی دادهها12: در حجم بالای دادهها، امکان بروز برخی اشتباهات در ورود دادهها نیز وجود دارد که بر روی نتایج حاصله و خروجیها تاثیر سوء خواهد داشت. از اینرو، میبایست پیش از اقدام به تجزیه و تحلیل دادهها نسبت به پاکسازی و تصفیه آنها مبادرت کرد تا چنین اشتباهات احتمالی شناسایی و رفع گردند. بدین منظور میبایست از قابلیت Outlier استفاده نمود که امکان حذف داده غیر مرتبط از یک ستون مشخص را میسر خواهد ساخت.
پس از آمادهسازی دادههای تحقیق از طریق بکارگیری قابلیتهای پایش و پاکسازی دادهها، در گام دوم الگوریتم مورد نظر جهت انجام دادهکاوی بر روی دادههای پژوهش انتخاب و بکار گرفته میشود که این گام نمایانگر مدلسازی دادهها میباشد.
گام دوم: مدلسازی دادهها (Data Modeling)
این گام مهمترین و اساسیترین بخش فرآیند انجام دادهکاوی است و بواسطه آن الگوریتم دادهکاوی مناسب و کاربردی جهت بکارگیری بر روی دادههای تحقیق انتخاب میگردد. نکته شایان توجه آنست که پیش از انتخاب و بکارگیری الگوریتم مورد نظر جهت دادهکاوی در ابتدا ساختار کاوش (Mining Structure) جهت تحقق دادهکاوی شکل داده شده است. شکلدهی این ساختار بکارگیری الگوریتمهای دادهکاوی را تسهیل مینماید؛ چراکه میتوان بدون درگیر شدن در پیچیدگیهای مرتبط با الگوریتمهای دادهکاوی ابتدا ساختار مورد نظر را شکل داده و سپس مدلهای مورد نظر را بر روی این ساختار مورد استفاده قرار داد. در این پژوهش کلیه رکوردهای اطلاعاتی جهت شکلدهی ساختار کاوش انتخاب گردید. بدین منظور کلیه مشخصههای کلیدی تحقیق (سازمان؛ دپارتمانها؛ اهداف کارکردی؛ و امتیاز) در ساختار کاوش لحاظ گردیدهاند.
شکل 3-8: درج مشخصههای کلیدی تحقیق در ساختار کاوش جهت مدلسازی دادههای پژوهش
گام سوم: بکارگیری الگوریتم دادهکاوی جهت کاوش دادههای تحقیق
پس از ایجاد ساختار کاوش جهت انجام فرآیند دادهکاوی بر روی دادههای تحقیق، الگوریتم دادهکاوی متناسب با هدف تحقیق انتخاب گردید. بهعبارتی تا این گام از تحقیق، دادههای پژوهش پایش، طبقهبندی و پاکسازی گردید و ساختار کاوش مورد نظر با توجه به مشخصههای کلیدی پژوهش تبیین و تدوین شد. لذا در این مرحله از فرآیند تحقیق، شرایط جهت انجام دادهکاوی و حصول نتایج کاربردی از الگوهای پنهان مابین دادهها امکانپذیر است.
شکل 3-9: ساختار کاوش تحقیق جهت مدلسازی دادهها و بکارگیری الگوریتمهای دادهکاوی
همانگونه که بیان شد در این گام از تحقیق، الگوریتم دادهکاوی مناسب و مورد نیاز جهت انجام دادهکاوی بر روی دادههای پژوهش انتخاب شد. بهطور کلی برخی از کلیدیترین الگوریتمهای دادهکاوی قابل بکارگیری عبارتند از:
• خوشهبندی دادهها (Microsoft Clustering)
• درختهای تصمیمگیری (Microsoft Decision Trees)
• رگرسیون خطی (Microsoft Linear Regression)
• رگرسیون منطقی (Microsoft Logistic Regression)
• و …………
در این پژوهش با توجه به هدف اصلی پژوهش که همانا طبقهبندی و تجزیه و تحلیل دادههای تحقیق در قالبی قابل استنتاج جهت تبیین زمینههای کلیدی تاثیرگذار بر فرآیند مدیریت ارتباط با مشتریان مبتنی بر تلفن همراه میباشد، الگوریتم خوشهبندی میتواند سودمند و مثمرثمر واقع گردد، از اینرو در این پژوهش جهت دادهکاوی دادههای تحقیق از الگوریتم خوشهبندی بهره گرفته شد.
شکل 3-10: انتخاب الگوریتم مناسب جهت دادهکاوی بر روی دادههای تحقیق
هر یک از الگوریتمهای دادهکاوی از قابلیتها و مولفههای کارکردی متفاوتی برخوردار میباشد که پیکرهبندی این مولفهها شناسایی و تبیین الگوهای پنهانی مابین دادههای تحقیق را حاصل میآورد. از اینرو، آشنایی با این مولفهها و پیکرهبندی صحیح آنها حصول نتایج کاربردیتر و قابل اتکاتری را سبب میشود.
در این پژوهش، با توجه به بکارگیری الگوریتم خوشهبندی جهت دادهکاوی دادهها، پیکرهبندی مولفههای مرتبط با این الگوریتم صورت پذیرفت. از جمله مولفههای اساسی در راستای پیکرهبندی این الگوریتم جهت دادهکاوی، تعیین ستونها (مشخصهها) مورد نیاز در فرآیند خوشهبندی است. چراکه هر چه تعداد این ورودیها بیشتر باشد؛ ارتباطات بیشتری توسط نرمافزار مورد بررسی قرار گرفته و در نتیجه خوشهبندی دقیقتر و جامعتری صورت خواهد پذیرفت. در این پژوهش، کلیه مشخصههای کلیدی تحقیق، بهعنوان ورودی در فرآیند خوشهبندی دادهها بکار گرفته شد.
شکل 3-11: انتخاب مشخصههای کلیدی تحقیق جهت بکارگیری در فرآیند خوشهبندی دادهها
شکل 3-12: تجزیه و تحلیل دادههای تحقیق بهمنظور شناسایی الگوهایی جهت خوشهبندی آنها
گام چهارم: بررسی خروجیهای حاصله از فرآیند دادهکاوی دادههای پژوهش
تجزیه و تحلیلهای انجام شده در نتیجه بکارگیری الگوریتم خوشهبندی جهت دادهکاوی دادههای این تحقیق، نتایج ذیل را بهعنوان خروجی حاصل آورد:
1. دیاگرام خوشهها13: اولین خروجی حاصل از بکارگیری الگوریتم خوشهبندی جهت دادهکاوی دادههای تحقیق، دیاگرام خوشهها است که این دیاگرام نمایانگر خوشههای بدست آمده در نتیجه دادهکاوی بر روی دادههای تحقیق میباشد. با جابجایی طیف عمودی از Strongest Links تا All Links ارتباطات و تعاملات بیشتری مابین خوشهها توسعه داده میشود. با تغییر متغیر مورد نظر از بخش Shading Variable این دیاگرام بر اساس مشخصه کلیدی منتخب تحقیق (بهعنوان نمونه بر اساس مشخصه سازمان، امتیاز و یا دپارتمان) نمایش داده میشود.
شکل 3-13: ارتباطات مابین خوشههای حاصله از بکارگیری الگوریتم خوشهبندی بر روی دادههای تحقیق
از قابلیتهای مهم و کاربردی این دیاگرام آنست که بواسطه آن میتوان شدت و ضعف میزان ارتباط میان خوشههای مختلف تحقیق را تعیین کرد.
2. پروفایل خوشهها14: دومین بخش خروجی حاصل از بکارگیری الگوریتم خوشهبندی جهت دادهکاوی دادههای تحقیق، پروفایل خوشهها میباشد. در این تحقیق با توجه به تدوین چهار مشخصه کلیدی (Category؛ Company؛Expertise وScore )، پروفایل تبیین شده برای خوشههای پژوهش به شرح ذیل است:
شکل 3-14: پروفایل هر یک از خوشههای حاصله از بکارگیری الگوریتم خوشهبندی بر روی دادههای تحقیق
این پروفایل مبین آنست که در هر خوشه، چه ترکیبی از مشخصههای طبقه؛ سازمان؛ متخصص (دپارتمان) و امتیاز موجود میباشد. تفکیک بر اساس رنگ سبب خواهد گردید تا بتوان بسادگی به نسبتی از میزان تاثیرگذاری هر مولفه و چگونگی این ترکیبات پی برد.
در این تحقیق، دادهها در قالب 10 کلاستر خوشهبندی گردیدهاند. هر یک از این خوشهها، از خصوصیات و قابلیتهای متمایزی برخوردار میباشند که آنها را از یکدیگر تفکیک مینماید. آگاهی از این خصوصیات میتواند بر تجزیه و تحلیل خوشهها اثرگذار باشد. بهطور کلی در این تحقیق خصوصیات خوشهها بر اساس مولفههای Category؛ Company؛Expertise و Score تبیین گردیده است. هر یک از این مولفهها از زیرمعیارهای خاصی برخوردارند که مبین جزئیات هر خوشه میباشند. تجزیه و تحلیل وضعیت خوشهها نمایانگر آنست که خوشه شماره 1 بیشترین درصد دادهها را به خود اختصاص داده است. پس از این خوشهها، خوشههای 4 و 6، بالاترین میزان دادهها را در خود جای دادهاند. در مجموع، وضعیت خوشههای تحقیق از منظر دادههای تخصیص یافته به هر یک مطابق شکل ذیل خواهد بود:
نمودار 3-1: وضعیت خوشههای تحقیق از منظر دادههای تخصیص یافته به هر خوشه
3. خصوصیات خوشهها15: سومین بخش خروجی حاصل از بکارگیری الگوریتم خوشهبندی جهت دادهکاوی دادههای تحقیق، خصوصیات خوشهها میباشد. هر یک از خوشههای تفکیک شده توسط نرمافزار، دارای مشخصههای متمایزی میباشد که همین مشخصهها وجه تمایز این خوشهها از یکدیگر و عامل اساسی در تفکیک و طبقهبندی آنها محسوب میگردد. با انتخاب هر یک از خوشههای حاصل از بکارگیری الگوریتم خوشهبندی بر روی دادههای تحقیق، مشخصههای مرتبط با آن خوشه نمایش داده میشود. در این تحقیق، با توجه به تبیین مشخصههای Category، Company، Expertise و Scoreجهت دادهکاوی، خصوصیات هر یک از خوشههای تحقیق بر مبنای این مشخصهها تبیین گردید.
شکل 3-15: مشخصههای خوشههای حاصله از بکارگیری الگوریتم خوشهبندی بر روی دادههای تحقیق
4. تمییزگذاری خوشهها16: آخرین بخش خروجی حاصل از بکارگیری الگوریتم خوشهبندی جهت دادهکاوی دادههای تحقیق، تمییزگذاری خوشهها میباشد. در این بخش از نتایج خروجی میتوان به قیاس خوشهها نسبت به یکدیگر پرداخت. بدین منظور میتوان با انتخاب خوشههای مورد نظر نتایج حاصله را مشاهده و مورد استفاده قرار داد.
شکل 3-16: تمییزگذاری خوشههای حاصله از بکارگیری الگوریتم خوشهبندی بر روی دادههای تحقیق
3-14-2 فاز دوم: تجزیه و تحلیل نتایج حاصله از دادهکاوی دادههای تحقیق
در ادامه به تجزیه و تحلیل نتایج کلی و خصوصیات هر یک از خوشههای تبیین شده بواسطه دادهکاوی دادههای تحقیق میپردازیم:
از منظر مولفه Category، سه زیرمعیار جهت خوشهبندی دادههای تحقیق بکار گرفته شد: Process، Customer و Income که این سه زیرمعیار در حقیقت نمایانگر اهداف بکارگیری مدیریت ارتباط با مشتریان مبتنی بر تلفن همراه در نمونه آماری تحقیق میباشد. آنچه مشخص است آنست که از منظر دپارتمانها و سازمانهای مختلف هدف از پیادهسازی سیستم مدیریت ارتباط با مشتریان مبتنی بر تلفن همراه میتواند متفاوت باشد و این سازمانها یا دپارتمانها میتوانند از بکارگیری آن حصول نتایج مرتبط با مشتریان، درآمدها و یا فرآیندهای عملیاتی خود را دنبال نمایند. در حقیقت، هدف اصلی این تحقیق مشخص نمودن آنست که هر یک از دپارتمانهای مختلف سازمان در پذیرش و پیادهسازی سیستم مدیریت ارتباط با مشتریان مبتنی بر تلفن همراه چه اهدافی را با چه درجه اهمیت و اولویتی دنبال مینمایند.
نتایج بدست آمده در ارتباط با خوشهبندی دادههای تحقیق در مجموع نمایانگر آنست که در خصوص مولفه Category، زیرمعیار فرآیندها بالاترین اثرگذاری را داشته و سپس زیرمعیارهای مشتریان و درآمد قرار دارند که البته این مقوله از منظر دپارتمانهای مختلف سازمانی متفاوت میباشد و این رتبهبندی در مجموع و با توجه به میانگین امتیازات تبیین گردیده
