منابع و ماخذ پایان نامه ارزش مسافران، زنجیره مارکوف، ناسازگاری، مقایسات زوجی

دانلود پایان نامه ارشد

ده است.
جدول4- 3 نتایج خوشه بندی مجموعه داده CMC
الگوریتم تکاملی
تابع هزینه

حداقل
میانگین
حداکثر
انحراف معیار
ICA(new)
5532.481
5533.203
5534.476
0.64651
ICA
5532.979
5534.358
5536.724
1.1723
PSO
5662.045
5795.661
5857.62
59.7289
GA
5705.630
5756.5984
5812.6480
50.3694
رونـد همگـرایی الگوریتمهـای مختلف به جواب بهینه در این مجموعه داده، در شکل4- 3 نشان داده شده است.

شکل4- 3 مقایسه روند همگرایی به پاسخ بهینه در داده هایCMC
نتایج حاصل از خوشهبندی مجموعه دادههای Iris، Wine و CMC نشاندهنده بهبود الگوریتم رقابت استعماری میباشد؛ لذا استفاده از این الگوریتم در تعیین ارزش مسافران میتواند تاثیر مناسبی بر نتایج داشته باشد.
ارزش گذاری مشتریان
در فصل قبل، مدل تعیین ارزش مسافران در صنعت حملونقل طراحی و ارائه شد. گامهای این مدل با فرآیند دادهپردازی شروع شده و با تعیین ارزش مسافران ادامه یافته و درنهایت به تعیین استراتژیهای بازاریابی متناسب باارزش مسافران خاتمه مییابد. در این بخش، از مـدل تعیین ارزش مسافران استفاده شده و مسافـران ایرلاین ساوتوست158 خوشهبندی خواهند شد. چارچوب کلی این فرآیند در شکل4- 4 نشان داده شده است.

شکل4- 4 چارچوب تعیین ارزش مسافران
در ادامه بر اساس چارچوب ارائه‌شده در شکل4- 4، روند تعیین استراتژی مناسب برای هر مسافر شرح داده خواهد شد.
آماده سازی
مبنای و زیربنای اساسی فرآیند دادهکاوی، دادهها هستند. دستیابی به نتایج واقعی و مناسب بدون در نظر گرفتن دادههای مناسب و باکیفیت امکانپذیر نمیباشد؛ ازاین‌رو پيش از هر تحليلي، بايستي از صحت و تناسب دادهها و اطلـاعات موجود اطمينان حاصل شود. اين موضوع حياتي سبب شده تا آمادهسازي داده و اطلاعات پيش از به کارگيري واقعي آن‌ها، نیازی اساسی در فرآیند دادهکاوی باشد. این گام شامل زیر بخشهایی نظیر تجمیع دادههـا، انتخـاب خصوصیات مورد نیـاز، تشخیص ناسـازگاریها159 و حذف دادههای پِرت، نـرمالسازی دادهها و… مـیباشد.
انتخاب داده ها و پیش پردازش آن ها
دیتاست موجود، مجموعه دادهای متشکل از 37 خصوصیت و 32157 رکورد از تراکنشهای 1369 مسافر شـرکت هواپیمایی ساوتوست در سالهای 2011 تا 2012 میباشد. از بین خصوصیات موجود در این پایگاه داده، تنها خصوصیاتی که با متغیرهای مدل LDcFR در ارتباط بوده، مورد نیاز میباشند. ازاین‌رو متغیرهای کد مشتری، مبدأ، مقصد و تاریخ خرید بلیت انتخاب شده و… مورد استفاده قرار گرفته است. نمونهای از پایگاه داده ایجاد شده در جدول4- 4 نشان داده شده است.
جدول4- 4 شمای پایگاه داده اولیه
Class
Month
Year
Distance
Destination
Source
Passenger_Id
F
05
2012
1516
Baltimore
Midland/Odessa
124
L
01
2012
833
Oklahoma
Arizona
775

از این مجموعه داده، دادههای تراکنشهای مسافران در سال 2012 جدا شده و به‌عنوان دادههای اصلی در فرآیند تعیین ارزش مورد استفاده قرار خواهند گرفت. از دادههای تراکنشهای مسافران در سال 2011 نیز در تشکیل ماتریس گذار استفاده خواهد شد.
تشکیل LDcFR
با توجه به نمونههای نشان داده شده در جدول4- 4، متغیرهای مدل LDcFR بایستی با انجام محاسبات بر روی پایگاه داده موردنظر ایجاد شوند. نحوه محاسبه هریک از متغیرهای مدل LDcFR در جدول4- 5 نشان داده شده است.
جدول4- 5 روش محاسبه متغیرهای مدل LDFR
متغیر
روش محاسبه
فرمول
Length(L)
فاصله اولین خرید تا آخرین خرید
Max(year.month)-Min(year.month)
Distance(Dc)
اعمال تأثیر کلاس سفر در Distance
Sum(Distance) :∀ Id

مجموع Distance به ازای هر ID

Freauency(F)
تعداد ظهور هر ID در پایگاه داده
Count(Passenger_Id ) :∀ Id
Recency(R)
فاصله زمانی آخرین خرید از تاریخ 01/2013
2013.01-(year.month)
در محاسبه مقدار تازگی خرید مسافران، ازآنجاکه بازهی زمانی خرید بین 01/2012 تا 12/2012 میباشد، تاریخ 01/2013 به‌عنوان ثابت در نظر گرفته شده و مقدار R هر مشتری از تفریق این تاریخ با تاریخ آخرین خرید محاسبه شده است.
با محاسبه مقادیر متغیرهای مدل LDcFR به ازای هر مسافر، پایگاه داده نهایی تشکیل خواهد شد. شمای کلی پایگاه داده نهایی در جدول4- 6 نشان داده شده است.

جدول4- 6 شمای پایگاه داده نهایی
Recency(Month)
Frequency
Distanceclass
Length(Month)
Passenger_Id
1
32
41797
23
124
2
5
4257
22
775

هدف نهایی از این مرحله، آمادهسازی دادهها برای پیادهسازی مدل توسعه داده شده در فصل قبل است، که با ایجاد پایگاه داده نهایی نشان داده در جدول4- 6، هدف قابل دستیابی میباشد.
یکی از روشهای ارزیابی برازندگی مدل LDcFR استفاده از معیار SSE است. نتایج حاصل از محاسبه SSE به ازای تعداد خوشههای متفاوت، در شکل4- 5 و شکل4- 6 نشان داده شده است. نتایج نشان داده شده در شکل4- 5، نشاندهنده آنست که حذف معیار M و جایگذاری آن با معیار D تاثیر مناسبی بر کاهش خطای SSE داشته است.

شکل4- 5 مقایسه خطای SSE مدل RFM و DFR
از سوی دیگر، همان‌گونه که در شکل4- 6 نشان داده شده است، میزان خطای SSE برای مدل LDcFR کمترین مقدار را در تعداد خوشههای مختلف داشته و این بدان معناست که این مدل توانسته خوشههای متراکمتر و بهتری ایجاد کند. نتایج نشان داده شده در شکل4- 5 و شکل4- 6 اثباتی است بر دقت مدل پیشنهادی.

شکل4- 6 مقایسه خطای SSE مدل LRFM و LDFR
تعیین ارزش
هدف این بخش پیادهسازی و سنجش مدل تعیین ارزش ارائه‌شده در فصل قبل است. همان‌گونه که در فصل قبل بیان شد، پس از تشکیل پایگاه داده مشتریان، تعیین ارزش آن‌ها متشکل از 3 فرآیند خوشهبندی، تشکیل زنجیره مارکوف و اولویتبندی مشتریان است. در این بخش، فرآیندهای مورد نیاز برای تعیین ارزش مسافران بر روی پایگاه داده تشکیل شده در بخش قبل اجرا خواهد شد.
تعیین تعداد بهینه خوشه ها
اولین گام از فرآیند تعیین ارزش، خوشهبندی مشتریان میباشد. در فرآیند خوشهبندی دانستن تعداد خوشهها، اهمیت بالایی دارد. تعیین تعداد خوشهها به دو روش قابل اعمال است؛ نظر خبرگان و شاخصهای آماری. در این تحقیق، برای تعیین دقیق تعداد خوشهها، از شاخص Silhouette، که یک شاخص آماری میباشد، استفاده شده است. این شاخص به تفسیر و اعتبارسنجی خوشههای تشکیل شده در فرآیند خوشهبندی پرداخته و میزان برازندگی آن را تعیین میکند. شاخص silhouette از طریق رابطه (4-1) بدست میآید:
(4-1)
S(i)=(b(i)-a(i))⁄(max⁡(a(i),b(i)))
در رابطه 4-1، a(i) نشاندهنده میانگین فواصل دادهی i از سایر دادههای موجود در خوشه و b(i) بیان‌کننده حداقل متوسط فاصله داده i از سایر خوشههاست. هرچه مقدار این شاخص در خوشهبندی بالاتر باشد، بیانگر آنست که خوشهبندی بهتر انجام‌شده است. حداکثر مقدار این شاخص برابر یک است.
برای مجموعه داده آماده شده در مرحله قبل، از شاخص Silhoutte برای تعیین تعداد بهینه خوشهها استفاده شده است. نتایج بدست آمده، نشان میدهد که ایجاد 4 خوشه برای دادهها، نتایج بهتری تولید میکند. مقادیر بدست آمده برای خوشههای 3 تا 10 تایی در شکل4- 7 نشان داده شده است.

شکل4- 7 تعداد بهینه خوشه ها
با توجه به نتایج بدست آمده، 4 خوشه برای دادهها در نظر گرفته خواهد شد.
خوشه بندی
پس از تشکیل پایگاه داده و تعیین تعداد مناسب خوشهها، در این مرحله مسافران موجود در پایگاه داده موجود، با استفاده از الگوریتم توسعه داده شده ICA خوشهبندی شدهاند. نتایج حاصل از خوشهبندی پایگاه داده مسافران در جدول4- 7 نشان داده شده است.
جدول4- 7 خوشه های تشکیل شده

Length
Distance
Frequency
Recency
تعداد اعضا
خوشه 1
18
160063.2
114
1
34
خوشه 2
23
56166.8
43
12
106
خوشه 3
22
20399.82
17
2
265
خوشه 4
13
2543.587
2
5
811

1216
همان‌گونه که در جدول4- 7 نشان داده شده است، خوشه 1 دارای 34 مسافر بوده که این مسافران به‌طور متوسط 114 سفر در طول سال 2012 داشتهاند. مسافران موجود در این خوشه، عمدتاً مدت زمان زیادی است که مسافر شرکت بوده(18 ماه) و اخیرا نیز خرید داشتهاند. خوشه 2 نیز دارای 106 مسافر بوده که به‌طور متوسط 23 ماه است که از خدمات شرکت استفاده کرده و در طول این مدت به‌طور متوسط 43 سفر داشتهاند. مسافران موجود در این خوشه، مدت زمان زیادی است که مسافر شرکت نمیباشند. مسافران موجود در خوشه 3 اگرچه مدت زمان زیادی است که مسافر شرکت بوده اما تعداد سفر و مسافت طی شده کمتری دارا میباشند. در خوشه 4 نیز 811 مسافر وجود دارد که به‌طور متوسط 2543 کیلومتر از مسافت سفرهای خود را با این ایرلاین طی کردهاند.
سؤال قابل‌طرح در این مرحله آنست که کدام یک از این 4 خوشه باارزشتر بوده تا ایرلاین توجه بیشتری به آن‌ها داشته باشد؟ پاسخگویی به این سؤال درگرو فعالیتهای آینده مشتریان است. 4 خوشه تشکیل شده در این مرحله بر اساس پیشینه فعالیتهای مشتریان تشکیل شده، که اگرچه ارزش مشتری را تعیین میکند اما ارزش تعیین شده، ارزش گذشته مشتری است و نمیتواند ارزش آینده وی را تعیین کند. برای تعیین ارزش هر خوشه بر اساس تخمین آینده مشتریان، تشکیل ماتریس گذار و استفاده از روش زنجیره مارکوف در فصل قبل پیشنهاد گردید.
تشکیل ماتریس گذار
همان‌گونه که پیشتر بیان شد، پایگاه داده موجود شامل تراکنشهای دوسالانه مسافران اسـت. ازاین‌رو برای تشکیل ماتریس گذار، تـراکنشهای هر سـال تفکیـک گردیـده و مطابـق الگوریتم ارائه‌شده در بخش ‏3-2-2-3-1، ماتریس گذار مربوطه تشکیل خواهد شد.
در تشکیل ماتریس گذار، نتایج خوشهبندی مرحله قبل(خوشهبندی تراکنشهای سال 2012) به‌عنوان وضعیت جدید لحاظ شده و نتایج خوشهبندی تراکنشهای مشتریان در سال 2011 به‌عنوان وضعیت اولیه بحساب خواهند آمد. نتایج حاصل از تشکیل ماتریس گذار در جدول4- 8 نشان داده شده است.
جدول4- 8 ماتریس گذار

خوشه 1
خوشه 2
خوشه 3
خوشه 4
Churn
خوشه 1
31
6
0
0
0
خوشه 2
3
92
56
0
0
خوشه 3
0
8
168
85
1
خوشه 4
0
0
41
594
152
با توجه به جدول4- 8، زنجیره مارکوف و گذارهای آن بصورت شکل4- 8 در خواهد آمد.

شکل4- 8 زنجیره مارکوف
اولویت‌بندی مشتریان
مقادیر نشان داده در شکل4- 8، احتمالات گذار از هر خوشه را نشان میدهد. با توجه به رابطه 3-3، به‌منظور تعیین ارزش مشتریان علاوه بر احتمالات گذار، ارزش آتی(مرکز خوشه) نیز مورد نیاز است. همان‌گونه که در رابطه 3-5 نشان داده شده است برای تعیین ارزش هر مشتری، تعیین وزن متغیرهـا مـورد نیـاز اسـت. بر همین اساس در این تحقیق با استفاده از تکنیک AHP وزن هر یک از متغیرهای L، Dc، F و R محاسبه خواهد شد.
تعیین وزن معیارها با استفاده از AHP
جهت تعیین وزن هر یک از معیارهای LDcFR، پرسشنامهای شامل جدول مقایسات زوجی آماده و در اختیار 5 نفر از کارشناسان و خبرگان صنعت هوایی قرار گرفت. پرسشنامه آماده شده شامل 6 پرسش در زمینه مقایسه اهمیت معیارهای LDcFR میباشد. پرسشنامه مذکور در پیوست 2 نشان داده شده است.
جهت تعیین وزن هر یک از معیارها، ابتدا با استفاده از روش میانگین هندسی(رابطه 2-41) نظرات خبرگان باهم تلفیق شده و سپس با استفاده از روشهای تقریبی میانگین هندسی، وزن هر یک از متغیرها نرمال شده و محاسبه گردیده است. نتایج این تعیین وزن در جدول4- 9 نشان داده شده است.
جدول4- 9 ماتریس تلفیقی و وزن متغیرها

Lenght
Distance
Frequency
Recency
W
Length
1
3412/0
2648/0
1
114/0
Distance
9301/2
1
5296/0
1776/3
311/0
Frequency
7763/3
8881/1
1
1776/3
456/0
Recency
1
3146/0
3146/0
1
12/0
همان‌گونه که در بخش‏2-5-1 بیان شد، در تکمیل ماتریس مقایسات زوجی، احتمال بروز ناسازگاری وجود دارد. چنانچه نرخ این ناسازگاری کمتر از 1/0 باشد، ناسازگاری قابل چشمپوشی میباشد و در غیر اینصورت فرآیند نظرخواهی مجدداً بایستی انجام شود. به همین منظور برای بالا بردن قابلیت اطمینان نتایج حاصل، بر

پایان نامه
Previous Entries منابع و ماخذ پایان نامه ارزش مسافران، انحراف معیار، زنجیره مارکوف، ضریب همبستگی Next Entries منابع و ماخذ پایان نامه ارزش مسافران، ارزش مشتری، سودآوری، ناسازگاری