منابع و ماخذ پایان نامه ارزش مسافران، انحراف معیار، زنجیره مارکوف، ضریب همبستگی

دانلود پایان نامه ارشد

تیب اقبال عمومی و مکان جدید کشور بوده و X_old مکان فعلی کشور میباشد.
استخراج ارزش جهت بازاریابی
در 2 مرحله قبل از فاز تعیین ارزش، مدل RFM برای تعیین ارزش مسافران در صنعت حملونقل توسعه داده شد و روشی برای خوشهبندی مشتریان ارائه گردید. با اجرای این 2 مرحله، تعدادی خوشه از مسافران تشکیل میشود که در هر خوشه مسافرانی با ویژگیهای L، Dc، F و R شبیه بههم وجود دارند. سوالی که در اینجا مطرح میشود آنست که کدام دسته از مشتریان باارزشتر میباشد؟
اگرچه مدل RFM قدرت زیادی در تعیین ارزش مشتریان دارد، اما مبنای این مدل بر اساس نگاه به گذشته مشتریان است. مدل RFM بشرطی میتواند یک مدل مناسب در تعیین ارزش مشتریان باشد که، رفتار آینده مشتری شبیه رفتار گذشته وی باشد[153]. بر همین اساس، به‌منظور تعیین مشتریان باارزش آینده، بایستی آینده آن‌ها نیز تعیین شده و ملاکی برای تصمیمگیری قرار گیرد. بدین منظور، از روش زنجیره مارکوف برای پیشبینی وضعیت آینده مشتریان استفاده خواهد شد. هدف از استفاده از زنجیره مارکوف، پیشبینی متغیرهای فاصله(Dc)، فرکانس(F)، تازگی(R) و طول مدت زمان(L) آینده مشتریان است. در ادامه نحوه استفاده از زنجیره مارکوف در پیشبینی ارزش آینده مشتری شرح داده شده است.
الگوریتم استخراج ارزش
روند کلی در تعیین ارزش آینده مشتری با استفاده از زنجیره مارکوف بصورت زیر است:
خوشهبندی دادههای تراکنشی مسافران و تعیین مراکز خوشهها.
تشکیل ماتریس گذار و قرار دادن مقدار هر یک از مراکز خوشهها به‌عنوان گذارهای موجود در ماتریس.
تشکیل ماتریس گذار.
صفر کردن تمامی درآیههای ماتریس.
خوشهبندی وضعیت جدید مسافران.
به ازای تغییر وضعیت هر مشتری در خوشههای جدید نسبت به خوشههای قدیم، یک واحد به مقدار درآیه متناظر در ماتریس اضافه شود.
نرمال کردن ماتریس.
پیشبینی متغیرهای LDcFR آینده برای هر یک از مشتریان.
محاسبه ارزش هر یک از مشتریان به روش RFM وزندار.
محاسبه ارزش مورد انتظار149 هریک از مشتریان با استفاده از رابطه 3-3.
(3-3)
LTV=∑_(t=1)^T▒〖P*value*〖(1/(1+δ))〗^t 〗
در رابطه 3-3، T دوره زمانی پیشبینی آینده مشتری بوده و value نشانگر ارزش LDcFR وزندار میباشد.
در مرحله 6 از تعیین ارزش آینده مشتریان، هدف بدست آوردن یک مقدار عددی به‌عنوان ارزش آینده مشتری با استفاده از روش RFM وزندار است. در روش WRFM، ارزش هریک از مشتریان بر اساس رابطه 3-4 محاسبه و تعیین میشود.
(3-4)
value= w_R*R+w_F*F+w_M*M
در رابطه 3-4 ارزش مشتری بر اساس میزان هریک از متغیرها و ارزش آن متغیر در صنعت تعیین میشود؛ این رابطه با توجه به مدل توسعه داده شده برای تعیین ارزش مسافران، در محاسبات بصورت رابطه 3-5 خواهد شد.
(3-5)
value= w_l*L+w_d*D+w_f*F+w_r*R
در محاسبه ارزش به وسیله مدل RFM وزندار، نیاز به تعیین ارزش هریک از متغیرها است. در این زمینه تکنیکهای زیادی نظیر AHP، ANP، Topsis، Electre و… معرفی شده که در این بخش از روش AHP استفاده خواهد شد. روش AHP در بخش ‏2-5-1 شرح داده شده است.
اولویتبندی مشتریان
با استفاده از الگوریتم ارائه شده در بخش قبل، میتوان ارزش مورد انتظار هریک از مسافران را محاسبه کرده و با میانگینگیری از ارزش مسافران موجود در هر خوشه، ارزش کلی هر خوشه را تعیین کرده و خوشهها را اولویتبندی کرد.
همانگونه که در ابتدای فاز 2 عنوان گردید، هدف این فاز، طراحی مدلی در تعیین ارزش مسافران است. این مدل در طول مراحل مختلف از فاز 2 طراحی و شرح داده شد. در شکل3- 5 شمای کلی مدل طراحی شده نشان داده شده است.

شکل3- 5 مدل تعیین ارزش مسافران در صنعت حمل و نقل
همان‌گونه که در شکل3- 5 نشان داده شده است، پس از انتخاب ویژگیها و پیشپردازش دادهها، مجموعه داده نهایی تشکیل شده و وارد مدل میشود. از این مجموعه داده، دادههای L، Dc، F و R استخراج شده و مجموعه LDcFR برای هر مشتری تشکیل شده و با استفاده از الگوریتم رقابت استعماری خوشهبندی خواهند شد. از طرفی دیگر دادههای L، Dc، F و R با استخراج از پایگاهداده مشتریان، در اختیار زنجیره مارکوف قرار گرفته تا با پیشبینی آینده هر مشتری، LTV وی محاسبه شود. از این LTV برای تعیین ارزش هر خوشه استفاده خواهد شد. تعیین ارزش خوشهها این امکان را بوجود میآورد که مسافران هدف شناسایی شده و به ایرلاین مربوطه معرفی گردد.
فاز سوم: بازاریابی
ساخت و طراحی مدل، معمولاً پایان پروژه نیست. نتایج بدست آمده بایستی در قالبی قابل فهم و روشن درآمده تا برای مدیران قابل فهم باشد. ازآنجاکه هدف نهایی تعیین ارزش، تعیین استراتژیهای بازاریابی برای هر خوشه از مشتریان است، لذا مدل نهایی به صورت نشان داده شده در شکل3- 6 درخواهد آمد.

شکل3- 6 مدل نهایی تعیین ارزش مسافران
مدلهای اعتبارسنجی
ارزیابی LDcFR
جهت ارزیابی مدل LDcFR و نشان دادن کیفیت آن در تعیین ارزش مسافران، همبستگی متغیرها به هم مورد بررسی قرار خواهد گرفت. چنانچه متغیرها از هم مستقل نباشند، قطعا رابطهای بین آن‌ها وجود داشته که به آن همبستگی گفته میشود. همبستگی یک معیار برای سنجش نوع و شدت رابطه میان دو یا گروهی از متغیرهاست. هنگامی که بیان میشود میان دو متغیر همبستگی وجود دارد، به این معناست که تغییرات مقادیر متغیرها بر روی یکدیگر اثرگذار میباشد. برای اندازهگیری میزان همبستگی دو متغیر از ضریب همبستگی150 استفاده میشود. ضریب همبستگی(R) یک معیار عددی برای شناسایی شدت رابطه میان دو متغیر است که مقدار آن بین 1- و 1 بوده و R=0 نشاندهنده استقلال میان متغیرها است. اگر R0 باشد، نشاندهنده وجود همبستگی مستقیم بین دو متغیر بوده و هرچه به 1+ نزدیکتر باشد، شدت همبستگی بیشتر است و به‌طور بالعکس، اگر R0 باشد، وجود رابطه معکوس نمایان شده و بزرگی آن، شدت رابطه را نشان میدهد.
مشهورترین ضریب همبستگی، ضریب همبستگی پیرسون بوده که بر مبنای کوواریانس دو متغیر و انحراف معیار آن‌ها تنظیم شده است. در رابطه 3-6 روش محاسبه همبستگی پیرسون نشان داده شده است.
(3-6)
r_xy= (cov(x,y))⁄(δ_x δ_y )
در رابطه بالا، cov(x,y) نشاندهنده کوواریانس دو متغیر x و y بوده و δ_x انحراف معیار متغیر x و δ_y انحراف معیار متغیر y میباشد.
ازآنجاکه در این تحقیق، بررسی تأثیر همزمان متغیرهای L، Dc، F و R بر ارزش مسافران است؛ استفاده از رگرسیون چندگانه نتایج بهتری تولید خواهد کرد. در رگرسیون چندگانه یک متغیر وابسته (ارزش مسافر) و دو یا چند متغیر مستقل (L، Dc، F و R) حضور دارند. روش محاسبه رگرسیون جزئی در رابطه 3-7 آمده است.
(3-7)
E(Y│x_1,x_2,…,x_k )=a_0+a_1 x_1+…+a_k x_k
در رابطه 3-7، متغیرهای x_1,x_2,…,x_k متغیرهای مستقل مدل بوده، Y متغیر وابسته وa_1,a_2,…,a_k ضرایب رگرسیون جزئی و a_0 مقدار عرض از مبدأ میباشند.
ارزیابی توسعه ICA
به‌منظور بررسی برازندگی و کیفیت ICA جدید در فرآیند خوشهبندی، الگوریتم ICAجدید در نرمافزار متلب151 پیادهسازی شده و از معیار SSE152 در 3 مجموعه داده آماده و مشهور IRIS، WINE و CMC استفاده خواهد شد. معیار SSE میزان پراکندگی دادهها در هر خوشه را مشخص کرده و از این طریق کیفیت الگوریتمها قابل مقایسه میشود. روش محاسبه SSE در رابطه 3-8 نشان داده شده است.
(3-8)
SSE= ∑_(i=1)^k▒∑_(X∈C_i)▒∑_(j=1)^n▒(〖X_j-m〗_j^i )^2
در رابطه 3-8، k تعداد خوشهها، X یکی از عناصر موجود در خوشه C_i و n تعداد ویژگیهای هر داده است. برای هر عنصر(X)، مجموع فاصله ویژگیهای آن داده نسبت به مرکز خوشه(m_j^i) نشاندهنده اختلاف آن داده تا مرکز خوشه است. مجموع اختلاف تمامی دادهها از مراکز خوشههای متناظر، معیار SSE را تشکیل میدهد.
جمعبندی
در این فصل، مدل تعیین ارزش مسافران طراحی و توسعه داده شد. مدل توسعه داده شده از 3 بخش اصلی تـوسعه مدل RFM در تعیین ارزش مسـافران، خوشهبندی مسافران و تعیین ارزش مورد انتظار مسافران تشکیل شـده است. در ادامه و در فصل بعد مدل ارائه شده بر روی دادههای واقعی پیادهسازی شده تا کیفیت آن مشخص گردد.

فصل 4: نتایج و تفسیر آن‌ها

مقدمه
در فصل قبل، مدل تعیین ارزش مسافران بصورت تئوری و براساس مطالعات پیشین توسعه داده شد. در این فصل این مدل با استفاده از دادههای موجود در دنیای واقعی مورد بررسی قرار خواهد گرفت تا کیفیت و اثربخشی آن تعیین شود. در ادامه این فصل، ابتدا در بخش اول، الگوریتم رقابت استعماری توسعه داده شده مورد بررسی و آزمایش قرار خواهد گرفت و در بخش دوم مدل تعیین ارزش مسافران ارزیابی خواهد شد.
ارزیابی توسعه ICA
همانگونه که در بخش ‏3-3-2 بیان شد، برای ارزیابی الگوریتم توسعه داده شده رقابت استعماری، از معیار SSE بر روی 3 مجموعه داده آماده و مشهور IRIS، WINE و CMC استفاده خواهد شد. از اینرو، الگوریتم توسعه داده شده با استفاده از نرمافزار متلب و با بهرهگیری از سیستمی با پردازنده 5 هستهای و حافظه داخلی 8 گیگابایت پیادهسازی گردیده است. نتایج حاصل از این ارزیابیها در ادامه تشریح شده است.
مجموعه داده IRIS
این مجموعه داده حاوی ویژگیهای 3 نوع متفاوت از گل زنبق است که در 1936 توسط فیشر153 برای نشان دادن تکنیـک‌های خطی تفکیک پذیر معرفی گردید[118]. این مجموعه شامل ۵۰ نمونه از سه نوع گل زنبق با نام‌های سیتوسا154، وریجینیکا155 و ورسیکولار156 می‌باشد. برای هریک از 50 نمونه آورده شده، 4 خصوصیت وجود دارد، پهنای گلبرگ، طول گلبرگ، پهنای کاسبرگ و طول کاسبرگ. نتایج حاصل از 100 بار خوشهبندی این مجموعه توسط الگوریتمهای مختلف تکاملی، در جدول4- 1 نشان داده شده است.
جدول4- 1 نتایج خوشه بندی مجموعه داده IRIS
الگوریتم تکاملی
تابع هزینه

حداقل
میانگین
حداکثر
انحراف معیار
ICA(new)
96.5255
96.57205
97.51413
0.10602
ICA
96.6997
96.8466
97.0059
0.1114
PSO
96.8942
97.2328
97.8973
0.3471
GA
113.9865
125.1970
139.7782
14.563

روند همگرایی به پاسخ بهینه در 100 گام اجرای الگوریتمهای ICA توسعه‌یافته، ICA و PSO در شکل4- 1 نشان داده شده است.

شکل4- 1 مقایسه روند همگرایی به پاسخ بهینه در داده های Iris
همان‌گونه که در شکل4- 1 نشان داده شده است، همگرایی الگوریتم رقابت استعماری توسعه داده شده نسبت به دو الگوریتم دیگر بهتر میباشد.
مجموعه داده WINE
این مجموعه داده شامل 178 نمونه نوشیدنی در 3 کلاس مختلف است که هر نمونه دارای 13 ویژگی میباشد. این دادهها حاصل تجزیه‌وتحلیل شیمیایی بر روی 3 نوع نوشیدنی بوده که در سال 1991 در ایتالیا صورت گرفته است. مقادیر دادههای موجود در این دیتاست، بصورت پیوسته بوده و هیچ داده Miss در آن وجود ندارد[118, 154]. نتایج حاصل از خوشهبندی این مجموعه توسط الگوریتمهای مختلف، در جدول4- 2 نشان داده شده است.
جدول4- 2 نتایج خوشه بندی مجموعه داده Wine
الگوریتم تکاملی
تابع هزینه

حداقل
میانگین
حداکثر
انحراف معیار
ICA(new)
16292.42
16294
16301.01
1.537
ICA
16292.94
16295.23
16300.7
1.559
PSO
16345.967
16417.4725
16562.318
85.497
GA
16530.53
16530.53
16530.53
0
روند همگرایی الگوریتمهای مختلف به جواب بهینه در این مجموعه داده، در شکل4- 2 نشان داده شده است.

شکل4- 2 مقایسه روند همگرایی به پاسخ بهینه در داده های Wine
مجموعه داده CMC
مجموعه داده 157CMC، مجموعهای شامل 1473 رکورد و 10 خصوصیت بوده که در قالب 3 کلاس خوشهبندی میشوند. این دادهها در سال 1987 در اندونزی، برای بررسی بارداری زوجهای جوان، به شیوه نظرسنجی جمعآوری شده است. 10 ویژگی موجود در این پایگاه داده، ویژگیهای فردی و اقتصادی-اجتماعی افراد را نشان میدهد که عبارتند از: سن، میزان تحصیلات، میزان تحصیلات همسر، تعداد فرزندان، مذهب، اشتغال/عدم اشتغال همسر، شغل همسر، شاخص سطح زندگی، مواجهه با رسانهها و روش پیشگیری از بارداری[155]. نتایج حاصل از خوشهبندی این مجموعه توسط الگوریتمهای مختلف، در جدول4- 3 نشان داده شد

پایان نامه
Previous Entries منابع و ماخذ پایان نامه سودآوری، ارزش مشتری، ارزش مسافران، حفظ مشتری Next Entries منابع و ماخذ پایان نامه ارزش مسافران، زنجیره مارکوف، ناسازگاری، مقایسات زوجی