
كمتر، سی ستمهای رايانهاي متمركزتر، شبكه قابل دسترسي گستردهتر، محدوديت زماني و مكاني كمتر و در نهايت امنيت اطلاعات بانكي بيشتر خواهد بود [11 به نقل از 12].
بانكداري الكترونيك، اساساً به فراهم آوردن امكان دسترسي مشتريان به خدمات بانكي با استفاده از واسطههاي ايمن و بدون حضور فيزيكي اطلاق میشود. بنا بر تعريف ديگري بانكداري الكترونيك به ايجاد محصولات و خدمات با بهای كم، از طريق کانالهای الكترونيكي اطلاق میشود. اين محصولات و خدمات ميتواند شامل صورتحساب، وام، مديريت سپردهها، پرداختهای الكترونيكي و ايجاد محصولات و خدمات پرداختهای الكترونيكي همانند پول الكترونيكي باشند [11 به نقل از 12].
2-8- دادهکاوی
سرعت روزافزون انباشت دادههای حاصل از پردازش و تعاملات و تبادلات و ارتباطات موجود در فضای کسبوکار، به خصوص با وجود پیشرفت سیستمهای فناوری اطلاعات و ارتباطات37، مجموعه وسیعی از دادهها را پدید آورده است. طبق آخرین تحقیقات محققان، ظرفیت ذخیرهسازی دادهها در سراسر دنیا هر نه ماه دو برابر و دادههای در دسترس نیز هر پنج سال دو برابر میشوند. همچنین دانشمندان پیشبینی کردهاند پایگاههای داده هر 5 سال یک بار به طور کامل فراموش شده و دادههای موجود در آنها فقط در انبارهای داده ذخیره میشوند.
هرچند در نگاه اول ممکن است به نظر برسد این دادهها بیفایده هستند، اما این دادهها میتوانند در صورت وجود ابزارهای مناسب، حکم معادن طلا را برای سازمانها، کسبوکارها و شرکتها داشته باشند. با این حال که ما از نظر دادهای غنی هستیم اما از نظر دانشی بسیار فقیریم [31]. اکثر سازمانها با فقر دانش مواجهاند و میتوان ادعا نمود این مسئله به سبب عدم شناخت سازمانها از ابزارهایی نظیر دادهکاوی است که برخلاف ابزارهای گزارش گیری و آمارگیری قدیم میتوانند حجم عظیمی از دادهها را تحلیل نموده و الگوهای پنهان مفیدی از دل این دادهها آشکار نمایند.
دادهکاوی به کشف الگوهای پنهان و استخراج دانش و اطلاعات از پایگاه دادههای بسیار بزرگ اشاره دارد.
دادهکاوی الگوریتمهایی چون دستهبندی38، خوشهبندی39، قوانین انجمنی40 و … را بر روی مجموعهای از دادهها41 اعمال نموده و بعد از تحلیل محتویات دادهای مدلهایی را به عنوان خروجی تولید مینماید. روشهای آماری اساس کار دادهکاوی را تشکیل میدهند.
2-8-1- مقايسه روشهای آماری و دادهکاوی
با پیشرفت روزافزون علوم در گذر زمان روشهای قدیمی موجود جای خود را به روشهای نوین میسپارند تا محدودیتهای روشهای گذشته را برطرف نمایند. علم آمار که یکی از شاخههای علوم ریاضیست نیز از این امر مستثنی نبوده و دستخوش تغییرات بسیاری گشته است. آمار، علمی است که به جمع آوری، توضیح و تفسیر دادهها میپردازد. اشتراک تکنیکهای آماری و دادهکاوی بیشتر در تخمین و پیشبینی است. همچنین از آزمونهای آماری در ارزیابی نتایج دادهکاوی نیز استفاده میشود. از این منظر میتوان روشهای آماری را اساس کار دادهکاوی دانست.
دادهکاوی به صورت يك محصول قابل خريداري نميباشد، بلكه يك رشته علمي و فرآيندي است كه بايد به صورت يك پروژه پيادهسازي شود. دادهها اغلب حجيم ميباشند و به تنهایی قابل استفاده نيستند، بلكه دانش نهفته در دادهها قابل استفاده ميباشد. بنابراين بهرهگيري از قدرت فرآيند دادهکاوی جهت شناسايي الگوها و مدلها و نيز ارتباط عناصر مختلف در پايگاه داده جهت كشف دانش نهفته در دادهها و نهايتاً تبديل داده به اطلاعات، روز به روز ضروريتر ميشود [11].
پايه و اساس دادهکاوی به دو مقوله آمار و هوش مصنوعي تقسيم شده است، كه روشهاي هوش مصنوعي به عنوان روشهاي يادگيري ماشين در نظر گرفته ميشوند. تفاوت اساسي بين روشهاي آماري و روشهای يادگيري ماشين بر اساس فرضها و يا طبيعت دادههايي كه پردازش ميشوند.
تفاوتهاي موجود بين روشهای آناليز آماری و روشهای دادهکاوی در جدول 2-3 نشان داده شده است.
جدول 2-3 مقایسه روشهای تحلیل آماری و دادهکاوی [11 به نقل از 14]
روش
تحلیل آماری
دادهکاوی
فرضیه
آمارشناسان همیشه با یک فرضیه شروع بکار میکنند.
دادهکاو به فرضیه احتیاجی ندارد.
نوع دادهها
از دادههای عددی استفاده میکند.
ابزارهای دادهکاوی میتوانند از انواع مختلف داده و نه فقط داده عددی استفاده کنند.
ایجاد روابط
آمارشناسان باید رابطههایی ایجاد کنند که با فرضیه ارتباط دارد.
الگوریتمهای دادهکاوی به صورت اتوماتیک روابط را ایجاد میکنند.
صحت دادهها
آنها میتوانند دادههای نابجا و نادرست را در طول تحلیل مشخص کنند.
دادهکاوی به دادههای صحیح و درست نیاز دارد.
قابلیت تفسیر
آنها میتوانند نتایج کار خود را تفسیر و برای مدیران بیان کنند.
نتایج دادهکاوی نسبتاً پیچیده است و نیاز به متخصصانی جهت تحلیل و بیان نتایج به مدیران دارد.
2-8-2- مفهوم دادهکاوی
برای دادهکاوی تعاریف بسیار زیادی ارائه شده است که البته بسیاری از این تعاریف بسیار نزدیک به یکدیگرند. در بعضی منابع دادهکاوی را با اصطلاحاتی نظیر کشف دانش معادل قرار دادهاند که باید اینگونه اصلاح شود، دادهکاوی یک گام اساسی در فرایند کشف دانش است.
اصطلاحات و عبارات بسيار ديگري نيز معادل با دادهکاوی بکار رفتهاند كه معاني مشابه و گاهی متفاوت دارند مانند، كاوش دانش از پايگاه داده، استخراج دانش42، تحليل الگوي داده43، لايروبی داده44 و باستانشناسي45 [11].
دادهکاوی یک گام از فرایند کشف دانش از پایگاه داده است و به الگوریتمهایی که برای استخراج الگو از دادهها بکار میرود، گفته میشود. اطلاعات حاصل میتواند به عنوان ورودی برای تشکیل مدل دستهبندی و یا پیشبینی، یا بهبود یک مدل موجود بکار رود [53]. دادهکاوی جستجو و یا کاوش46 دانش (الگوهای دلخواه) از مقادیر زیاد دادههای موجود است [31].
در تعریفی دیگر دادهکاوی به این صورت تعریف شده است: بهکارگیری الگوریتمهای یادگیری ماشین47 برای یافتن الگوهای نهفته از ارتباطات موجود در بین عناصر دادهای موجود در یک مجموعه داده بسیار بزرگ که میتواند منجر به افزایش سود شود [26].
دادهکاوی يك متدولوژي بسيار قوي و با پتانسيل بالا ميباشد كه به سازمانها كمك ميكند كه بر مهمترین اطلاعات از مخزن داده هاي خود تمركز نمايند [52].
دادهکاوی به فرايند استخراج اطلاعات نهفته، قابل فهم، قابل تعقيب از پایگاه دادههای بزرگ و استفاده از آنها در تصميمگيريهاي تجاري مهم اطلاق ميشود [13].
فرایند دادهکاوی را میتوان به عنوان سیستمی تصمیمیار تلقی نمود که سازمان و مدیران آن را قادر میسازد از دادههای خام به گنجینههای دانشی دست یابند و از این دانش در مسیر اتخاذ استراتژیهای سازمانی بهره گیرند.
اگر هرم دادهها را به صورت زير در نظر بگيريم:
شکل 2-6 سیر تکامل در هرم دانش [11]
با آگاهي از تعريف دادهکاوی و نگاهي به هرم بالا بهتر ميتوان به نقش دادهکاوی در سازمانها پي برد. دادهکاوی سبب ميشود كه سازمانها از سطح داده به سطوح بالاتر دانش و الگوهاي ناشناخته برسند. الگوهاي استخراج شده ميتوانند رابطهاي بين ويژگيها و مشخصات سيستم مانند نوع تقاضا و نوع مشتري، پيشبينيهاي آينده بر اساس مشخصات سيستم، قوانين (اگر-آنگاه) بين متغيرهاي سيستم، دستهبنديها و خوشهبنديهاي اشياء و ركوردهاي شبيه به هم در يك سيستم و غيره باشند [11 به نقل از 52].
2-8-3- دادهکاوی و کشف دانش
دادهکاوی را میتوان به عنوان ابزاری جهت کشف دانش از پایگاههای داده تعریف نمود. دادهکاوی یک گام در فرایند کشف دانش از پایگاه داده48 است که با استفاده از الگوریتمهای کشف و تحلیل دادهها تعداد خاصی الگو یا مدل را از روی دادهها تولید میکند.
الگوی زیر مراحل استخراج دانش مشتری به کمک دادهکاوی در سازمان را نمایش میدهد.
شکل 2-7 گامهای فرایند تولید دانش از پایگاه دادهها [31و53]
این الگو گامهای فرایند کشف دانش از پایگاه داده را در [53] به صورت زیر نشان داده است:
چنانچه از نمایش الگوی فوق برداشت میشود، ابتدا باید شناسایی دامنه فعالیتهای کسبوکار صورت گرفته و دسترسی به دادهها مقدور گردد. دادهها در اینجا میتواند مجموعهای از حقایق، الگوها و یا خبرگی باشد.
در مرحله بعد با توجه به اهداف تعیین شده مورد نظر ذینفعان سازمان (مدیران، کارمندان، سرپرستان شعب، کاربران، خبرگان و مشاورین فناوری اطلاعات)، رکوردهای مورد نیاز توسط دادهکاو از میان حجم عظیم دادههای سازمان مورد نظر انتخاب میشوند. در این مرحله حجم انبوه دادهها به دادههای هدف کاهش داده میشود.
برای آمادهسازی بخش دادههای انتخابی باید عملیات پیشپردازشی روی آنها صورت گیرد. این عملیات شامل جمع آوری اطلاعات لازم برای مقداردهی به مقادیر رکوردهای از قلم افتاده، تشخیص دادههای متفاوت و هماهنگی آنها با بقیه، جمع آوری اطلاعات لازم برای اصلاح یا حذف دادههای نامناسب49 میباشد. محصول این مرحله دادههای پیشپردازش شده خواهد بود.
گام بعد گزینش دادهها با هدف کاهش حجم آنها و یافتن ویژگیهایی از دادهها با توجه به هدف تعیین شده برای کسبوکار خواهد بود. با کاهش حجم دادهها یا روشهای تغییرات آنها حجم دادهها میتواند به مقدار مفید و مؤثری کاهش یابد.
مرحله بعد اعمال یک یا چند الگوریتم (مانند کلاسیفایرها50 و یا شبکههای عصبی51 و …) از بین الگوریتمهای موجود و یا ابتکاری دادهکاوی بر روی دادههاست. حاصل این مرحله یک یا چند مدل و یا الگو خواهد بود.
در گام بعد با تحلیل، ارزیابی و تفسیر الگوهای معنادار کشف شده، دانش استخراج میگردد. دانش استخراج شده میتواند به صورت قواعدی مستند شود.
یک الگو زمانی میتواند به عنوان دانش تلقی شود که :
به سادگی برای افراد قابل فهم باشد.
اعتبار آن از یک حد آستانهای52 پایینتر نباشد.
دانش جدیدی متناسب با اهداف تعیین شده سازمان ارائه دهد.
کاربردی باشد [1].
2-8-4- فرايند دادهکاوی
دادهکاوی، فرایندی خلاقانه است که دانش و مهارتهای گوناگونی را میطلبد. وجود یک استاندارد جهت انجام این فرایند به تبدیل مشکلات کسبوکار به مسائل دادهکاوی، گزینش روشهای دادهکاوی و تبدیل دادهها متناسب با نوع کسبوکار، معنا دادن به ارزیابی اثربخشی و مستندسازی نتایج اهمیت فراوان دارد.
چرخه CRISP-DM53 فرایند استانداردی54 است که با هدف ارائه چارچوبی برای اجرای پروژههای دادهکاوی بزرگ، یا هزینه کمتر، قابلیت اطمینان بیشتر، قابلیت مدیریت بیشتر و سریعتر توسعه یافت [50].
مدل مرجع CRISP-DM نمای کلی از چرخه عمر55 یک پروژه دادهکاوی را نشان میدهد. این مدل شامل فازهای یک پروژه، کارهای لازم برای انجام هر فاز و خروجیهای هر فاز است.
چرخه عمر یک پروژه دادهکاوی چنانچه در شکل 2-8 نشان داده شده است به شش فاز شکسته میشود. توالی فازها اجباری نیست بلکه این ترتیب مرسومترین، مهمترین و پر تکرارترین وابستگی بین فازها را نشان میدهد. در مورد پروژههای خاص این ترتیب بستگی به این دارد که خروجی کدام فاز و یا عمل خاص نیازمند اجرای فاز بعدی است [50].
حلقه بیرونی مربوط به طبیعت پروژههای دادهکاوی است. بدین معنی که پروژه دادهکاوی با تولید یک راهکار خاص در زمان مشخص پایان نمییابد بلکه با اجرای یک دور فرایند دادهکاوی در سازمان و اجرای آن راهکار در سازمان، ممکن است نتایجی حاصل شود که سؤالات جدیدی از کسبوکار را برانگیزد و این نیازمند تکرار دو و یا چند باره چرخه خواهد بود.
شکل 2-8 متدولوژي فرآيند استاندارد ميان صنعتي دادهکاوی (CRISP-DM) [50]
مدل فرایند CRISP-DM شامل فازهای زیر میباشد:
گام درك موقعيت كسبوكار56
گام درك دادهها57
گام پيشپردازش دادهها58
گام مدلسازی59
گام ارزيابي60
گام بهکارگیری61
در ادامه هر یک از این گامها به طور خلاصه توضیح داده میشود.
درک موقعیت کسب و کار: این گام، بخش آغازین مدل CRISP-DM میباشد
