منابع پایان نامه درباره پایگاه داده‌ها، جمع آوری اطلاعات، فناوری اطلاعات

دانلود پایان نامه ارشد

كمتر، سی ستم‌های رايانهاي متمركزتر، شبكه قابل دسترسي گستردهتر، محدوديت زماني و مكاني كمتر و در نهايت امنيت اطلاعات بانكي بيشتر خواهد بود [11 به نقل از 12].
بانكداري الكترونيك، اساساً به فراهم آوردن امكان دسترسي مشتريان به خدمات بانكي با استفاده از واسطههاي ايمن و بدون حضور فيزيكي اطلاق می‌شود. بنا بر تعريف ديگري بانكداري الكترونيك به ايجاد محصولات و خدمات با بهای كم، از طريق کانال‌های الكترونيكي اطلاق می‌شود. اين محصولات و خدمات ميتواند شامل صورتحساب، وام، مديريت سپرده‌ها، پرداخت‌های الكترونيكي و ايجاد محصولات و خدمات پرداخت‌های الكترونيكي همانند پول الكترونيكي باشند [11 به نقل از 12].
2-8- داده‌کاوی
سرعت روزافزون انباشت داده‌های حاصل از پردازش و تعاملات و تبادلات و ارتباطات موجود در فضای کسبوکار، به خصوص با وجود پیشرفت سیستمهای فناوری اطلاعات و ارتباطات37، مجموعه وسیعی از داده‌ها را پدید آورده است. طبق آخرین تحقیقات محققان، ظرفیت ذخیرهسازی داده‌ها در سراسر دنیا هر نه ماه دو برابر و داده‌های در دسترس نیز هر پنج سال دو برابر می‌شوند. همچنین دانشمندان پیشبینی کرده‌اند پایگاه‌های داده هر 5 سال یک بار به طور کامل فراموش ‌شده و داده‌های موجود در آن‌ها فقط در انبارهای داده ذخیره ‌میشوند.
هرچند در نگاه اول ممکن است به نظر برسد این داده‌ها بیفایده هستند، اما این داده‌ها میتوانند در صورت وجود ابزارهای مناسب، حکم معادن طلا را برای سازمانها، کسبوکارها و شرکتها داشته باشند. با این حال که ما از نظر دادهای غنی هستیم اما از نظر دانشی بسیار فقیریم [31]. اکثر سازمانها با فقر دانش مواجهاند و میتوان ادعا نمود این مسئله به سبب عدم شناخت سازمانها از ابزارهایی نظیر داده‌کاوی است که برخلاف ابزارهای گزارش گیری و آمارگیری قدیم میتوانند حجم عظیمی از داده‌ها را تحلیل نموده و الگوهای پنهان مفیدی از دل این داده‌ها آشکار نمایند.
داده‌کاوی به کشف الگوهای پنهان و استخراج دانش و اطلاعات از پایگاه داده‌های بسیار بزرگ اشاره دارد.
داده‌کاوی الگوریتمهایی چون دسته‌بندی38، خوشه‌بندی39، قوانین انجمنی40 و … را بر روی مجموعهای از داده‌ها41 اعمال نموده و بعد از تحلیل محتویات دادهای مدلهایی را به عنوان خروجی تولید مینماید. روش‌های آماری اساس کار داده‌کاوی را تشکیل میدهند.
2-8-1- مقايسه روش‌های آماری و داده‌کاوی
با پیشرفت روزافزون علوم در گذر زمان روش‌های قدیمی موجود جای خود را به روش‌های نوین میسپارند تا محدودیت‌های روش‌های گذشته را برطرف نمایند. علم آمار که یکی از شاخههای علوم ریاضیست نیز از این امر مستثنی نبوده و دست‌خوش تغییرات بسیاری گشته است. آمار، علمی است که به جمع آوری، توضیح و تفسیر داده‌ها میپردازد. اشتراک تکنیکهای آماری و داده‌کاوی بیشتر در تخمین و پیش‌بینی است. همچنین از آزمونهای آماری در ارزیابی نتایج داده‌کاوی نیز استفاده میشود. از این منظر میتوان روش‌های آماری را اساس کار داده‌کاوی دانست.
داده‌کاوی به صورت يك محصول قابل خريداري نميباشد، بلكه يك رشته علمي و فرآيندي است كه بايد به صورت يك پروژه پيادهسازي شود. داده‌ها اغلب حجيم ميباشند و به تنهایی قابل استفاده نيستند، بلكه دانش نهفته در داده‌ها قابل استفاده ميباشد. بنابراين بهرهگيري از قدرت فرآيند داده‌کاوی جهت شناسايي الگوها و مدلها و نيز ارتباط عناصر مختلف در پايگاه داده جهت كشف دانش نهفته در داده‌ها و نهايتاً تبديل داده به اطلاعات، روز به روز ضروريتر ميشود [11].
پايه و اساس داده‌کاوی به دو مقوله آمار و هوش مصنوعي تقسيم شده است، كه روشهاي هوش مصنوعي به عنوان روشهاي يادگيري ماشين در نظر گرفته ميشوند. تفاوت اساسي بين روشهاي آماري و روش‌های يادگيري ماشين بر اساس فرضها و يا طبيعت دادههايي كه پردازش ميشوند.
تفاوتهاي موجود بين روش‌های آناليز آماری و روش‌های داده‌کاوی در جدول 2-3 نشان داده شده است.
جدول 2-3 مقایسه روش‌های تحلیل آماری و داده‌کاوی [11 به نقل از 14]
روش
تحلیل آماری
داده‌کاوی
فرضیه
آمارشناسان همیشه با یک فرضیه شروع بکار میکنند.
دادهکاو به فرضیه احتیاجی ندارد.
نوع داده‌ها
از داده‌های عددی استفاده میکند.
ابزارهای داده‌کاوی میتوانند از انواع مختلف داده و نه فقط داده عددی استفاده کنند.
ایجاد روابط
آمارشناسان باید رابطههایی ایجاد کنند که با فرضیه ارتباط دارد.
الگوریتم‌های داده‌کاوی به صورت اتوماتیک روابط را ایجاد میکنند.
صحت داده‌ها
آنها میتوانند داده‌های نابجا و نادرست را در طول تحلیل مشخص کنند.
داده‌کاوی به داده‌های صحیح و درست نیاز دارد.
قابلیت تفسیر
آنها میتوانند نتایج کار خود را تفسیر و برای مدیران بیان کنند.
نتایج داده‌کاوی نسبتاً پیچیده است و نیاز به متخصصانی جهت تحلیل و بیان نتایج به مدیران دارد.

2-8-2- مفهوم داده‌کاوی
برای داده‌کاوی تعاریف بسیار زیادی ارائه شده است که البته بسیاری از این تعاریف بسیار نزدیک به یکدیگرند. در بعضی منابع داده‌کاوی را با اصطلاحاتی نظیر کشف دانش معادل قرار دادهاند که باید این‌گونه اصلاح شود، داده‌کاوی یک گام اساسی در فرایند کشف دانش است.
اصطلاحات و عبارات بسيار ديگري نيز معادل با داده‌کاوی بکار رفتهاند كه معاني مشابه و گاهی متفاوت دارند مانند، كاوش دانش از پايگاه داده، استخراج دانش42، تحليل الگوي داده43، لايروبی داده44 و باستانشناسي45 [11].
داده‌کاوی یک گام از فرایند کشف دانش از پایگاه داده است و به الگوریتمهایی که برای استخراج الگو از داده‌ها بکار میرود، گفته میشود. اطلاعات حاصل میتواند به عنوان ورودی برای تشکیل مدل دسته‌بندی و یا پیشبینی، یا بهبود یک مدل موجود بکار رود [53]. داده‌کاوی جستجو و یا کاوش46 دانش (الگوهای دلخواه) از مقادیر زیاد داده‌های موجود است [31].
در تعریفی دیگر داده‌کاوی به این صورت تعریف شده است: به‌کارگیری الگوریتم‌های یادگیری ماشین47 برای یافتن الگوهای نهفته از ارتباطات موجود در بین عناصر دادهای موجود در یک مجموعه داده بسیار بزرگ که میتواند منجر به افزایش سود شود [26].
داده‌کاوی يك متدولوژي بسيار قوي و با پتانسيل بالا ميباشد كه به سازمانها كمك ميكند كه بر مهم‌ترین اطلاعات از مخزن داده هاي خود تمركز نمايند [52].
داده‌کاوی به فرايند استخراج اطلاعات نهفته، قابل فهم، قابل تعقيب از پایگاه داده‌های بزرگ و استفاده از آنها در تصميمگيريهاي تجاري مهم اطلاق ميشود [13].
فرایند داده‌کاوی را میتوان به عنوان سیستمی تصمیمیار تلقی نمود که سازمان و مدیران آن را قادر میسازد از داده‌های خام به گنجینههای دانشی دست یابند و از این دانش در مسیر اتخاذ استراتژی‌های سازمانی بهره گیرند.
اگر هرم داده‌ها را به صورت زير در نظر بگيريم:

شکل 2-6 سیر تکامل در هرم دانش [11]
با آگاهي از تعريف داده‌کاوی و نگاهي به هرم بالا بهتر ميتوان به نقش داده‌کاوی در سازمانها پي برد. داده‌کاوی سبب ميشود كه سازمانها از سطح داده به سطوح بالاتر دانش و الگوهاي ناشناخته برسند. الگوهاي استخراج شده ميتوانند رابطهاي بين ويژگيها و مشخصات سيستم مانند نوع تقاضا و نوع مشتري، پيشبينيهاي آينده بر اساس مشخصات سيستم، قوانين (اگر-آنگاه) بين متغيرهاي سيستم، دستهبنديها و خوشهبنديهاي اشياء و ركوردهاي شبيه به هم در يك سيستم و غيره باشند [11 به نقل از 52].

2-8-3- داده‌کاوی و کشف دانش
داده‌کاوی را میتوان به عنوان ابزاری جهت کشف دانش از پایگاههای داده تعریف نمود. داده‌کاوی یک گام در فرایند کشف دانش از پایگاه داده48 است که با استفاده از الگوریتم‌های کشف و تحلیل داده‌ها تعداد خاصی الگو یا مدل را از روی داده‌ها تولید میکند.
الگوی زیر مراحل استخراج دانش مشتری به کمک داده‌کاوی در سازمان را نمایش می‌دهد.
شکل 2-7 گام‌های فرایند تولید دانش از پایگاه داده‌ها [31و53]
این الگو گام‌های فرایند کشف دانش از پایگاه داده را در [53] به صورت زیر نشان داده است:
چنانچه از نمایش الگوی فوق برداشت میشود، ابتدا باید شناسایی دامنه فعالیت‌های کسبوکار صورت گرفته و دسترسی به داده‌ها مقدور گردد. داده‌ها در اینجا میتواند مجموعهای از حقایق، الگوها و یا خبرگی باشد.
در مرحله بعد با توجه به اهداف تعیین شده مورد نظر ذینفعان سازمان (مدیران، کارمندان، سرپرستان شعب، کاربران، خبرگان و مشاورین فناوری اطلاعات)، رکوردهای مورد نیاز توسط دادهکاو از میان حجم عظیم داده‌های سازمان مورد نظر انتخاب میشوند. در این مرحله حجم انبوه داده‌ها به داده‌های هدف کاهش داده میشود.
برای آماده‌سازی بخش داده‌های انتخابی باید عملیات پیشپردازشی روی آنها صورت گیرد. این عملیات شامل جمع آوری اطلاعات لازم برای مقداردهی به مقادیر رکوردهای از قلم افتاده، تشخیص داده‌های متفاوت و هماهنگی آنها با بقیه، جمع آوری اطلاعات لازم برای اصلاح یا حذف داده‌های نامناسب49 میباشد. محصول این مرحله داده‌های پیش‌پردازش شده خواهد بود.
گام بعد گزینش داده‌ها با هدف کاهش حجم آنها و یافتن ویژگیهایی از داده‌ها با توجه به هدف تعیین شده برای کسبوکار خواهد بود. با کاهش حجم داده‌ها یا روش‌های تغییرات آن‌ها حجم داده‌ها میتواند به مقدار مفید و مؤثری کاهش یابد.
مرحله بعد اعمال یک یا چند الگوریتم (مانند کلاسیفایرها50 و یا شبکه‌های عصبی51 و …) از بین الگوریتم‌های موجود و یا ابتکاری داده‌کاوی بر روی دادههاست. حاصل این مرحله یک یا چند مدل و یا الگو خواهد بود.
در گام بعد با تحلیل، ارزیابی و تفسیر الگوهای معنادار کشف شده، دانش استخراج میگردد. دانش استخراج شده میتواند به صورت قواعدی مستند شود.
یک الگو زمانی میتواند به عنوان دانش تلقی شود که :
به سادگی برای افراد قابل فهم باشد.
اعتبار آن از یک حد آستانهای52 پایینتر نباشد.
دانش جدیدی متناسب با اهداف تعیین شده سازمان ارائه دهد.
کاربردی باشد [1].
2-8-4- فرايند داده‌کاوی
داده‌کاوی، فرایندی خلاقانه است که دانش و مهارتهای گوناگونی را میطلبد. وجود یک استاندارد جهت انجام این فرایند به تبدیل مشکلات کسبوکار به مسائل داده‌کاوی، گزینش روش‌های داده‌کاوی و تبدیل داده‌ها متناسب با نوع کسبوکار، معنا دادن به ارزیابی اثربخشی و مستندسازی نتایج اهمیت فراوان دارد.
چرخه CRISP-DM53 فرایند استانداردی54 است که با هدف ارائه چارچوبی برای اجرای پروژههای داده‌کاوی بزرگ، یا هزینه کمتر، قابلیت اطمینان بیشتر، قابلیت مدیریت بیشتر و سریعتر توسعه یافت [50].
مدل مرجع CRISP-DM نمای کلی از چرخه عمر55 یک پروژه داده‌کاوی را نشان می‌دهد. این مدل شامل فازهای یک پروژه، کارهای لازم برای انجام هر فاز و خروجیهای هر فاز است.
چرخه عمر یک پروژه داده‌کاوی چنانچه در شکل 2-8 نشان داده شده است به شش فاز شکسته میشود. توالی فازها اجباری نیست بلکه این ترتیب مرسومترین، مهمترین و پر تکرارترین وابستگی بین فازها را نشان می‌دهد. در مورد پروژههای خاص این ترتیب بستگی به این دارد که خروجی کدام فاز و یا عمل خاص نیازمند اجرای فاز بعدی است [50].
حلقه بیرونی مربوط به طبیعت پروژههای داده‌کاوی است. بدین معنی که پروژه داده‌کاوی با تولید یک راهکار خاص در زمان مشخص پایان نمییابد بلکه با اجرای یک دور فرایند داده‌کاوی در سازمان و اجرای آن راهکار در سازمان، ممکن است نتایجی حاصل شود که سؤالات جدیدی از کسبوکار را برانگیزد و این نیازمند تکرار دو و یا چند باره چرخه خواهد بود.

شکل 2-8 متدولوژي فرآيند استاندارد ميان صنعتي داده‌کاوی (CRISP-DM) [50]
مدل فرایند CRISP-DM شامل فازهای زیر میباشد:
گام درك موقعيت كسبوكار56
گام درك داده‌ها57
گام پيشپردازش داده‌ها58
گام مدل‌سازی59
گام ارزيابي60
گام به‌کارگیری61
در ادامه هر یک از این گامها به طور خلاصه توضیح داده میشود.
درک موقعیت کسب و کار: این گام، بخش آغازین مدل CRISP-DM میباشد

پایان نامه
Previous Entries منابع پایان نامه درباره مدیریت دانش، حفظ مشتری، ارتباط با مشتری Next Entries منابع پایان نامه درباره درخت تصمیم، مدل‌سازی، ارزیابی کیفی