منابع و ماخذ پایان نامه داده کاوی، میان رشته ای، مدیریت سود، یادگیری ماشین

دانلود پایان نامه ارشد

انتخاب كردند. در هر دو تحقيق رابطهاي منفي بين تخصص صنعتي حسابرس و وجود مديريت مشاهده شد. شاخص دیگر كيفيت حسابرسي كه مكررا استفاده ميشود، اندازه حسابرس است. جردن و همکاران (2010) به اثر کیفیت حسابرسی بر مدیریت سود شرکت‌ها (به منظور بالا بردن سود هر سهم) پرداختند. نتایج نشان داد که مدیریت سود در شرکت‌هایی که توسط 4 موسسه بزرگ حسابرسی مورد رسیدگی بوده‌اند نسبت به شرکت‌هایی که موسساتی غیر از 4 بزرگ آنها را حسابرسی کرده‌اند، به‌طور قابل توجهی کمتر بوده است. لاي و گول (2008) در پژوهشي به اين نتيجه رسيدند كه شركت‌هايي كه تحت حسابرسي موسسات بزرگ، حسابرسي شده‌‌اند اقلام تعهدي كمتري نسبت به بقيه شركت‌ها نشان مي‌دهند.
2-8-3) ویژگی‌های شرکت
وجود برخی خصوصیات، رویه‌ها و نهادها در شرکت‌ها باعث می‌گردد مشکلات ناشی از جدایی مالکیت از مدیریت کاهش یافته و شرکت در مسیر از پیش طراحی شده راهبری گردد. به‌علاوه این خصوصیات، رویه‌ها و نهادها باعث تنظیم روابط شرکت با ذی‌نفعان شده و موجب تامین اهداف پاسخگویی، شفافیت، عدالت (انصاف) و رعایت حقوق ذی‌نفعان می‌گردد. به مجموعه این خصوصیات، رویه‌ها، قوانین و نهادها حاکمیت شرکتی گفته می‌شود. ارکان حاکمیت شرکتی با ساختار هیات مدیره، استقلال هیأت مدیره، وجود کمیته حسابرسی، ساختار مالکیت، ساختار حسابرسی و ساختار سرمایه مرتبط می‌باشند. به‌طور كلی، تحقيقات تجربي يك رابطه مستقيم ميان مكانيزمهاي حاكميتي و اتكاءپذيري به گزارش‌گري مالي را نشان ميدهند (پرگولا و همکاران،2009).
كلين (2002) در مورد ارتباط ويژگيهاي كميته حسابرسي و هيئت مديره با مديريت سود مطالعه‌ای انجام داد. او دريافت كه بين استقلال این دو هيئت و وجود اقلام تعهدي غيرعادي ارتباطي معكوس وجود دارد.
2-9)داده کاوی
2-9-1)تاریخچه داده کاوی
دنیای مدرن در واقع دنیای داده گراست. ما با داده های عددی و غیر عددی در بخش های صنعتی، بازرگانی، مدیریتی، مالی و علمی احاطه شده ایم که می باید این داده ها تحلیل و پردازش شوند تا تبدیل به اطلاعاتی شوند که آگاهی بخش، آموزش دهنده و پاسخگو باشند یا به شکل دیگری به درک و تصمیم گیری ما کمک کنند. در سال های اخیر رشد انفجار آمیزی از روش ها برای اکتشاف دانش جدید از داده های خام به وقوع پیوسته است. در پاسخ به این امر، رشته جدیدی از کاوش داده ها موسوم به داده کاوی به طور ویژه گسترش یافته است تا اطلاعات با ارزشی را از چنین مجموعه داده های عظیم استخراج نماید. داده کاوی از جمله موضوع هایی است که همزمان با ایجاد و استفاده از پایگاه داده ها در اوایل دهه80 برای جستجوی دانش در داده ها شکل گرفت. توسعه سیستم های پایگاهی پیشرفته در دهه 80 باعث توسعه همه جانبه و کاربردی شدن این سیستم ها در سراسر جهان گردید. بدین ترتیب سیستم های مدیریت بانک های اطلاعاتی همچون Oracle ، Sql Server و … ایجاد شدند و حجم زیادی از اطلاعات با استفاده از این سیستم ها مورد پردازش قرار گرفتند. موضوع داده کاوی در اوایل دهه 90 پا به عرصه ظهور گذاشته، از سال 1995 به طور جدی وارد مباحث آمار شده و در سال 1996 اولین شماره مجله کشف دانش از پایگاه داده ها منتشر شد (کانتاردزیک و علیخانزاده، 1385).
2-9-2 ) تعریف داده کاوی
داده کاوی به استخراج و کاوش دانش از حجم زیاد داده اطلاق می شود که در واقع تشبیهی از کاوش طلا از صخره ها و سنگ ها است. کاوش، واژه صریح و روشن است که فرآیند یافتن یک مجموعه کوچک از مواد با ارزش در حجم زیادی از مواد خام را توصیف می کند. به این ترتیب مفهوم “داده کاوی” به عنوان یک مفهوم کلی و عام مشخص می شود. داده کاوی یک حوزه میان رشته ای با رشد سریع است که حوزه های مختلفی همچون پایگاه داده،آمار،یادگیری ماشین و سایر زمینه های مرتبط را با هم تلفیق کرده است تا اطلاعات ودانش ارزشمند نهفته درحجم بزرگی از داده هارا استخراج نمایید.
بطور کلی، داده کاوی یک فعالیت میان رشته ای و ماحصل رویارویی و هم افزایی علوم مختلفی چون آمار، یادگیری ماشینی، هوش مصنوعی، تکنولوژی پایگاه داده و مصور سازی(توصیف و نمایه سازی) می باشد(قیلدرز و همکاران،2000). در عین حال این محصول مشترک وجوه افتراق مشخصی یا پدیدآورندگان خود دارد. برای مثال اگر چه استخراج دانش از داده، ماهیتا موضوع علم آمار بوده است اما توسعه و تجزیه و تحلیل داده ها به وسیله رایانه که برای نخستین بار در دهه 60 معرفی شد. اثر تلویحی نگران کننده ای بر علم آمار گذاشت این نگرانی ناشی از آن بود که الگوهایی که در یک مجموعه داده به لحاظ آماری معنی دار به نظر میرسیدند، هنگامی که این مجموعه به وسیله رایانه به دفعات زیاد تغییر میکرد(حتی در حالتی که این مجموعه ها به تصادف تولید می شدند)، از درجه اعتبار ساقط می شد. واضح است که این معضل فرایند استخراج دانش از داده را با یک چالش اساسی مواجه می نمود بنابراین داده کاری با ایجاد امکان کاوش در مجموعههای عظیم داده، خطای طبیعی نمونهگیری را به صفر رسانده و فرصتی برای رها شدن از این کابوس فراهم آورد. علاوه بر این داده کاوی با پوشش دامنه وسیع تری از فرایند مدل سازی، ابزارهایی را برای خود کارکردن کل فرایند استخراج الگو فراهم میکند، در حالی که تحلیل های آماری هنگامی وارد میدان عمل میشوند که هنر فرضیه سازی قبلا انجام شده باشد(قایاد و همکاران،1996).
2-9-3 ) دلایل استفاده از داده کاوی
در سال های اخیر استفاده از تکنیک های داده کاوی رشد بسیار سریعی داشته است که از دلایل این امر می توان به موارد زیر اشاره کرد:
سهولت تولید داده ها با استفاده از پردازش تحلیل برخط.
افزایش داده های ایجاد شده از طریق ابزارهای الکترونیکی از قبیل تراکنش های خرید، عملیات بانکی، کارت های اعتباری و ماهواره ها.
افزایش داده های ایجاد شده از طریق وب سایت ها.
افزایش حجم ابزارهای ذخیره داده ها شامل انواع حافظه ها.
کاهش هزینه های پردازش اطلاعات.
وجود محیط های رقابتی با توجه به جهانی شدن کسب و کار.
وجود نرم افزارهای مفید داده کاوی.
2-9-4 ) پیش نیاز یک داده کاو موفق
برای انجام یک داده کاوی موثر لازم است قبل از شروع به موارد زیر توجه داشته باشیم:
ضمن آشنایی کامل با موضوع مورد بحث، مسئله داده کاوی به درستی تعریف و تبیین شود.
داده ها موجود باشند.
داده های موجود مرتبط، کافی، مناسب و پاکسازی شده باشند.
مسئله با روش های پرس و جو یا سایر ابزارهای کار با بانک های اطلاعاتی قابل حل نباشد.
نتایج حاصل از داده کاوی قابل اجرا و عملیاتی باشند.
2-9-5) مراحل فرايند کشف دانش از پايگاه داده ها
برای کشف دانش از پايگاه داده ها پنج مرحله داریم که عبارتند از :
انبارش داده ها
انتخاب داده ها
تبديل داده ها
کاوش در داده ها
تفسير نتيجه
همانگونه که مشاهده مي شود داده کاوي يکي از مراحل اين فرايند است که به عنوان بخش چهارم آن نقش مهمي در کشف دانش از داده ها ايفا مي کند.
2-9-5-1) انبارش داده ها
وجود اطلاعات صحيح و منسجم يکي از ملزوماتي است که در داده کاوي به آن نيازمنديم. اشتباه و عدم وجود اطلاعات صحيح باعث نتيجه گيري غلط و در نتيجه اخذ تصميمات ناصحيح در سازمانها مي گردد و منتج به نتايج خطرناکي خواهد گرديد که نمونه هاي آن کم نيستند. اکثر سازمانها دچار يک خلا اطلاعاتي هستند. در اينگونه سازمانها معمولا سيستم هاي اطلاعاتي در طول زمان و با معماري و مديريت هاي گوناگون ساخته شده اند، به طوري که سازمان اطلاعاتي يکپارچه و مشخصي مشاهده نمي گردد. علاوه بر اين براي فرايند داده کاوي به اطلاعات خلاصه و مهم در زمينه تصميم گيريهاي حياتي نيازمنديم. هدف از فرايند انبارش داده ها فراهم کردن يک محيط يکپارچه جهت پردازش اطلاعات است. در اين فرايند، اطلاعات تحليلي و موجز در دوره هاي مناسب زماني سازماندهي و ذخيره مي شود تا بتوان از آنها در فرايند هاي تصميم گيري که از ملزومات آن داده کاوي است، استفاده شود. به طور کلي تعريف زير براي انبار داده ها ارائه مي گردد :
انبار داده ها، مجموعه اي است موضوعي، مجتمع، متغير در زمان و پايدار از داده ها که به منظور پشتيباني از فرايند مديريت تصميم گيري مورد استفاده قرار مي گيرد.
2-9-5-2) انتخاب داده ها
انبار داده ها شامل انواع مختلف و گوناگوني از داده ها است که همه آنها در داده کاوي مورد نياز نيستند. براي فرايند داده کاوي بايد داده ها ي مورد نياز انتخاب شوند. به عنوان مثال در يک پايگاه داده هاي مربوط به سيستم فروشگاهي، اطلاعاتي در مورد خريد مشتريان، خصوصيات آماري آنها، تامين کنندگان، خريد، حسابداري و … وجود دارند. براي تعيين نحوه چيدن قفسه ها تنها به داده ها يي در مورد خريد مشتريان و خصوصيات آماري آنها نياز است. حتي در مواردي نياز به کاوش در تمام محتويات پايگاه نيست بلکه ممکن است به منظور کاهش هزينه عمليات، نمونه هايي از عناصر انتخاب و کاوش شوند.
2-9-5-3)تبديل داده ها
هنگامي که داده هاي مورد نياز انتخاب شدند و داده ها ي مورد کاوش مشخص گرديدند، معمولا به تبديلات خاصي روي داده ها نياز است. نوع تبديل به عمليات و تکنيک داده کاوي مورد استفاده بستگي دارد، تبديلاتي ساده همچون تبديل نوع داده اي به نوع ديگر تا تبديلات پيچيده تر همچون تعريف صفات جديد با انجام عملياتهاي رياضي و منطقي روي صفات موجود.
2-9-5-4) کاوش در داده ها
داده هاي تبديل شده با استفاده از تکنيکها و عملياتهاي داده کاوي مورد کاوش قرار مي گيرند تا الگوهاي مورد نظر کشف شوند.
2-9-5-5) تفسير نتيجه
اطلاعات استخراج شده با توجه به هدف کاربر تجزيه و تحليل و بهترين نتايج معين مي گردند. هدف از اين مرحله تنها ارائه نتيجه (بصورت منطقي و يا نموداري) نيست، بلکه پالايش اطلاعات ارايه شده به کاربر نيز از اهداف مهم اين مرحله است.
2-9-6) الگوریتمهای داده کاوی
فرایند داده کاوی برای ساخت مدلهایی که بتواند دانش ارزشمند برای کسب و کار را از میان انبوه دادهها استخراج کند، از الگوریتمهای زیادی بهره میگیرد. دسته بندی مشهوری از این الگوریتمها ارائه شده است که نشان دهندهی ریشههای علمی داده کاوی نیز میباشند. در این دسته بندی الگوریتمهای مورد نیاز داده کاوی از سه منبع عمده تامین میشوند. برخی از معروفترین این الگوریتمها به همراه شاخه مولد آن در نگاره شماره 2-1 آمده است.

نگاره شماره 2-1: الگوریتمهای مشهور داده کاوی و خواستگاه آنان
2-9-7) روشهای داده کاوی
روشهای اصلی داده کاوی به دو دسته توصیفی و پیش بینانه تقسیم می شوند:
روش های توصیفی خواص عمومی دادهها را مشخص میکنند و هدف از توصیف، یافتن الگوهایی در مورد داده است که برای انسان قابل تفسیر باشد.
روش های پیشبینانه به منظور پیشبینی رفتارهای آینده آنها استفاده میشود. عملکردهای داده کاوی در نگاره شماره 2-2 نشان داده شده اند.

نگاره شماره 2-2: عملکردهای داده کاوی
طبقهبندی(دستهبندی): یکی از رایج ترین کارکردهای دادهکاوی، طبقه بندی میباشد. هدف آن ساخت مدلهایی برای پیش بینی رفتارهای آتی پدیده مورد مطالعه، از طریق نگاشت رکوردهای پایگاه داده به تعدادی کلاسهای از پیش تعریف شده بر اساس معیارهای معین میباشد. به عبارت دیگر، طبقه بندی، فرآیند یافتن مدلی است که با تشخیص دستهها یا مفاهیم داده میتواند دسته ناشناخته اشیاء دیگر را پیشبینی کند. برخی از روشهای متداول دسته بندی عبارتند از:
درخت تصمیم: شامل دو نمونه از الگوریتمهای درخت تصمیم CARTوC4,5 است.
دسته بندی بیزی: دارای دو نوع بیز ساده و شبکههای بیزی است.
شبکههای عصبی پس انتشار
ماشینهای بردار پشتیبان
دستهبندی تلازمی
یادگیرندگان کامل: نزدیکترین همسایگان، استدلال مبتنی بر مورد
روشهای دیگر: ژنتیک، مجموعههای نادقیق، مجموعههای فازی
پیش بینی: در حالی که دسته بندی، برچسبهای طبقهای (گسسته و بدون ترتیب) را پیش بینی میکنند. روشهای پیشبینی، توابع مقدار پیوسته را مدل میکنند و این کارکرد به برآورد

پایان نامه
Previous Entries منابع و ماخذ پایان نامه مدیریت سود، هموارسازی سود، قلام تعهدی، اقلام تعهدی Next Entries منابع و ماخذ پایان نامه مدیریت سود، اقلام تعهدی، قلام تعهدی، ماشین بردار پشتیبان