منبع تحقیق با موضوع درخت تصمیم، تجارت الکترونیک، تجارت الکترونیکی، مدیریت دانش

دانلود پایان نامه ارشد

ه مقایسه دقت رده‌بندی در برابر مدل عبارات ساده می‌پردازد. گوشه‌ای از طبقه‌بندی داده‌های متنی از پایگاه داده متنی با استفاده از درخت تصمیم‌گیری (C4.5 or J48) بر اساس بازنمایی و بر پایه عبارات ساده تشکیل شده است. نمودار درختی تشکیل شده در نرم‌افزار RapidMiner نشان می‌دهد که هر گره به زیر گره‌ها یا برگ تقسیم شده است که مستندات اطلاعات به گروه خوب و بد رده‌بندی می‌شوند. هر گره‌ای که Information Gain آن حداکثر (Maximum) بوده است به زیر نودهایی تقسیم شده است. هر گره برگ نشان‌دهنده رده‌بندی نهایی اطلاعات به اسناد حاوی اطلاعات خوب یا بد در مورد یک پروژه در پایگاه داده متنی است. رده‌بندی داده‌ها بر اساس ارائه سیستم MKTPKS 3-termsets صورت می‌پذیرد. فضای اطلاعات به دو کلاس از مستندات اطلاعاتی شامل خوب و بد که با انتخاب گره‌ها و زیر گره‌های اطلاعاتی رده‌بندی می‌شوند تقسیم می‌گردد. برگ شاخه نشان‌دهنده تعداد از مستندات رده‌بندی‌شده به عنوان خوب و بد است. بنابراین فرایند تشکیل درخت تصمیم‌گیری تا زمانی که فضای سند از اطلاعات به طور کامل به دو دسته مختلف رده‌بندی گردد ادامه می‌یابد. سناریوی تحقیق جاری با در نظر گرفتن عبارات زیر تعریف شده است. ‘‘مطلوب محقق تعداد بسیار کم دستورالعمل و تغییرات است’’ که می‌تواند به کارکنان جهت اجرای هموار (نرم) پروژه کمک نموده و آن را در زمان مقرر به پایان رساند. زمان اتمام پروژه یا زمان ارائه خدمات می‌تواند یک شاخص عملکرد کلیدی خوب باشد که اگر پروژه یا خدمت در آن (زمان مقرر) به اتمام برسد موجب رضایتمندی محقق می‌گردد. از این جهت اگر تصمیم‌گیرندگان می‌توانند به‌آسانی رده‌بندی داده‌های متنی را بر اساس مستندات حاوی اطلاعات خوب یا بد انجام دهند دلیل آن خواهد بود که تجزیه و تحلیل‌های دقیق‌تر و بهتری گرفته شود. این عمل در نهایت به بهبود نتایج حاصل از تحقیق‌های کیفی با توجه به تجربه‌های به دست آمده در گزارش‌های قبل، کمک می‌نماید. یکی از اهداف این پژوهش رده‌بندی با دقت داده‌های متنی است. (کاهش نرخ غیر رده‌بندی) برای رسیدن به این هدف و مدیریت بهتر منابع دانش، مدل‌های ماتریس‌های مختلف با ساختار داده‌ایی متنی در نظر گرفته شده‌اند. دقت رده‌بندی با استفاده از اطلاعات رده‌بندی مستندات حاوی اطلاعات خوب و بد محاسبه می‌گردد. ارزیابی نهایی از روش ارائه شده بر اساس متوسط F-Measure است که به عنوان میانگین هارمونیک بازخوانی و دقت156 تعریف شده ساخته شده است. دلیل انتخاب F-Measure این است که هر دو مفهوم دقت و بازخوانی در آن در نظر گرفته شده است.157 ارزیابی سیستم با 10 برابر کردن روش اعتبارسنجی شده در Weka و RapidMiner مورد بررسی قرار گرفت. تنظیم برای هر الگوریتم برای رسیدن به یک سطح معین متفاوت بوده و این عمل باید به صورتی انجام پذیرد که دقت به بهترین شکل ممکن رعایت گردد. با رده‌بندی بیز ساده، بهترین دقت رده‌بندی با حفظ تنظیمات بدون تغییر به دست می‌آید. از نظر رده‌بندی‌های دیگر باید تنظیمات پارامترهای بهینه انتخاب شوند. در مورد الگوریتم درخت تصمیم‌گیری (C4.5 or J48) نسبت هسته‌های مختلف مورد استفاده قرار می‌گیرد تا بهترین نتایج با استفاده از نسبت هسته از 10 به دست آید. به طور مشابه برای K-NN تنظیمات بهینه با K=10 در نظر گرفته شد و یک هسته خطی بهترین نتایج را براساس مدل رده‌بندی مبتنی بر SVMs در اختیار ما قرار می‌دهد. (شیخ‌بهایی، م، مینایی بیدگلی، ب، سلامی، م. 1393) جدول 1 مقایسه عملکرد رده‌بندی‌های مختلف را نمایش می‌دهد.

جدول (3-2) مقایسه عملکرد طبقه‌بندی‌های مختلف
Proposed MKTPKS based classification model (F-measure)
Term based classification model
(F-measure)
Classification model
0.431
0.479
Decision trees
(J48 or C4.5)
0.492
0.332
K-NN (k=10)
0.581
0.368
NAÏVE Bayes
0.471
0.378
SVMs
(Linear Kernel)

جدول 1 دقت مدل رده‌بندی مبتنی بر عبارات ساده را و رده‌بندی مبتنی بر MKTPKS 3-Termsets را نمایش می‌دهد. دقت رده‌بندی براساس مدل‌های K-NN، Naïve Bayes و SVM (هسته‌ای خطی) بهتر از مدل مبتنی بر عبارات ساده است.

شکل (3-6) مقایسه دقت طبقه‌بندی با استفاده از معیار F
شکل 3-6 نشان می‌دهد که دقت رده‌بندی درخت تصمیم‌گیری (C4.5) با استفاده از مدل ارائه شده مبتنی بر MKTPKS 3-Termsets از مدل رده‌بندی مبتنی بر عبارات ساده کمتر است. با این حال دقت رده‌بندی‌های دیگر (نزدیک‌ترین همسایه، بیز ساده و ماشین پشتیبان بردار) با استفاده از متدولوژی ارائه شده نسبت به مدل رده‌بندی مبتنی بر عبارات ساده بهبود یافته است. از این رو می‌توان نتیجه گرفت اگر روش پیشنهادی را در رده‌بندی داده‌ها استفاده نماییم دقت رده‌بندی بهتری برای رده‌بندی داده‌ها به دو کلاس مختلف که شامل مستندات حاوی اطلاعات خوب و بد هستند به دست می‌آید. بهترین دانش کاری و کاربردی که در این مقاله ارائه شده است روش‌های رده‌بندی به وسیله یک روش ترکیبی است که با استفاده از MKTPKS 3-Termsets برای تکنیک‌های داده‌کاوی متنی مورد استفاده قرار می‌گیرند. پژوهش ارائه شده در این مقاله بر اساس رده‌بندی داده‌های متنی به دو کلاس مختلف جهت تعریف اسناد اطلاعات به دو گروه خوب و بد است. ادغام و یکپارچه‌سازی تکنیک‌های رده‌بندی داده‌های متنی باعث بهبود رده‌بندی توسط الگوریتم‌ها و تکنیک‌های رده‌بندی می‌گردد. در اغلب موارد رویکرد ارائه شده بهبود قابل‌توجهی را برای دقت رده‌بندی با استفاده از ارزیابی F-Measure از خود نشان داده است. با این حال با توجه به رده‌بندی مستندات به کلاس‌های مربوطه با استفاده از درخت تصمیم (الگوریتم C4.5 یا J48) دقت رده‌بندی را کاهش می‌دهد. دلیل کاهش دقت وابستگی شدید الگوریتم C4.5 به بسامد شرایط است. همچنین ماهیت داده‌های طبیعی ممکن است بر دقت و صحت طبقه‌بندی تأثیر بگذارد. نکات ذیل را از متدولوژی ارائه شده در این مقاله می‌توان به دست آورد: اول این که متد نمایش مبتنی بر شرایط واحد یکی از راه‌های مفید و کاربردی برای کشف دانش است اما این متدها بر دقت رده‌بندی داده‌های متنی تأثیر می‌گذارند. دوم آن است که کاربردهای ترکیبی تکنیک‌های داده‌کاوی متنی نتایج بهتری را در سناریو تحقیق جاری به ما ارائه می‌نماید و هم چنین هرس اطلاعات و پالایش دانش ممکن است با استفاده از قوانین انجمنی APRIORI از تکنیک‌های داده‌کاوی انجام پذیرد. سومین نکته که از مقاله جاری استنتاج می‌گردد ساخت MKTPKS 3-TermSets و استفاده از آن جهت بهبود دقت رده‌بندی و نکته آخر آن‌که در برخی زمینه‌های کسب‌وکار اگر نرخ خطا کاهش یابد، تصمیم‌گیری‌های بهتری امکان‌پذیر می‌گردد.158
3-8- قلمرو تحقیق
محقق در پژوهش جاری به دنبال ارائه مدلی مفهومی در حوزه مدیریت دانش زنجیره تأمین خدمات در تجارت الکترونیکی G2C می‌باشد بر همین اساس قلمرو موضوعی تحقیق به بخش‌های ذیل تقسیم‌بندی می‌شود:
مدیریت دانش
مدیریت زنجیره تأمین
مدیریت زنجیره خدمات
تجارت الکترونیکی G2C
3-9- بستر تحقیق
در پژوهش جاری سازمان ثبت‌احوال کشور به‌عنوان یکی از ارکان تحقق دولت الکترونیکی و هم‌چنین یکی از اصلی‌ترین سازمان‌های ارائه‌دهنده خدمات تجارت الکترونیکی G2C به‌عنوان موردمطالعه انتخاب گردیده است. جامعه‌ي آماری این پژوهش با توجه به قلمرو موضوعی آن شامل مدیران، معاونان و کارشناسان و خبرگان سازمان ثبت‌احوال استان اصفهان هستند که به روش ارجاع زنجیره‌ای انتخاب شده‌اند. روش نمونه‌گیری، گلوله برفی (ارجاع زنجیره‌ای) است. نمونه‌گیری گلوله برفی یک روش نمونه‌گیری است که واحدهای نمونه نه تنها اطلاعاتی در مورد خودشان بلکه در مورد واحدهای دیگر جامعه نیز ارائه می‌کنند [65][66]. در این روش، در یک مصاحبه ابتدایی اغلب با یک خبررسان کلیدی کار را آغاز کرده و سپس از آن شخص می‌خواهیم که دوستان، آشنایان و یا افرادی که ممکن است برای مصاحبه مناسب باشند را به ما معرفی کند.
3-9-1- معرفی سازمان ثبت‌احوال کشور
سازمان ثبت‌احوال کشور با پشتوانه نزدیک به یک قرن سابقه اداری جزء اولین نهادهایی محسوب می‌گردد که بنا به‌ضرورت تشکیل دولت مدرن و نوسازی جامعه در سال 1297 هجری شمسی در ایران تأسیس شد و در اولین سال‌های تأسیس وظیفه ثبت وقایع چهارگانه (ولادت، ازدواج، طلاق و وفات) و شناسنامه‌دار کردن اتباع ایرانی داخل و خارج از کشور را به عهده گرفت. در سال 1319 وظیفه جمع‌آوری و انتشار آمارهای انسانی به مجموعه وظایف آن افزوده شد و رفته‌رفته بر اثر دگرگونی‌های اجتماعی و ظهور تکنولوژیکی اطلاعات در سال 1376 با تصویب قانون الزام اختصاص شماره ملی و کد پستی ایفاگر نقش تأمین زیرساخت اطلاعاتی دولت الکترونیکی گردید. در این راستا سازمان ثبت‌احوال کشور با درک ضرورت نوسازی ساختار و فرایند اداری اقدام به تأسیس پایگاه اطلاعات جمعیت کشور نمود که به دلیل ویژگی‌های خاص علاوه بر آنکه امکان تحول درون‌سازمانی را فراهم آورده، موجب نوسازی ساختار اداری کشور نیز شده است. (روزرخ، مرجان. 1388) برخی از قابلیت‌های این پایگاه شامل موارد زیر است:
ارائه خدمات الکترونیکی هویتی با فراهم کردن اتصال بر خط با شناسنامه خاص به دولت و دستگاه‌های اجرائی
دسترسی سریع و مطمئن دستگاه‌ها به آمار و اطلاعات انسانی
افزایش ضریب امنیت اطلاعات انسانی و حفاظت از حریم خصوصی شهروندان
پاسخگویی بهتر و سریع‌تر دستگاه‌های دولتی نسبت به مطالعات اجتماعی و توزیع بهینه منابع و امکانات کشور
جلوگیری از دوباره‌کاری‌ها و اشتباهات اداری که در سیستم بوروکراتیک معمول مشاهده می‌گردد.
3-9-1-1- فعالیت‌های اصلی سازمان در حوزه تجارت الکترونیکی G2C
مهم‌ترین وظیفه مدیریت به‌ویژه در سطح استراتژیک، تصمیم‌گیری و کنترل بر مبنای اطلاعات است. سازمان ثبت‌احوال به‌عنوان سیستم اطلاعات مدیریت، اطلاعات لازم و در مواقعی کافی را جهت انجام وظایف مدیریت کشور فراهم می‌آورد. ثبت وقایع حیاتی (ولادت و وفات) که مهم‌ترین منبع آماری و جمعیتی کشوری است و برای محققین و سیاست‌گذاران اجتماعی و اقتصادی و برنامه ریزان کلان اهمیتی خاص دارد بلکه نیل به اهداف و آمارهای ملی و بین‌المللی بدون دسترسی جامع به اطلاعات آن میسر نمی‌گردد. در این برهه از زمان نیز جهت‌گیری اغلب کشورها در زمینه آمارهای انسانی به سمت آمارهای ثبتی است و علی رقم صرف هزینه‌های زیاد در انجام سرشماری‌های عمومی، نتایج آن اعتبار و استحکام آمارهای ثبتی را ندارد همچنین نتایج حاصله از سرشماری‌ها دارای عمرمحدود بوده و پس از مدت کوتاهی متولیان امر وادار به برآورد مجدد بر اساس حدس و گمان و محاسباتی می‌کند که چندان معتبر نیست. در نظام ثبت‌احوال به خاطر دقت آماری، به روز بودن داده‌ها و نیز تداوم سازمان در محدوده جغرافیایی سراسر کشور می‌توان از داده‌های این نهاد در راستای بررسی روندهای کوتاه‌مدت و بلندمدت استفاده نمود. بنابراین پایگاه اطلاعات جمعیت کشور که اکنون ثبت وقایع حیاتی از سراسر کشور به صورت برخط در آن انجام می‌پذیرد. قوی‌ترین مرجع برای دسترسی به آمار و اطلاعات صحیح ایرانیان می‌باشد. ثبت احوال نوین حاصل تغییرات اساسی و مناسبی در ارکان اصلی مدیریت دانش یعنی انسان، فرایند و فناوری می‌باشد. از آغاز این تحول تاکنون گام‌های مناسبی در جهت ایجاد سازمان‌های دانش‌محور شده است. فرهنگ، ساختار، معماری فناوری اطلاعات سازمانی همه در جهت شناسایی، تولید، تسهیم و توزیع و انتقال دانش تغییریافته و بیشتر فعالیت‌ها و پروژه‌ها با رویکرد دانشی انجام پذیرفته است. (روزرخ، مرجان. 1388) تنها عناوین برخی از آن‌ها در ذیل آورده شده است:
استخدام نیروی جوان و متعهد و متخصص
ایجاد مرکز آموزش در سراسر کشور
برگزاری دوره‌های آموزشی بلندمدت و کوتاه‌مدت
شناسایی استعدادها و توانائی‌های کارکنان
استفاده از نیروی داخلی پروژه‌ها با استفاده از آموزش و انتقال تجربیات
برگزاری همایش‌های غیررسمی تفریحی و مسابقات ورزشی
تغییر در ساختار سازمانی

پایان نامه
Previous Entries منبع تحقیق با موضوع گراندد تئوری، خوشه‌بندی، تحلیل داده، تحلیل متن Next Entries منبع تحقیق با موضوع دولت الکترونیک، مدیریت دانش، گراندد تئوری، فناوری اطلاعات