
ه مقایسه دقت ردهبندی در برابر مدل عبارات ساده میپردازد. گوشهای از طبقهبندی دادههای متنی از پایگاه داده متنی با استفاده از درخت تصمیمگیری (C4.5 or J48) بر اساس بازنمایی و بر پایه عبارات ساده تشکیل شده است. نمودار درختی تشکیل شده در نرمافزار RapidMiner نشان میدهد که هر گره به زیر گرهها یا برگ تقسیم شده است که مستندات اطلاعات به گروه خوب و بد ردهبندی میشوند. هر گرهای که Information Gain آن حداکثر (Maximum) بوده است به زیر نودهایی تقسیم شده است. هر گره برگ نشاندهنده ردهبندی نهایی اطلاعات به اسناد حاوی اطلاعات خوب یا بد در مورد یک پروژه در پایگاه داده متنی است. ردهبندی دادهها بر اساس ارائه سیستم MKTPKS 3-termsets صورت میپذیرد. فضای اطلاعات به دو کلاس از مستندات اطلاعاتی شامل خوب و بد که با انتخاب گرهها و زیر گرههای اطلاعاتی ردهبندی میشوند تقسیم میگردد. برگ شاخه نشاندهنده تعداد از مستندات ردهبندیشده به عنوان خوب و بد است. بنابراین فرایند تشکیل درخت تصمیمگیری تا زمانی که فضای سند از اطلاعات به طور کامل به دو دسته مختلف ردهبندی گردد ادامه مییابد. سناریوی تحقیق جاری با در نظر گرفتن عبارات زیر تعریف شده است. ‘‘مطلوب محقق تعداد بسیار کم دستورالعمل و تغییرات است’’ که میتواند به کارکنان جهت اجرای هموار (نرم) پروژه کمک نموده و آن را در زمان مقرر به پایان رساند. زمان اتمام پروژه یا زمان ارائه خدمات میتواند یک شاخص عملکرد کلیدی خوب باشد که اگر پروژه یا خدمت در آن (زمان مقرر) به اتمام برسد موجب رضایتمندی محقق میگردد. از این جهت اگر تصمیمگیرندگان میتوانند بهآسانی ردهبندی دادههای متنی را بر اساس مستندات حاوی اطلاعات خوب یا بد انجام دهند دلیل آن خواهد بود که تجزیه و تحلیلهای دقیقتر و بهتری گرفته شود. این عمل در نهایت به بهبود نتایج حاصل از تحقیقهای کیفی با توجه به تجربههای به دست آمده در گزارشهای قبل، کمک مینماید. یکی از اهداف این پژوهش ردهبندی با دقت دادههای متنی است. (کاهش نرخ غیر ردهبندی) برای رسیدن به این هدف و مدیریت بهتر منابع دانش، مدلهای ماتریسهای مختلف با ساختار دادهایی متنی در نظر گرفته شدهاند. دقت ردهبندی با استفاده از اطلاعات ردهبندی مستندات حاوی اطلاعات خوب و بد محاسبه میگردد. ارزیابی نهایی از روش ارائه شده بر اساس متوسط F-Measure است که به عنوان میانگین هارمونیک بازخوانی و دقت156 تعریف شده ساخته شده است. دلیل انتخاب F-Measure این است که هر دو مفهوم دقت و بازخوانی در آن در نظر گرفته شده است.157 ارزیابی سیستم با 10 برابر کردن روش اعتبارسنجی شده در Weka و RapidMiner مورد بررسی قرار گرفت. تنظیم برای هر الگوریتم برای رسیدن به یک سطح معین متفاوت بوده و این عمل باید به صورتی انجام پذیرد که دقت به بهترین شکل ممکن رعایت گردد. با ردهبندی بیز ساده، بهترین دقت ردهبندی با حفظ تنظیمات بدون تغییر به دست میآید. از نظر ردهبندیهای دیگر باید تنظیمات پارامترهای بهینه انتخاب شوند. در مورد الگوریتم درخت تصمیمگیری (C4.5 or J48) نسبت هستههای مختلف مورد استفاده قرار میگیرد تا بهترین نتایج با استفاده از نسبت هسته از 10 به دست آید. به طور مشابه برای K-NN تنظیمات بهینه با K=10 در نظر گرفته شد و یک هسته خطی بهترین نتایج را براساس مدل ردهبندی مبتنی بر SVMs در اختیار ما قرار میدهد. (شیخبهایی، م، مینایی بیدگلی، ب، سلامی، م. 1393) جدول 1 مقایسه عملکرد ردهبندیهای مختلف را نمایش میدهد.
جدول (3-2) مقایسه عملکرد طبقهبندیهای مختلف
Proposed MKTPKS based classification model (F-measure)
Term based classification model
(F-measure)
Classification model
0.431
0.479
Decision trees
(J48 or C4.5)
0.492
0.332
K-NN (k=10)
0.581
0.368
NAÏVE Bayes
0.471
0.378
SVMs
(Linear Kernel)
جدول 1 دقت مدل ردهبندی مبتنی بر عبارات ساده را و ردهبندی مبتنی بر MKTPKS 3-Termsets را نمایش میدهد. دقت ردهبندی براساس مدلهای K-NN، Naïve Bayes و SVM (هستهای خطی) بهتر از مدل مبتنی بر عبارات ساده است.
شکل (3-6) مقایسه دقت طبقهبندی با استفاده از معیار F
شکل 3-6 نشان میدهد که دقت ردهبندی درخت تصمیمگیری (C4.5) با استفاده از مدل ارائه شده مبتنی بر MKTPKS 3-Termsets از مدل ردهبندی مبتنی بر عبارات ساده کمتر است. با این حال دقت ردهبندیهای دیگر (نزدیکترین همسایه، بیز ساده و ماشین پشتیبان بردار) با استفاده از متدولوژی ارائه شده نسبت به مدل ردهبندی مبتنی بر عبارات ساده بهبود یافته است. از این رو میتوان نتیجه گرفت اگر روش پیشنهادی را در ردهبندی دادهها استفاده نماییم دقت ردهبندی بهتری برای ردهبندی دادهها به دو کلاس مختلف که شامل مستندات حاوی اطلاعات خوب و بد هستند به دست میآید. بهترین دانش کاری و کاربردی که در این مقاله ارائه شده است روشهای ردهبندی به وسیله یک روش ترکیبی است که با استفاده از MKTPKS 3-Termsets برای تکنیکهای دادهکاوی متنی مورد استفاده قرار میگیرند. پژوهش ارائه شده در این مقاله بر اساس ردهبندی دادههای متنی به دو کلاس مختلف جهت تعریف اسناد اطلاعات به دو گروه خوب و بد است. ادغام و یکپارچهسازی تکنیکهای ردهبندی دادههای متنی باعث بهبود ردهبندی توسط الگوریتمها و تکنیکهای ردهبندی میگردد. در اغلب موارد رویکرد ارائه شده بهبود قابلتوجهی را برای دقت ردهبندی با استفاده از ارزیابی F-Measure از خود نشان داده است. با این حال با توجه به ردهبندی مستندات به کلاسهای مربوطه با استفاده از درخت تصمیم (الگوریتم C4.5 یا J48) دقت ردهبندی را کاهش میدهد. دلیل کاهش دقت وابستگی شدید الگوریتم C4.5 به بسامد شرایط است. همچنین ماهیت دادههای طبیعی ممکن است بر دقت و صحت طبقهبندی تأثیر بگذارد. نکات ذیل را از متدولوژی ارائه شده در این مقاله میتوان به دست آورد: اول این که متد نمایش مبتنی بر شرایط واحد یکی از راههای مفید و کاربردی برای کشف دانش است اما این متدها بر دقت ردهبندی دادههای متنی تأثیر میگذارند. دوم آن است که کاربردهای ترکیبی تکنیکهای دادهکاوی متنی نتایج بهتری را در سناریو تحقیق جاری به ما ارائه مینماید و هم چنین هرس اطلاعات و پالایش دانش ممکن است با استفاده از قوانین انجمنی APRIORI از تکنیکهای دادهکاوی انجام پذیرد. سومین نکته که از مقاله جاری استنتاج میگردد ساخت MKTPKS 3-TermSets و استفاده از آن جهت بهبود دقت ردهبندی و نکته آخر آنکه در برخی زمینههای کسبوکار اگر نرخ خطا کاهش یابد، تصمیمگیریهای بهتری امکانپذیر میگردد.158
3-8- قلمرو تحقیق
محقق در پژوهش جاری به دنبال ارائه مدلی مفهومی در حوزه مدیریت دانش زنجیره تأمین خدمات در تجارت الکترونیکی G2C میباشد بر همین اساس قلمرو موضوعی تحقیق به بخشهای ذیل تقسیمبندی میشود:
مدیریت دانش
مدیریت زنجیره تأمین
مدیریت زنجیره خدمات
تجارت الکترونیکی G2C
3-9- بستر تحقیق
در پژوهش جاری سازمان ثبتاحوال کشور بهعنوان یکی از ارکان تحقق دولت الکترونیکی و همچنین یکی از اصلیترین سازمانهای ارائهدهنده خدمات تجارت الکترونیکی G2C بهعنوان موردمطالعه انتخاب گردیده است. جامعهي آماری این پژوهش با توجه به قلمرو موضوعی آن شامل مدیران، معاونان و کارشناسان و خبرگان سازمان ثبتاحوال استان اصفهان هستند که به روش ارجاع زنجیرهای انتخاب شدهاند. روش نمونهگیری، گلوله برفی (ارجاع زنجیرهای) است. نمونهگیری گلوله برفی یک روش نمونهگیری است که واحدهای نمونه نه تنها اطلاعاتی در مورد خودشان بلکه در مورد واحدهای دیگر جامعه نیز ارائه میکنند [65][66]. در این روش، در یک مصاحبه ابتدایی اغلب با یک خبررسان کلیدی کار را آغاز کرده و سپس از آن شخص میخواهیم که دوستان، آشنایان و یا افرادی که ممکن است برای مصاحبه مناسب باشند را به ما معرفی کند.
3-9-1- معرفی سازمان ثبتاحوال کشور
سازمان ثبتاحوال کشور با پشتوانه نزدیک به یک قرن سابقه اداری جزء اولین نهادهایی محسوب میگردد که بنا بهضرورت تشکیل دولت مدرن و نوسازی جامعه در سال 1297 هجری شمسی در ایران تأسیس شد و در اولین سالهای تأسیس وظیفه ثبت وقایع چهارگانه (ولادت، ازدواج، طلاق و وفات) و شناسنامهدار کردن اتباع ایرانی داخل و خارج از کشور را به عهده گرفت. در سال 1319 وظیفه جمعآوری و انتشار آمارهای انسانی به مجموعه وظایف آن افزوده شد و رفتهرفته بر اثر دگرگونیهای اجتماعی و ظهور تکنولوژیکی اطلاعات در سال 1376 با تصویب قانون الزام اختصاص شماره ملی و کد پستی ایفاگر نقش تأمین زیرساخت اطلاعاتی دولت الکترونیکی گردید. در این راستا سازمان ثبتاحوال کشور با درک ضرورت نوسازی ساختار و فرایند اداری اقدام به تأسیس پایگاه اطلاعات جمعیت کشور نمود که به دلیل ویژگیهای خاص علاوه بر آنکه امکان تحول درونسازمانی را فراهم آورده، موجب نوسازی ساختار اداری کشور نیز شده است. (روزرخ، مرجان. 1388) برخی از قابلیتهای این پایگاه شامل موارد زیر است:
ارائه خدمات الکترونیکی هویتی با فراهم کردن اتصال بر خط با شناسنامه خاص به دولت و دستگاههای اجرائی
دسترسی سریع و مطمئن دستگاهها به آمار و اطلاعات انسانی
افزایش ضریب امنیت اطلاعات انسانی و حفاظت از حریم خصوصی شهروندان
پاسخگویی بهتر و سریعتر دستگاههای دولتی نسبت به مطالعات اجتماعی و توزیع بهینه منابع و امکانات کشور
جلوگیری از دوبارهکاریها و اشتباهات اداری که در سیستم بوروکراتیک معمول مشاهده میگردد.
3-9-1-1- فعالیتهای اصلی سازمان در حوزه تجارت الکترونیکی G2C
مهمترین وظیفه مدیریت بهویژه در سطح استراتژیک، تصمیمگیری و کنترل بر مبنای اطلاعات است. سازمان ثبتاحوال بهعنوان سیستم اطلاعات مدیریت، اطلاعات لازم و در مواقعی کافی را جهت انجام وظایف مدیریت کشور فراهم میآورد. ثبت وقایع حیاتی (ولادت و وفات) که مهمترین منبع آماری و جمعیتی کشوری است و برای محققین و سیاستگذاران اجتماعی و اقتصادی و برنامه ریزان کلان اهمیتی خاص دارد بلکه نیل به اهداف و آمارهای ملی و بینالمللی بدون دسترسی جامع به اطلاعات آن میسر نمیگردد. در این برهه از زمان نیز جهتگیری اغلب کشورها در زمینه آمارهای انسانی به سمت آمارهای ثبتی است و علی رقم صرف هزینههای زیاد در انجام سرشماریهای عمومی، نتایج آن اعتبار و استحکام آمارهای ثبتی را ندارد همچنین نتایج حاصله از سرشماریها دارای عمرمحدود بوده و پس از مدت کوتاهی متولیان امر وادار به برآورد مجدد بر اساس حدس و گمان و محاسباتی میکند که چندان معتبر نیست. در نظام ثبتاحوال به خاطر دقت آماری، به روز بودن دادهها و نیز تداوم سازمان در محدوده جغرافیایی سراسر کشور میتوان از دادههای این نهاد در راستای بررسی روندهای کوتاهمدت و بلندمدت استفاده نمود. بنابراین پایگاه اطلاعات جمعیت کشور که اکنون ثبت وقایع حیاتی از سراسر کشور به صورت برخط در آن انجام میپذیرد. قویترین مرجع برای دسترسی به آمار و اطلاعات صحیح ایرانیان میباشد. ثبت احوال نوین حاصل تغییرات اساسی و مناسبی در ارکان اصلی مدیریت دانش یعنی انسان، فرایند و فناوری میباشد. از آغاز این تحول تاکنون گامهای مناسبی در جهت ایجاد سازمانهای دانشمحور شده است. فرهنگ، ساختار، معماری فناوری اطلاعات سازمانی همه در جهت شناسایی، تولید، تسهیم و توزیع و انتقال دانش تغییریافته و بیشتر فعالیتها و پروژهها با رویکرد دانشی انجام پذیرفته است. (روزرخ، مرجان. 1388) تنها عناوین برخی از آنها در ذیل آورده شده است:
استخدام نیروی جوان و متعهد و متخصص
ایجاد مرکز آموزش در سراسر کشور
برگزاری دورههای آموزشی بلندمدت و کوتاهمدت
شناسایی استعدادها و توانائیهای کارکنان
استفاده از نیروی داخلی پروژهها با استفاده از آموزش و انتقال تجربیات
برگزاری همایشهای غیررسمی تفریحی و مسابقات ورزشی
تغییر در ساختار سازمانی
