
روشهای کیفی نیز تفاوت دارد (استرن، 1980، ترجمه: صلصالی 1382)145 این روش را به واسطه پنج تفاوت از سایر روشهای کیفی متمایز میداند:
در گراندد تئوری چارچوب مفهومی از مطالعات پیشین ناشی نمیشود بلکه از اطلاعات فعلی حاصل میشود.
محقق به جای توصیف واحد تحت بررسی، به کشف فرایندهای اصلی عرصه اجتماعی میپردازد
محقق هر داده را با تمام دادههای دیگر مقایسه میکند.
ممکن است محقق بسته به پیشرفت مراحل تکوین نظریه، روشهای جمعآوری داده را تغییر دهد. بنابراین اطلاعات کاذب کنار رفته و در صورت لزوم سؤالات ژرفتری طرح میشود.
محقق در حین جمعآوری دادهها آنها را بررسی و شروع به کدگذاری، مقولهبندی و مفهومسازی میکند و تقریباً از همان ابتدای کار به نوشتن افکار اولیه خود درباره گزارش تحقیق میپردازد.
گلاسر و اشتراوس (1967) پنج ویژگی اصلی را برای گراندد تئوری قائل شدهاند که در شکل زیر به تصویر کشیده شده است.
شکل (3-1) ویژگیهای گراندد تئوری (گلاسر و اشتراوس)
مطابق شکل 3-1 هدف از راهبرد گراندد تئوری کشف نظریه از طریق استقرا و مبتنی بر تحلیل مقایسهای است. سرانجام کریسول146 (1998) برخی مفروضاتی که به شکلی گستردهتر در تحقیقات مبتنی بر گراندد تئوری به چشم میخورد را چنین فهرست میکند (به نقال از ایگان و برگرفته از رساله دکتری رحیم فوکردی، 1390):
هدف از گراندد تئوری تولید یا کشف نظریه است
در راهبرد گراندد تئوری محقق با قرار دادن مجموعهای از ایدههای نظری در کنار یکدیگر نظریهای قائم به ذات را شکل میدهد.
این نظریه بر چگونگی تعامل افراد با پدیده مورد بررسی تمرکز دارد
این نظریه از روابط احتمالی بین مفاهیم و مجموعهای از مفاهیم حمایت میکند
این نظریه از دادههای حاصل از بررسیهای میدانی، مصاحبهها و مشاهدات و مستندات نشأت میگیرد.
تحلیل دادهها فرایندی نظامیافته است و بهمحض دسترسی به دادهها آغاز میشود.
جمعآوری دادهها بیشتر (یا نمونهگیری بیشتر) بر اساس روند شکلگیری مفاهیم صورت میگیرد
این مفاهیم از طریق مقایسه مستمر آنها با دادههای جدید توسعه مییابند
جمعآوری دادهها میتواند همزمان با ظهور مفهومسازیهای جدید متوقف شود
تحلیل دادهها با کدگذاری باز (شناسایی مقولهها، مشخصهها و ابعاد) آغازشده با کدگذاری محوری (بررسی شرایط، راهبردها و پیامدها) ادامه یافته و با کدگذاری انتخابی (شکل دادن نظریه حول یک مقوله) پایان مییابد.
نظریه حاصل از این راهبرد میتواند در قالب مجموعه از گزارهها یا یک داستان ارائه شود.
3-7- شرحی بر دادهکاوی متنی
روشهای طبقهبندی متن اولین بار در سال 1950 جهت طبقهبندی اسناد که بهصورت خودکار صورت میپذیرفت مطرح گردید. در سال 1960 مقاله درزمینهي طبقهبندی خودکار متن منتشر گردید. شناسایی اطلاعات مفید از پایگاه دادههای متنی از طریق تکنیکهای مختلف دادهکاوی مدتهای طولانی و به طور گسترده در حوزه نرمافزارهای مختلف مورد استفاده قرار گرفت. استفاده از تکنیکهای طبقهبندی جهت کاوش و طبقهبندی نقص کیفیت تحلیل مجموعه دادههای حاصل از پژوهشهای کیفی صورت میپذیرد. تجزیه و تحلیل متن و استخراج دانش (TAKMI) که به منظور شناسایی مسائل شکست پژوهش است مورد استفاده قرار میگیرد. دادهکاوی متنی در حل و فصل مسائل مربوط به کیفیت و قابلیت اطمینان در ارائه نتایج نوین و منحصربهفرد در پژوهشها مورد استفاده قرار میگیرد. تکنیکهای متنکاوی در راستای توسعه و تحلیل دادههای حاصل از پژوهشهای کیفی نیز مورد استفاده قرار میگیرند. از دیگر کاربردها: بهبود کیفیت نتایج و ارزیابی نتایج و غیره را میتوان نام برد. تکنولوژی دادهکاوی انعطافپذیری لازم برای بهرهبرداری اطلاعات از فرمتهای دادههای مختلف و یا پایگاه دادههایی مانند رابطهای، انبار داده، معاملاتی و غیره را فراهم مینماید. پایگاه دادههای متنی میتوانند اطلاعات را در قالب مقالات، گزارشها، صفحات وب، پیامهای حاوی یادداشت، کدگذاریهای گراندد تئوری، متون حاصل از مصاحبهها و غیره که بدون ساختار، نیمه ساختاریافته و ساختاریافته میباشند نگهداری مینماید. متنکاوی را میتوان به عنوان استخراج متن از دادههای متنی و کشف دانش از پایگاه داده متنی عنوان کرد. فرایند استخراج متن بهشدت متکی به تکنیکهای دادهکاوی برای کشف دانش مفید است با این تفاوت که در متنکاوی دادهها بدون ساختار (مصاحبههای صورت گرفته در پژوهش) هستند که چالشهای بیشتری نسبت به دادههای ساختاریافته دارند. [63] مراحل استخراج متن استاندارد شامل آمادهسازی متن، پردازش متن و تجزیه و تحلیل متن است. فرآیند استخراج متن به عنوان روشهای تعاملی و تکرارشونده به شرح ذیل و طبق شکل 1 است.147
شکل (3-2): فرایند متنکاوی به عنوان فرایند تعاملی و تکرارشونده.
در شکل 3-2 روش تکرارشونده برای کشف دانش باارزش که از فرمتهای دادههای متنی، اقتباس شدهاند نمایش داده شده است که در تحلیل دادههای حاصل از پژوهش جاری کاربرد دارد. اطلاعات موجود در فرمها از دادههای متنی به عنوان ورودی جهت آمادهسازی متن و روشهای پردازش متن مورد استفاده قرار میگیرد. هر دو مرحله آمادهسازی متن و مراحل پردازش متن باید به صورت تعاملی برای پیدا نمودن الگوهای مفید و قابل فهم در دادههایی که قرار است در مرحله پایانی یعنی تجزیه و تحلیل متن به صورت مصور نمایش داده شود پیادهسازی گردند. در نهایت نتایج به دست آمده در قالب نمودار یا جداولی نمایش داده میشوند. تکنیکهای دادهکاوی نسبت به متنکاوی کارآمدی پائین تری دارند چراکه داده در فرمتهای بدون ساختار نسبت به پایگاه دادههای ساختاریافته در دسترس تر است. روشهای متنکاوی دارای مزایایی است که باعث مدیریت بهتر منابع دانش و فعالیتهای مدیریت دانش و تجزیهوتحلیل پژوهشهای کیفی میگردد. متنکاوی جهت کشف دانش مفید برای کمک به پردازش اطلاعات و بهبود بهرهوری نتایج حاصل از پژوهشهای کیفی مورد استفاده قرار میگیرد. نتیجه متنکاوی افزایش ارزش افزوده یک پژوهش در راستای تسهیل فرآیند تصمیمگیری، بهبود تحلیلها و کاهش هزینه، نسبت به سایر تکنیکهای پردازش متن است. در اصل برای بهدست آوردن مزایای رقابتیتر و بهرهبرداری از اطلاعات چندگانه، روشهای کشف دانش در نظر گرفته میشود. در نتیجه باید توجه بیشتری به تکنیکهای متنکاوی در راهحلهای تحلیل کیفی گردد. تجزیه و تحلیل متن و طبقهبندی آن میتواند کمک بسزایی در شناسایی مسائل کلیدی نماید که در نهایت میتواند نقش مؤثری در آینده فرآیند تصمیمگیری در بسیاری از زمینههای تحلیل کیفی میگردد. مدیریت بهتر منابع اطلاعاتی، کاهش زمان تحلیلها، بهبود سطح رضایت محقق و یا کیفیت نتایج دلایل اصلی برای بازبینی دادههای ذخیره شده در سیستم پایگاه داده فعلی است. بازنگری پژوهش با استفاده از تجزیه و تحلیل متن و تکنیکهای طبقهبندی متون میتواند جهت تصمیمگیری بهتر محقق برای رسیدن به نیازهای پژوهش مقرون بهصرفهتر و کارآمدتر باشد. فرضیههای ساخته شده در این کار پژوهشی، MKTPKS برای طبقهبندی اسناد به دو کلاس مختلف جهت بهبود دقت طبقهبندی در مقایسه با مدل مبتنی بر طبقهبندی Term مورد استفاده قرار میگیرد. اهداف پژوهش حاضر را میتوان به شرح ذیل برشمرد: اول این که برای اعمال تکنیکهای دادهکاوی متنی برای به دست آوردن اولین سطح دانش و تولید MKTPKS به نمایندگی از دانش مفید که از طریق تکنیکهای خوشهبندی کشف شده است نیاز است. دوم این که به منظور مطالعه تأثیرات مدلهای نمایندگی متنی متفاوت برای ردهبندی دادهها و روشهای بهبود برای به دست آوردن طبقهبندی بهتر از نتایج این پژوهش استفاده میگردد. [63]
شکل (3-3) دادهکاوی متنی برای کشف دانش در پاییندست و راهحلهای مدیریت
3-7-1- روش تحقیق و معماری پیشنهادی
در این بخش یک سیستم پیشنهاد شده است که به تجزیه و تحلیل پایگاه داده متنی و طبقهبندی مطالب میپردازد به صورتی که مطالب را به کلاس متفاوت طبقهبندی مینماید. در این تحقیق پیشنهاد سه سطح سیستم شامل ویژگیهای مختلف جهت متنکاوی ارائه گردیده است. سطوح سیستم پیشنهادی شامل مواردی از قبیل پردازش دانش و ذخیرهسازی در سطح اول، واحد پالایش در سطح دوم و کاربرد و طبقهبندی دانش در سطح سوم است. جریان اطلاعات و دانش از بخشهای مختلف سیستم به تولید خلاصه متن از MKTPKS و پس از آن طبقهبندی اسناد موجود بر اساس MKTPKS است.148 شرح مفصلی از دنبالهای از فعالیتها در ذیل آمده است:
3-7-2- پردازش اطلاعات و داده
اولین گام در بررسی و تحلیل فرمت دادههای متنی بدینسان است که اطلاعات متنی بهصورت مستندات متنی (متون حاصل از مصاحبهها و مرور ادبیات) در دسترس باشند. معمولاً این مستندات توسط افراد خبره (کارشناسان) در سازمان و فرد محقق مورد بررسی قرار گرفته و تصمیمات ملزوم توسط این افراد اتخاذ میگردد که مفید یا غیرمفید است. این نوع بررسی گران است چراکه زمان و تلاش کارشناسان حوزههای مختلف را نیاز دارد. برای آغاز فرایند طبقهبندی خودکار متن دادههای ورودی باید در یک فرمت مناسب برای استفاده از تکنیکهای دادهکاوی متنی مختلف آماده شوند، که شامل حذف کلمات توقف و توابع ریشهیابی لغات ساده است. برای رسیدن به هدف (ایجاد دادههای کاربردی) جهت اعمال تکنیکهای مختلف دادهکاوی باید مراحل ذیل را طی نمود. گام اول حذف اطلاعات غیر ضروری موجود در فرمهای توقف کلمه است. مانند: افعال، حروف ربط، اتصالات قطع، ضمایر و غیره. کلماتی که حذف میشوند در تفسیر معنای متن دارای تأثیر کمتر هستند. ریشهیابی به عنوان روند آمیختن کلمات به ساقه اصلی، پایه یا ریشه آنها تعریف گردیده است. به طور مثال: ریشه رسیدن، میرسد، رساندن کلمه رسید است. این روش به گرفتن اطلاعات کل فضای حمل (دامنه فضای اطلاعات متنی) و هم چنین کاهش ابعاد داده و در نهایت به طبقهبندی دادهها کمک مینماید. گام بعدی برای نمایش دادههای متنی به فرم ماتریس این است که در آن هر بردار ردیف شامل شرایط و هر بردار ستون شامل کد شناسایی مربوط به سند شناسه (ID) باشد. برای کاهش اثرات فقدان اطلاعات کلیدی در این مرحله از نمایش دادههای متنی از رویکرد BOW استفاده مینماییم که این متد از فضای کل اطلاعات برای تحلیل استفاده مینماید. این روش مستقل از ساختار متن است و هر کلمه به عنوان یک نهاد مستقل حاوی برخی اطلاعات در نظر گرفته میشود.149
3-7-2-1- سطح اول: واحد پردازش و ذخیرهسازی دانش
این بخش به تجزیه و تحلیل دادههای متنی کمک میکند تا با استفاده از الگوریتمهای دادهکاوی مختلف دادههایی به دست بیاوریم که نماینده سودمندی از کلمات و عبارات تعریف شده در متن باشند. متدهای نمایش دادههای مختلف که در این سطح استفاده میشوند اول بسامد کلمه (TF) و دوم بسامد معکوس اسناد (IDF). انتخاب نماینده از دادهها باید از طریق آزمایشهای گسترده و هم چنین با در نظر گرفتن کل فضای اطلاعات باشد، که کل موارد از طریق ماتریس صورت میپذیرد. با این وجود در حال حاضر تمرکز در پژوهش جاری با استفاده از تکنیکهای خوشهبندی جهت افراز بندی دادهها به زیرمجموعههای مفید از اطلاعات در هر خوشه است.150
3-7-2-1-1- خوشهبندی
خوشهبندی پردازشی است که برای گروهبندی اطلاعات و دادهها به گروههای دارای خواص مشابه با استفاده از معیارهای فیزیکی یا کمی صورت میپذیرد. این معیار کیفی میتواند بر اساس مرکز ثقل خوشه، عمل خوشهبندی را انجام دهد. [64] تکنیک دیگر در یافتن شبیهترین اعضا از طریق Terms(مجموعه عبارات ساده) و روش K-Means است تا اولین سطح دانش را از بین ارتباطات طبیعی کشف نماید. یکی از مهمترین معیارهای خوشهبندی محاسبه فاصله اقلیدسی است که از این رابطه در روش خوشهبندی K-Means نیز میتوان استفاده نمود.151 فرمول 3-1:
D(x,y)=√(∑_(i=1)^m▒〖(Xi-Yi)〗^2
