پایان نامه با واژگان کلیدی انتقال دانش، دانشگاهها، آموزش از راه دور، حوزه آموزش

دانلود پایان نامه ارشد

درستي طبقهبندي شده در طبقه مشمول افت (ndd) و تعداد افرادي که ادامه تحصيل دادهاند اما مدل، آن‌ها را به غلط در طبقه افت تحصيلي قرار داده است (ncd)، محاسبه مي‌شود.

بازخواني از تقسيم تعداد افرادي که مشمول افت بودهاند و به درستي طبقهبندي شده‌اند (ndd) بر مجموع تعداد افراد به درستي طبقهبندي شده در طبقه مشمول افت (ndd) و تعداد افرادي مشمول افت بودهاند اما مدل به اشتباه آن‌ها را در طبقه موفق، قرار داده است (ndc)، محاسبه ميشود

اندازه F مقداري است که از طريق فرمول 1 محاسبه ميشود و از صفر تا 1 متغير است. مدلي که بيشترين قدرت پيشبين را دارد، اندازه F آن به يک نزديکتر است.

فرمول 1: اندازه F
* متوسط قدر مطلق خطا
صحت طبقهبندي، بازخواني و دقت پيشبيني، شاخصهايي هستند که براي مقايسه کارآيي الگوريتمهاي طبقهبندي بهکار ميروند. براي پيشبيني مسائل از نوع رگرسيوني شاخصهاي مختلفي مطرح است که مهم‌ترينِ آن‌ها عبارتند از: متوسط قدر مطلق خطا، جذر ميانگين مربعات خطا، نسبت قدر مطلق خطا و جذر نسبت مربعات خطا. اين شاخصها به نقل از کُتسيانتيس و پينتالاس254 (2004) در جدول ‏2-3 گزارش شده است. از ميان اين شاخصها، متوسط قدر مطلق خطا، يکي از مهم‌ترين شاخصهاي بهکار رفته براي بررسي کارآيي الگوريتمها است.
جدول ‏2-3: شاخص هاي مقايسه اي رگرسيون

در ادامه، پژوهشهايي گزارش ميشود که از مدلهاي هوشمند براي پيشبيني وضعيت تحصيلي دانشجويان بهره بردهاند. از آنجا که تعداد پژوهشهاي گزارش شده در حوزه يادگيري الکترونيکي اندک بودهاند، لذا در اين بخش پژوهشها محدود به يادگيري الکترونيکي نشده و پژوهشهاي حوزه آموزش حضوري نيز به ترتيب زماني گزارش شده است.
– لوون255(2002) براي پيشبيني انتقال يا عدم انتقال دانشجويان، داده‌هاي 32 هزار دانشجو را در دو دانشگاه آمريکا بررسي کرده است. اين پژوهش براي پيشبيني از مدل شبکه عصبي، درخت تصميمگيري C5.0 و CART استفاده کرده است. متغيرهاي پيشبين شامل 52 متغير دموگرافيک، تحصيلي، اقتصادي و … بودند و برونداد نيز انتقال يا عدم انتقال دانشجو است.
ساختار مدل شبکه عصبي مصنوعي 52 نورون ورودي، هفت نورون پنهان و يک نورون خروجي داشته است. درصد صحت طبقه بندي سه مدل پيشبيني در جدول ‏2-4 خلاصه شده است.
جدول ‏2-4: نتايج مقايسه الگوريتم ها در پژوهش لوون

شبکه عصبي
C5.0
CART
دانشجويان انتقالي
%77.5

%70.0

%82.8

دانشجويان عدم انتقالي
%78.7

%92.0

%82.1

همان‌گونه که مشاهده مي‌شود شبکه عصبي مصنوعي نتايج پيش بيني متوازني دارد. به اين معنا که توانسته است در هر دو طبقه، قدرت پيشبيني متعادلي ارائه دهد؛ اما CART علاوه بر قدرت پيشبيني متوازن، نسبت به شبکه عصبي از قدرت پيشبيني بيشتري نيز برخوردار است. مضاف اينکه درخت تصميمگيري قواعد تصميم را در اختيار کاربر قرار مي‌دهد، حال اينکه شبکه عصبي حکم جعبه سياه را دارد. بنابراين در اين پژوهش درخت تصميمگيري CART بهترين مدل شناسايي شده است.
– کُتسيانتيس و همکارانش256 (2003) در يکي از دانشگاههاي باز يونان، با استفاده از الگوريتم‌هاي c4.5،3NN، RIPPER، Naive Bayes و WINNOW وضعيت تحصيلي دانشجويان را پيشبيني کردند. متغيرهاي پيشبين (مشخصهها) عبارتند از : 1) جنسيت (خانم/آقا)؛ 2) سن (کمتر از 32/ بزرگ‌تر از 32)؛ 3) وضعيت ازدواج (چهار طبقه)؛ 4) تعداد فرزندان؛ 5) وضعيت اشتغال؛ 6) سواد رايانهاي (بله/خير)، 7) ارتباط شغل با رايانه (بله/خير). اين هفت مشخصه همگي در دست? دموگرافيک قرار ميگرفتند. از آنجا که دوره مذکور چهار تمرين نوشتاري و چهار جلسه حضوري نيز داشته، اين هشت مشخصه به عنوان متغيرهاي عملکرد تحصيلي وارد مدل شدند. پژوهشگران در يک گام با مجموع 15 مشخصه مدل خود را آزموده است و سپس با استفاده از روش متوسط بهره اطلاعاتي مهم‌ترين ويژگيها را شناسايي کرده و با مهم‌ترين مشخصه عملکرد، مدلها را مقايسه کردهاند. نتايج در جدول ‏2-5 خلاصه شده است:
جدول ‏2-5: نتايج مقايسه الگوريتم ها در پژوهش کُتسيانتيس و همکارانش

Naive Bayes
3-NN

RIPPER

C4.5

WINNOW

قبل از اعمال انتخاب ويژگي
73.83%

72.34%

73.44%

72.15%

67.29%

بعد از اعمال انتخاب ويژگي
74.70%

74.23%

73.93%

73.57%

68.52%

نتايج مقايسهاي اين پژوهش نشان مي‌دهد، از نظر صحت طبقهبندي با مشخصههاي اسمي و رتبهاي، الگوريتم Naive Bayes قدرت پيشبيني بيشتري را داشته است. از طرفي با کاهش مشخصهها و انتخاب مهم‌ترين ويژگيها کارآيي همه مدلها بيشتر شده است. از محاسن ديگر الگوريتم Naive Bayes نياز به زمان محاسباتي کم و کارآيي بالا حتي با داده‌هاي اندک است.
مهم‌ترين ويژگيهاي شناسايي شده در اين پژوهش، مشخصههاي مربوط به عملکرد تحصيلي بودهاند و اغلب متغيرهاي دموگرافيک از بهره اطلاعاتي کمي برخوردار بودهاند. پژوهشگران بر پايه الگوريتم Naive Bayes ماژولي ساختهاند که وضعيت تحصيلي (موفقيت/ عدم موفقيت) دانشجو را پيشبيني ميکند.
– کُتسيانتيس و پينتالس (2004) با استفاده از جاوا نرم افزاري ساختهاند که مدرس براي پيشبيني موفقيت و عدم موفقيت دانشجو در آموزش از راه دور استفاده کند. اين محققان بر اين نظرند که يک روش يا الگوريتم بهينه براي پيش بيني وجود ندارد، لذا در نرمافزار خود چندين الگوريتم يادگيري ماشيني را در اختيار استاد قرار مي‌دهند؛ به گونه اي که استاد حق انتخاب نوع الگوريتم را دارد. مدلهاي به کار رفته در اين نرمافزار عبارتند از: درخت تصميم گيري، شبکه عصبي، نيو بيز، استنتاج قانون257، الگوريتم يادگيري مبتني بر مثال258و SVM.
اين برنامه از اجزاء زير تشکيل شده است:
ماژول يادگيري ماشيني: در اين بخش از نرم افزار مدرس جهت پيش بيني موفقيت يا افت دانشجو از ميان الگوريتم‌هاي مختلف، يکي را انتخاب ميکند.
جزء استنتاج قوانين ارتباطي259: در اين جزء، استاد ميتواند رابطه متغيرهاي مختلف را با يکديگر شناسايي کند.
ماژول انتخاب ويژگي260: در اين جزء مدرس مي‌تواند با استفاده از روش‌هاي مختلف دادهکاوي، مهم‌ترين ويژگيهايي (متغيرهايي) که با موفقيت و عدم موفقيت دانشجو مرتبط هستند را شناسايي کند.
ماژول بالانس کننده داده‌ها261: از آنجا که الگوريتمهاي مختلف نسبت به بالانس بودن داده‌ها حساس هستند، اين جزء به استاد اجازه ميدهد قبل از انتخاب الگوريتم پيشبيني داده‌هاي خود را بالانس کند.
ماژول خروجي HTML: اين جزء استاد را قادر مي‌سازد تا يک صفحه ديناميک از گزارش پيشبيني را مشاهده نمايد. اين جزء به منظور پشتيباني تعامل از جاوا اسکريپت استفاده کرده است.
متغيرهاي پيشبين به کار رفته در اين برنامه متغيرهاي دموگرافيک و عملکرد تحصيلي دانشجو بوده و گزارشي مبني بر تعداد دادها و مقايسه عملکرد اين الگوريتمها ارائه نشده است.
– کُتسيانتيس و پينتالاس (2004) براي پيشبين نمره نهايي دانشجويان در يک دوره آموزش تلفيقي از چند روش يادگيري ماشيني استفاده کردهاند. متغيرهاي پيشبين در اين پژوهش به دو دسته تقسيم شدهاند، متغيرهاي مربوط به زمان ثبتنام دانشجو و متغيرهاي مربوط به گزارش استاد. متغيرهاي دسته اول هفت مورد بوده که شامل جنس، سن، وضعيت ازدواج، وضعيت اشتغال، سواد کامپيوتري و مرتبط بودن شغل فرد با رايانه ميشود. متغيرهاي مربوط به گزارش استاد هشت مورد است که چهار مورد آن به حضور يا عدم حضور دانشجو در چهار جلسه حضوري دوره مربوط است و چهار مورد ديگر به نمره استاد در چهار تکليف دانشجو بر ميگردد. متغير ملاک يا برونداد نمره پاياني دانشجو در پايان دوره بر اساس مقياس 0 تا 10 است. از آنجا که متغير ملاک در اين پژوهش از نوع دو ارزشي نبوده، پژوهشگران از چند روش رگرسيوني استفاده کرده‌اند: 1) ModelTrees؛ 2) شبکه عصبي؛ 3) رگرسيون خطي؛ 4) رگرسيون خطي وزن داده شده محلي262؛ 5) SVM.
توضيح بيشتر در مورد، ModelTree اينکه، اين مدل معادل درخت تصميمگيري براي حل مسائل رگرسيوني است. نتيجه مقايسه الگوريتمها بر حسب ميانگين خطاي مطلق263 نشان داد، الگوريتم M5rules با ميانگين خطاي مطلق 1.21، علاوه بر اينکه از دقت پيشبيني بيشتري برخوردار است، نتايج قابل فهمتري نيز براي کاربر فراهم ميکند؛ زيرا اين الگوريتم قواعدي از نوع “اگر-آنگاه” در اختيار کاربر قرار ميدهد. پژوهشگران بر اساس الگوريتم انتخاب شده، ابزاري پيشبين طراحي کردهاند که نمره نهايي دانشجو را در اين دوره الکترونيکي پيشبيني ميکند.
-هرزوگ264(2006)، کارآيي رگرسيون، درخت تصميمگيري و شبکه عصبي مصنوعي را مقايسه کرده است. در اين پژوهش، محقق کارآيي اين روشها را در پيشبيني ماندگاري دانشجو و طول زمان تحصيل، بررسي کرده است. در بررسي اول از 40 متغير و داده‌هاي هشت هزار و 18 دانشجو براي پيشبيني ماندگاري و عدم ماندگاري دانشجو استفاده شده است. نتايج نشان داد: درخت تصميم گيري (C.5.0) بيشترين ميزان صحت طبقهبندي، حدود 85% را دارد.
در بررسي ديگري اين پژوهشگر از 79 متغير و داده‌هاي پانزده هزار و 457 دانشجو، براي پيشبيني زمان دانشآموختگي دانشجويان بهره برد. نتايج مقايسه نشان داد درخت تصميمگيري (C.5.0) بيشترين ميزان صحت طبقهبندي حدود 93% را دارد. از پژوهش هرزوگ (2006) مشخص ميشود، کارآيي مدلها بر حسب پيچيدگي متغيرهاي پيشبين و متغير ملاک متفاوت است. به عنوان مثال در اين پژوهش با تغيير نوع متغير ملاک و افزايش متغيرهاي پيشبين کارآيي مدلها افزايش يافته است.
– هامالاينِن و ويني265(2006) در فنلاند براي پيشبيني عملکرد تحصيلي دانشجويان درسي که به روش الکترونيکي ارائه شده است از روش‌هايي يادگيري ماشيني استفاده کردهاند. هدف پژوهشگران، انتخاب بهترين الگوريتم يادگيري ماشيني با تعداد داده است. اين پژوهشگران نياز به داده زياد را يکي از مشکلات اغلب روش‌هايي يادگيري ماشيني مي‌دانند. حال اينکه اغلب داده‌هاي اندک آموزشي – به عنوان نمونه داده‌هاي يک کلاس درس- کم بوده و از 100 دانشجو تجاوز نميکند؛ لذا الگوريتمهايي چون نزديک‌ترين همسايه266، شبکه عصبي و درخت تصميمگيري را براي هدف خود مناسب نمي‌دانند.
مجموعه داده‌هاي اين پژوهش، 88 دانشجو با هشت متغير پيشبين بوده است. متغيرهاي پيشبين نمرات دانشجو در چند تکليف درسي بوده و متغير ملاک نيز گذراندن يا عدم گذراندن درس (دو کلاسه) است. از آنجا که يکي ديگر از اهداف اين پژوهش، شناسايي بهترين الگوريتم براي وروديهاي واقعي (به عنوان مثال نمره واقعي دانشجو در تمرينهاي طول ترم) و وروديهاي دوتايي شده (نمره تمرين ضعيف/خوب) بوده است؛ لذا متغيرهاي پيشبين را به حالت دوتايي نيز تبديل کرده‌اند.
الگوريتمهاي بکار رفته براي پيشبيني با داده‌هاي عددي، رگرسيون خطي و SVM بوده و براي داده‌هاي اسمي (دوتايي) از سه نوع شبک? بيزي 1) Bayes Naive،2) شبکه بيزي267TAN و 3) بيزي چند شبکهاي268 استفاده شده است.
نتايج مقايسه الگوريتمها نشان داد که SVM با داده‌هاي اندک و وروديهاي واقعي (عددي) بهترين عملکرد پيشبيني را دارد (صحت طبقهبندي 88%). با داده‌هاي اسمي نيز Bayes Naive از قدرت پيشبيني بيشتري برخوردار بوده است (صحت طبقهبندي 86%). پژوهشگران بر آنند که Bayes Naive با داده‌هاي اندک، بر الگوريتمهاي متداول چون درخت تصميمگيري و شبکههاي بيزي معمولي برتري دارد. مضاف اينکه، اين نوع شبکه در برابر مسئله بيشبرازش269 نيز مقاوم است. SVM نيز براي داده‌هاي اندک مناسب است اما بزرگ‌ترين مشکل آن عدم ارائه اطلاعاتي قابل فهم به کاربر (عدم شفافيت) است.
– رومرو و همکاران270(2008) در يکي از دانشگاههاي اسپانيا، داده‌هاي 438 دانشجو را در هفت درس الکترونيکي ارائه شده در بستر مودل دادهکاوي کردند. درونداد يا متغيرهاي پيشبين در اين پژوهش 10 متغير بوده که بدين قرار است: کد درس، تعداد تکاليفي که انجام داده، تعداد کويزي که دانشجو شرکت کرده، تعداد کويز پاس کرده، تعداد کويز افتاده، تعداد پيامهايي که در فروم ارسال کرده، تعداد پيامهايي که در فروم خوانده، ميزان وقتي که براي تکاليف صرف کرده، ميزان زماني که براي کويزها

پایان نامه
Previous Entries پایان نامه با واژگان کلیدی اضطراب امتحان، دانشگاهها Next Entries پایان نامه با واژگان کلیدی دانشگاهها