پایان نامه با واژگان کلیدی دانشگاهها، مقطع متوسطه

دانلود پایان نامه ارشد

صرف کرده و ميزان وقتي که در فرومها صرف کرده است. اين متغيرها علاوه بر اينکه به صورت عددي مورد استفاده قرار گرفتهاند، تبديل به متغيرهاي طبقهاي نيز شدهاند. به اين صورت که همه به قوي/متوسط و/ ضعيف تبديل شدهاند تا عملکرد الگوريتمها در داده‌هاي عددي و طبقهاي با هم مقايسه شود. متغير ملاک يا برونداد، نمره پاياني دانشجو بوده که به مقياس چهار درجهاي افتاده/ گذرنده/ خوب و/ عالي تبديل شده است.
اين پژوهش از 24 الگوريتم طبقهبندي استفاده کرده است. اين پژوهشگران روش‌هايي پيشبيني را در پنج دسته کلي طبقهبندي کردند:1) روش‌هايي آماري مانند رگرسيون؛ 2) درخت تصميمگيري مانند الگوريتم c4.5 و CART؛ 3) استنتاج قانون مانند الگوريتم AprioriC؛ 4) استنتاج قانون فازي مانند LogitBoost؛ 5) شبکههاي عصبي چون پرسپترون چند لايه. در اين پژوهش هيچ کدام از الگوريتمها به صحت طبقهبندي بيشتر از 70% نرسيدهاند. الگوريتم CART از خانواده درخت تصميمگيري با 67.02% صحت طبقهبندي با داده‌هاي واقعي (عددي) و 66.86% با داده‌هاي طبقهبندي شده، بهترين الگوريتم بوده است. پس از بالانس کردن داده‌ها، سه الگوريتم Corcoran, XCS ,AprioriC از خانواده استنتاج قانون و الگوريتم MaxLogicBoost از خانواده استنتاج قانون فازي با صحت طبقهبندي بالاي 60% بيشترين دقت پيشبيني را داشتهاند. اين پژوهش نشان ميدهد، بالانس کردن داده‌ها بر عملکرد برخي از الگوريتمها تأثيري ندارد و بر روي برخي الگوريتمها چون دو الگوريتم درخت تصميمگيري اثر منفي دارد و بر روي 17 الگوريتم ديگر اثر مثبت داشته است. در اين تحقيق براي انتخاب بهترين الگوريتم، دو شاخص معرفي شده است. يکي صحت پيشبيني و ديگري قابل فهم بودن براي کاربر (استاد، دانشجو). از آنجا که درخت تصميمگيري و الگوريتمهاي استنتاج قانون از داده‌ها قاعده “اگر-پس” استخراج ميکنند. بهترين گزينه براي اين منظور محسوب ميشوند. از طرفي کار و فهم با متغيرهاي پيشبين طبقهبندي شده بسيار قابل فهمتر است. بنابراين الگوريتمهاي درخت تصميمگيري پيشنهاد نهايي اين پژوهش است.
– کاراموزيز و ورتوز271(2008) داده‌هاي يک هزار و 407 دانشجوي آمريکايي را به دو دسته تقسيم کرده و يک هزار و صد داده را براي آموزش و 307 داده را براي تست شبکه عصبي مصنوعي استفاده کردند؛ شبکه از نوع پرسپترون سه لايه بوده و از الگوريتمهاي “آموزش پس انتشار” براي آموزش شبکه استفاده شده است. متغيرهاي پيشبين يا درونداد در اين پژوهش 11 عامل بوده که در بدو ورود به دانشگاه جمعآوري شده است. دروندادها شامل متغيرهايي چون جنسيت، قوميت، سن، کد پستي دانشجو و … بوده است. در لايه خروجي نيز موفقيت و عدم موفقيت دانشجو کد شده و در لايه پنهان نيز از چهار نورون استفاده شده است.
در اين پژوهش، صحت طبقهبندي کل براي شبکه پرسپترون بر روي داده‌هاي آموزش 77% و بر روي داده‌هاي تست 68% گزارش شده است. صحت طبقهبندي مدل براي دانشجويان موفق 70.27% و براي دانشجوياني که موفق به دانشآموختگي نشدهاند، 66.29% گزارش شده است.
-ايمبري، لين و ماليسچف272(2008) در يکي از دانشگاههاي آمريکا براي پيشبيني ماندگاري دانشجويان مهندسي از شبکه عصبي مصنوعي پيشخور با الگوريتم آموزش پس انتشار Levenberg-Marquardt استفاده کردهاند. داده‌هاي چهار هزار و 900 دانشجوي جديدالورود در سالهاي تحصيلي 2004، 2005 و 2006 مورد بررسي قرار گرفت. متغيرهاي پيشبين يا دروندادهاي شبکه عصبي در دو دسته کلي متغيرهاي شناختي و متغيرهاي غير شناختي تقسيم شده و در قالب چهار مدل متفاوت به شبکه وارد شدند.
در مدل اول متوسط نمرات دانشجويان در 9 متغير غير شناختي به مدل وارد شدند. اين متغيرها عبارتند از: رهبري، يادگيري عميق در برابر يادگيري سطحي، کار تيمي، خودکارآمدي، انگيزش، فراشناخت، ارزش انتظار و تصميم اصلي273 . اين متغيرها روان‌شناختي بوده که به وسيله پرسشنامه برخط بدست آمدهاند. مدل شبکه عصبي (1،9،9) بوده است؛ به عبارتي اين شبکه نه نورون ورودي، 9 نورن در لايه پنهان و 1 نورون خروجي داشته است. بر روي داده‌هاي دانشجويان ورودي سال 2004، درصد صحت طبقه بندي کلي 67.3% براي اين مدل گزارش شده است.
در مدل دوم نيز متغيرهاي غير شناختي (روان‌شناختي) وارد شدهاند با اين تفاوت که در اين مدل 60 آيتم از سؤالات پرسشنامه وارد مدل شده و شبکهاي با 60 نورون در لايه ورودي، 30 لايه پنهان و يک لايه خروجي (1، 30، 60) آموزش داده شده است. بر روي داده‌هاي دانشجويان ورودي سال 2004، درصد صحت طبقه بندي کلي 70.5% براي اين مدل گزارش شده است.
مدل سوم در برگيرنده يازده متغيرهاي شناختي به عنوان پيشبين بوده است. متغيرهاي شناختي در اين پژوهش به متغيرهاي تحصيلي اشاره دارد که معدل ديپلم، نمرات استاندارد دانش آموز در رياضي، علوم و زبان نمونههايي از اين 11 متغير است. مدل سوم معماري (11،11،1) بوده است. بر روي داده‌هاي دانشجويان ورودي سال 2004، درصد صحت طبقه بندي کلي 69.7% براي اين مدل گزارش شده است.
مدل چهارم ترکيبي از متغيرهاي غير شناختي و شناختي يعني مدل دوم و سوم بوده است. بنابراين مدل چهارم معماري (71،36،1) را دارد. بر روي داده‌هاي دانشجويان ورودي سال 2004، درصد صحت طبقه بندي کلي 71.3% براي اين مدل گزارش شده است.
آزمون مدل شبکه عصبي بر روي داده‌هاي سه سال متوالي نشان داد که پيشبيني شبکه از پايايي قابل قبولي برخوردار است. به عنوان مثال درصد صحت طبقهبندي مدل دوم (1، 30، 60) در سال 2004؛ 70.5% در سال 2005 معادل 70.3% و در سال 2006 معادل 71.8% بوده است. نزديکي اين پيشبينيها به هم نشاني از پايايي يافتههاي شبکه عصبي در پيشبيني موفقيت دانشجويان است.
– ليکارنتزو و همکارانش274(2009) در يونان، براي پيشبيني تکميل يا عدم تکميل دو دوره آنلاين تحت عناوين شبکه و طراحي وب از سه روش يادگيري ماشين استفاده کردند. تعداد 193 دانشجوي الکترونيکي در اين دو دوره شرکت کرده بودند که 44% (84 نفر) آن‌ها دوره را کامل نکردند. روش‌هايي يادگيري ماشيني به کار رفته در اين پژوهش عبارتند از: شبکه عصبي پيشخور، SVM و Fuzzy ARTMAP.
اين پژوهش تعداد 9 متغير پيشبين داشته که عبارتند از: جنسيت، محل اقامت (مرکز، استان)، تجربه کاري با رايانه (?0 به سال)، سطح تحصيلات (پايه، متوسطه، عالي، کارشناسي، دکتري)، سطح زبان (مقدماتي، پايه، بالا، مسلط)، نمره کويز (0-20)، نمره پروژه (0 تا 100)، تأخير در ارسال پروژه (?0 به روز) و فعاليت در سامانه مديريت يادگيري (?0 تعداد لاگ فعاليت دانشجو).
با مجموع 9 متغير پيشبين، 96% صحت طبقهبندي براي شبکه عصبي؛ 97% براي SVM و 94% براي Fuzzy ARTMAP گزارش شده است. محققين پژوهش بر اين عقيدهاند، يک روش يادگيري ماشيني به تنهايي نميتواند مفيد باشد؛ لذا سه طرح تصميمگيري براي گزارش نتايج پيشبيني طرحريزي کردهاند. طرح تصميمگيري 1: اگر از مجموع سه روش يک روش دانشجو را مشمول افت پيشبيني کند، دانشجو مشمول افت گزارش خواهد شد. در طرح تصميم گيري 2، دو روش و در طرح تصميمگيري 3، هر سه روش دانشجو را مشمول افت پيشبيني ميکنند. بر اين اساس دانشجويي که مطابق طرح تصميمگيري 3 در معرض خطر شناخته شود احتمال افت بيشتري دارد.
– راماس وامي و باسکاران275(2009) پژوهش خود را بر مقوله انتخاب ويژگي276 متمرکز کردهاند. انتخاب ويژگي مقوله مهمي در تشخيص الگو، يادگيري ماشيني، آمار و دادهکاوي است. هدف انتخاب ويژگي عبارت است از حذف متغيرهايي که کمترين ارتباط يا قدرت پيشبين را دارند و شناسايي متغيرهايي که بيشترين قدرت طبقهبندي يا پيشبيني را دارند. انتخاب ويژگي کارايي يادگيري را ارتقاء ميدهد، صحت پيشبيني را بالا برده و پيچيدگي نتايج يادگيري را کم ميکند. با توجه به اهميت کاهش متغيرها در کارآيي الگوريتمهاي پيشبيني؛ پژوهشگران شش روش انتخاب ويژگي را بر روي 32 مشخصه از داده‌هاي يک هزار و 969 دانش آموز متوسطه در هندوستان آزمون کردهاند. اين روشها عبارت بودند از CB277، CH278، 279GR،280 IG،281 RF،282 SU. پس از اعمال روش‌هايي مختلف و انتخاب ويژگي IG تعداد ويژگي را از 32 به 7 مورد کاهش داد. در نهايت بر اساس مهم‌ترين متغيرهاي انتخاب شده، الگوريتمهاي پيشبيني VotedPerceptron، NaiveBayes، OneR و PART مقايسه شدند. نتايج نشان داد: VotedPerceptron و OneR با صحت پيشبيني 89 % بيشترين دقت پيشبيني را دارند. به عبارتي اين پژوهش ثابت ميکند با کاهش متغيرها و انتخاب مهم‌ترين متغيرها ميتوان قدرت پيشبيني را افزايش داد.
– کوپر283(2009) براي پيشبيني ادامه تحصيل يا عدم ادامه تحصيل دانشجو در کالج حضوري فورت لويز284 آمريکا از شبکه عصبي مصنوعي استفاده کرد. اين پژوهش براي بررسي قابليت تعميم نتايج شبکه، آن را روي داده‌هاي دانشجويان طي چند سال متوالي آزموده است. ابتدا شبکه بر روي داده‌هاي دانشجويان در سال 2007 تست شده که صحت طبقهبندي اين شبکه 76.7% بوده است. درصد صحت طبقهبندي براي ادامه تحصيل 76.9 و براي دانشجوياني که ادامه تحصيل ندادهاند 76.5 بوده است. در ادامه اين پژوهش طولي شبک? ايجاد شده بر روي داده‌هاي دانشجويان جديدالورود سال 2008 تست شد که 70% صحت طبقهبندي در اين دوره بدست آمد. در مرحله سوم شبکه ايجاد شده براي داده‌هاي سال 2008 بر روي داده هاي سال 2009 به کار رفت که ميزان صحت طبقهبندي کلي شبکه 73.3% بوده است. محقق قابليت تکرار نتايج شبکه بر روي داده‌هاي دانشجويان طي سالهاي مختلف را نشان قابل تعميم بودن مدل شبکه عصبي براي پيشبيني وضعيت دانشجو ميداند. يازده متغير در اين پژوهش به عنوان درونداد شبکه يا متغير پيشبين به کار رفته که از معماري و نوع شبکه در گزارش پژوهش جزئياتي ارائه نشده است.
– کواکيک285(2010) داده‌هاي 453 دانشجو را در يکي از دانشگاههاي الکترونيکي نيوزلند با استفاده از مدل درخت طبقه بندي (CHAID) و مدل درخت تصميمگيري ((CART بررسي کرد. 9 متغير پيشبين اين پژوهش عبارت بودند از: جنسيت (باينري)، سن (رتبهاي)، نژاد (اسمي)، ناتواني دانشجو (باينري)، مقطع متوسطه (اسمي: سطح پيشرفت دانشآموز بر اساس گزارش‌هاي نيوزلند)، وضعيت اشتغال (باينري)، ثبتنام به موقع (باينري: ثبتنام به موقع / ثبت نام با تأخير)، رشته (اسمي: کارشناسي تجارت يا کارشناسي علوم کاربردي)، ترم ارائه (اسمي: ترم 1، ترم 2 و ترم 3) . متغير ملاک نيز باينري بود و گذراندن يا عدم گذراندن درس را شامل ميشد. اين پژوهش در گام اول با استفاده از روش مجذور کاي، مهم‌ترين ويژگيها را شناسايي کرده که نژاد، رشته و ترم ارائه مهم‌ترين متغيرهاي مرتبط با افت دانشجو شناسايي شدند.
نتايج مقايسهاي اين پژوهش نشان داد: مدل درخت طبقهبندي CHAID، 59.4% صحت طبقه بندي کلي را داشته است (49% براي دانشجويان ناموفق و 71% براي دانشجويان موفق)؛ مدل درخت تصميمگيري CART، 60.5% صحت طبقهبندي کلي را داشته است (62.3% براي دانشجويان ناموفق و 58.4% براي دانشجويان موفق). همان‌گونه که مشخص است، مدل درخت تصميمگيري CART علاوه بر اين که از قدرت پيشبيني بيشتري برخوردار بوده، نتيجه پيشبيني متوازنتري نيز داشته است.
– يو و همکاران286(2010) داده‌هاي تعداد شش هزار و 690 دانشجو را در دانشگاه ايالتي آريزونا با روش شبکه عصبي، درخت تصميمگيري و MARS287 تحليل کردند. MARS يک روش دادهکاوي براي حل مسائل از نوع رگرسيون است. روشي ناپارامتريک که قبل از تحليل، نيازي به روابط تابعي بين متغير وابسته و مستقل ندارد. MARS اين مفروضه را ميپذيرد که اغلب متغيرها به روش‌هايي پيچيده پيامدها را تحت تأثير قرار ميدهند. هدف اين پژوهش شناسايي افت تحصيلي دانشجويان در سال سوم تحصيلي بر اساس داده‌هاي سال دوم آنان بوده است. مشخصههاي (متغيرهاي پيشبين) اين تحقيق متغيرهاي دموگرافيک، پيشينه تحصيلي و درصد شرکت در کلاسهاي آنلاين بوده است. هر چند گزارشي مبني بر مقايسه روش‌هايي مختلف در اين تحقيق وجود ندارد اما درصد صحت طبقه بندي روش MARS،73.53% گزارش شده است.
– ونگ کامدي و سره سانگ تاکول288(2010) قدرت طبقهبندي شبکه عصبي را با تحليل تشخيص مقايسه

پایان نامه
Previous Entries پایان نامه با واژگان کلیدی اضطراب امتحان، دانشگاهها Next Entries پایان نامه با واژگان کلیدی دانشگاهها