تحقیق با موضوع علوم اجتماعی، تجزیه واریانس، تحلیل واریانس، انعطاف پذیری

دانلود پایان نامه ارشد

است.
ε(x)=T
برای جامعه اصلی همبستگی نمرات خطا و نمرات واقعی به دست آمده از یک آزمون برابر صفر
است. به این معنی که مقدار خطا مستقل از نمرهی واقعی است. این فرض بیان می دارد که آزمونهایی که نمره واقعی بالایی دارند، خطای اندازهگیری مثبت یا منفی بیشتر از آزمودنیهایی که نمره واقعی آنها پایین است، ندارند.
ρ_ET=0
همبستگی نمرات خطای دو آزمون، برابر صفر است. به عبارتی دیگر نمرات خطای دو آزمون
مستقل از هم و ناهمبسته هستند. به این معنی که چنانچه نمره خطای فردی در آزمون اول مثبت باشد نمیتوان پیشبینی کرد که نمره خطای او در آزمون دوم مثبت خواهد شد یا منفی.
ρ_E1E2=0
همبستگی نمرات خطا در یک آزمون (E1) با نمرات واقعی آزمون دیگر (T2) صفر میباشد.
ρ_E1T2=0
دو آزمون موازی35 هستند اگر نمره واقعی و واریانس خطاهای آن دو، برابر باشد. همچنین
همبستگی هر یک از آنها با آزمونهای دیگر یکسان باشد.
تفاوت بین نمرات واقعی آزمونهایی که اساساً تائو معادل36 هستند، در یک مقدار ثابت اضافی
است. برعکس آزمونهای موازی، این آزمونها میتوانند واریانسهای خطای نامساوی داشته باشند.
محدودیتهای نظریه کلاسیک آزمون
در حالی که نظریه کلاسیک آزمون چارچوبی آماده دارد که در برخی شرایط مفید نشان داده شده است، روانسنجان درست همان موقعی که در حال گسترش نظریه بودند، بسیاری از محدودیتهای آن را تشخیص دادند. در این قسمت با استفاده از کتاب مبانی نظریه پرسش – پاسخ (همبلتون37 و همکاران،1991، ترجمه فلسفی نژاد، 1389)، جزوه کلاسی فلسفینژاد (1391)، کتاب روانسنجی پیشرفته کاربردی (ستاری، 1382) و دایرۃ المعارف بینالمللی علوم اجتماعی و رفتاری (2001) به برخی محدودیتهای اساسی این نظریه اشاره میشود.
برآورد پارامترهای سوالات آزمون از جمله درجه دشواری38 و قدرت تشخیص سوال39، به
ویژگیها و سطح توانایی آزمودنیها بستگی دارد، لذا با تغییر وضعیت آزمودنیها و انتخاب نمونهی دیگر از جامعه آزمودنیها، پارامترهای سوالات نیز تغییر میکند. این که سوال سخت است یا ساده، به توانایی آزمودنیهایی که مورد اندازهگیری قرار گرفتهاند بستگی دارد. دو گروه یکی با سطح توانایی بالا و دیگری با سطح توانایی پایین را در نظر بگیرید. به هر دو گروه سوال یکسانی داده میشود. مقدار ضریب دشواری متفاوتی برای هر دو گروه به دست خواهد آمد. برای گروهی با سطح توانایی بالا، سوال ساده و برای گروه با سطح توانایی پایین، سوال سخت خواهد بود. این بار دو گروه از آزمودنیها را که از نظر سطوح توانایی، اولی ناهمگن40 و دومی همگن41 است را در نظر بگیرید. اگر سوال یکسانی به دو گروه داده شود، ضریب تشخیص بالاتری در گروه اول نسبت به گروه دوم به دست میآید و به تبع آن ضریب اعتبار آزمون نیز در گروهی که دامنه گستردهای از مهارت یا تواناییها را دارد نسبت به گروهی که دارای دامنه محدودی از مهارت یا توانایی است، بالاتر است. به بیان گویاتر، مفهوم اعتبار ویژگی خود آزمون نیست بلکه بستگی به گروهی از آزمودنیها دارد که برای پرورش آزمون مورد استفاده قرار گرفتهاند.
برآورد توانایی آزمودنیها به سوالات آزمون وابسته است. به این معنی که نمونههای متفاوت
سوال به برآوردهای متفاوتی از توانایی افراد مورد سنجش منجر میشود. در چارچوب نظریه کلاسیک آزمون، مفهوم توانایی بوسیله نمره واقعی بیان میشود. هم نمره مشاهده شده و هم نمره واقعی هر دو وابسته به آزمون مورد استفاده هستند. وقتی که آزمون دشوار است، به نظر میرسد که آزمودنی توانایی پایینی دارد و وقتی که آزمون آسان است به نظر می رسد که آزمودنی دارای توانایی بالایی باشد. بنابراین نمیتوان یک مقدار توانایی ثابتی را در روی پیوستار صفت مکنون برای آزمودنی به دست آورد. در نتیجه مقایسه آزمودنیهایی که در آزمونهای مختلف شرکت کردهاند، خیلی دشوار است.
مفاهیم و تعاریف نظریه CTT غیر قابل آزمایش هستند. در واقع راهی وجود ندارد تا معین شود
چه اندازه مفروضههای نظریه کلاسیک آزمون با واقعیات در ارتباط است.
یکی از نتایج نظری مدل کلاسیک آزمون، ساخت فرمهای موازی آزمون است. این امر از
لحاظ نظری قابل دفاع است لیکن در عمل، ساخت آزمونهای موازی واقعی غیرممکن است. زیرا نمرات
واقعی و خطا، ساخت نظری غیر قابل مشاهده دارند و موازی بودن فرمها قابل تبیین و توجیه نیست.
نظریه کلاسیک آزمون، آزمون مدار42 است. در قالب این نظریه، نمره کل را برای تفسیر در نظر
میگیرند. نمره کلها میتوانند با هم مشابه باشند در حالیکه توانایی و مهارتهای افراد با هم متفاوت باشد. این نظریه توجهی به اینکه یک آزمودنی چطور به سوال پاسخ میدهد ندارد. به عبارت دقیقتر، این نظریه ما را به پیشبینی نحوه عملکرد یک فرد یا یک گروه از آزمودنیها در مواجه با یک سوال خاص قادر نمیسازد.
نظریه کلاسیک آزمون به اندازه کافی برای توزیعهای نمره مشاهده شده آزمون که اثرات پایه
و سقف دارند دلیل موجهی نمیآورد، جایی که نسبت بزرگی از نمره آزمودنیها در هر دو انتهای پایین و بالای دامنهی نمره آزمون قرار دارند.
مجموعهی متنوع و گستردهای از عوامل میتواند نمرات مشاهده شده را تحتتأثیر قرار دهد،
از جمله چگونگی ساخت سؤالات، اجرای آزمونها، نمره گذاری سوالات. در CTT همه این عوامل فقط در اصطلاح خطای تصادفی در مدل آماری گنجانیده شده است.
اعتبار در نظریه کلاسیک اندازهگیری به عنوان ” همبستگی میان فرمهای موازی یک آزمون”
تعریف میشود. در عمل مرتفع کردن شرایط تعریف آزمونهای موازی اگر غیرممکن نباشد، دشوار است. ضرایب اعتبار موجود، برآورد حد پایین اعتبار را به دست میدهند یا برآوردی از اعتبار با سوگیری نامعلوم را فراهم میسازند.
خطای استاندارد اندازهگیری43 که تابعی از واریانس و ضریب اعتبار آزمون میباشد، فرض
میشود که برای همه آزمودنیها در همه سطوح توانایی یکسان است. در حالیکه، برحسب سطوح مختلف نمرات حقیقی و موقعیت آزمودنیها بر روی پیوستار صفت مکنون، خطای اندازهگیری متفاوت است و معمولاً آزمودنیهای با توانایی کمتر دارای خطاهای استاندارد اندازهگیری بیشتری هستند تا آزمودنیهای قویتر و با نمرات حقیقی بالاتر. علاوه بر آن، خطای معیار اندازهگیری به گروه نمونه وابسته است زیرا نمیتوان آن را جدا از اعتبار آزمون تعیین کرد.
نظریه تعمیم پذیری(GT)
عوامل مختلفی، نمرات مشاهده شده آزمون را تحت تأثیر قرار میدهد. در نظریه کلاسیک آزمون، همه
این عوامل تحت یک عبارت خطای تصادفی نامتمایز در مدل آماری گنجانیده میشود. روانسنجان برای لحاظ کردن این عوامل و تفکیک آنها در مدلهای آماریشان، نظریه تعمیمپذیری را گسترش دادند. بنا به گفتهی برنان (a2010)، نظریه تعمیمپذیری چارچوب مفهومی گسترده و مجموعه محکمی از روشهای آماری را برای پرداختن به مسائل اندازه گیری متعدد فراهم کرده است تا حدی که، این نظریه را میتوان به دلیل به کار بستن روشهای تحلیل واریانس44(ANOVA) به عنوان بسطی از نظریه کلاسیک آزمون تلقی کرد. نظریه کلاسیک آزمون و ANOVA را میتوان به عنوان والدین نظریه تعمیمپذیری پنداشت، اما این کودک هم بیشتر و هم کمتر از پیوند سادهی والدینش است. اگر چه نظریه تعمیمپذیری، نظریه کلاسیک آزمون را گسترش داده است، اما همه ابعاد نظریه کلاسیک آزمون در نظریه تعمیمپذیری وارد نشده است. علاوه بر این، مسائل ANOVA که در نظریه تعمیمپذیری بر آن تأکید میشود متفاوت از مسائلی است که در بسیاری از طرحهای آزمایشی و متون ANOVA غالب است. نظریه تعمیمپذیری به طور خاص بر روی مؤلفههای واریانس45 و برآوردشان تمرکز میکند.
در این نظریه با تجزیه واریانس نمره کل به رویه های46 چندگانه، امکان برآورد درصد واریانس ناشی از هر رویه بوجود میآید و از این طریق میتوان رویهای (منبع خطا) که مقدار مؤلفه واریانس آن و یا مقدار مؤلفههای واریانس اثرهای متقابل آن زیاد است را شناسایی کرد و در ادامه با اقدامات مؤثر مقدار واریانس خطا را کاهش داد و فرایند اندازهگیری را بهبود بخشید. فرض کنید در بررسی که انجام دادهاید، رویه ارزیاب مؤلفه واریانس بزرگتری دارد. در اینجا میتوان با افزایش سطوح این رویه (افزایش تعداد ارزیابان) و یا آموزش بهتر برای ارزیابان، به ثبات بهتری در بین ارزیابان رسید. همانطور که فن و سان47 (2013) بیان نموده اند؛ این نظریه با مطالعات D برای طرحهای اندازهگیری مختلف، به محققین این امکان را میدهد که تأثیر سطوح اندازهگیری48 را بر روی اندازه اعتبار بسنجند و اندازه اعتبار را در مطالعه واقعیشان پیشبینی کنند. در این راستا محققین میتوانند با استفاده از قابلیت انعطاف پذیری و پیشبینی این نظریه و با در نظر گرفتن ملاحظات عملی، پروتکل اندازه گیری بهینهای را طراحی کنند.
در GT، اعتبار مسئلهای است از نظر درجهای که میتوان از یک مشاهده به جهانی از مشاهدات تعمیم
داد (کرونباخ، گلیسر، ناندا و راجاراتنام، 1972، به نقل از براون49، 2005). از آنجا که یک اندازه خاص ممکن است به جهانهای بسیار متفاوتی تعمیم داده شود، بنابراین با ضرایب اعتبار مختلفی همراه خواهد بود. ضریب تعمیمپذیری (اعتبار) یک آزمون، ویژگی تغییرناپذیر آن نیست بلکه تحت تأثیر شرایط اجرای آزمون قرار دارد. بر اساس این نظریه، یک آزمون میتواند برای برخی مقاصد معتبر باشد ولی برای مقاصد دیگر کاملاً نامعتبر باشد. GT قابلیت کاربرد گستردهای دارد و در زمینههای متعددی به کار گرفته شده است.
مفاهیم و اصطلاحات در GT
بنا به گفتهی برنان (a2010) مهمترین وجه و ویژگی منحصر به فرد GT چارچوب مفهومی آن است.
لذا برای ارتباط برقرار کردن با این نظریه و درک چارچوب مفهومی آن، مفاهیم و اصطلاحات رایج در این نظریه جداگانه و با استفاده از مثال زیر شرح داده میشود.
مثال : از دانشآموزانی که در المپیاد زیستشناسی شرکت کرده بودند، خواسته شد به چند سوال تشریحی پاسخ دهند. هر یک از سوالات توسط دو ارزیاب، نمره گذاری میشود.
هدف اندازهگیری
هدف اندازهگیری عاملی است که عمدتاً روی آن متمرکز شده و میتواند هر چیزی باشد که مورد توجه اندازهگیری در یک وضعیت خاص قرار میگیرد. در بسیاری از وضعیتهای اندازهگیری، افراد هدف اندازهگیری هستند. هدف اندازهگیری در مثال ذکر شده، دانشآموزان هستند.
جامعه50
جامعه به اهداف اندازهگیری اختصاص دارد.
رویهها
مجموعهای از سطوح اندازهگیری که قصد آن است عملکرد آزمودنیها در این سطوح مورد سنجش قرار گیرد؛ ابعاد روش اندازهگیری؛ منابع بالقوهای از خطا در تعمیم.
مثال ذکر شده، دارای دو رویه است. رویهی سوال و رویه ارزیاب. هر یک از سوالات یک سطح اندازهگیری قابل قبول برای رویه سوال را میسازد. بدین ترتیب نمرهی مشاهده شدهی سوالات آزمون فرد، یک نمونه تصادفی از تمام سوالات ممکن یا جهان سوالات قابل قبول فرض میشود. همچنین هر فرد ارزیاب یک سطح اندازهگیری قابل قبول برای رویه ارزیاب است. نمرهی داده شده توسط این ارزیابان، یک نمونه تصادفی از تمام نمراتی است که توسط جهان ارزیابان قابل قبول به دست میآید.
جهان51
جهان نوعاً برحسب مجموعهای از سطوح اندازهگیری تعریف میشود که نسبت به سطوحی که از طریق اندازهگیریهای نمونه به دست میآید وسیعتر است.
جهان مشاهدات قابل قبول52
جهان مشاهدات قابل قبول بوسیله همه ترکیبات ممکن از سطوح رویه ها تعریف میشود. یک اندازه رفتاری (مثل نمره آزمون) به عنوان نمونهای از یک جهان مشاهدات قابل قبول تصور میشود که این جهان، شامل همه مشاهدات ممکن است که تصمیمگیرندگان جایگزینهای قابل قبولی از آن برای مشاهده موجود (تحت مطالعه) در نظر میگیرند (وب و شیولسون، 2005). جهان مشاهدات قابل قبول در مثال مذکور، شامل دو رویه سوال و ارزیاب است.
جهان تعمیم53
برنان (2001) بیان میکند جهان تعمیم، جهانی است که محقق قصد دارد نتایج یک روش اندازهگیری خاص را به آن تعمیم دهد. مجموعه کاملی از مشاهدات ممکن که قصد آن است به آن تعمیم داده شود. جهان

پایان نامه
Previous Entries تحقیق با موضوع آموزش و پرورش، کتابهای درسی، استعدادهای برتر، موسسات آموزش عالی Next Entries تحقیق با موضوع تحلیل داده، میانگین مجذورات، مدل ترکیبی، تعمیم پذیری