تحقیق با موضوع تعمیم پذیری، زیست شناسی، ادبیات فارسی، میانگین مجذورات

دانلود پایان نامه ارشد

دارد؟
اطلاعات کلی مربوط به طرح مشاهده و برآورد این مطالعه، در جدول زیر ارائه شده است.

جدول 4-12 : طرح مشاهده و برآورد مطالعه اندازهگیری برای درس زیست شناسی
رویه
برچسب
سطوح
جهان
مصححان
R
7
INF
جنسیت
G:R
2
2
دانش آموزان
S:G:R
30
INF
سوالات
I
78
INF

همانطور که در جدول بالا آمده است، هر کدام از 7 مصحح، به 30 دانشآموز دختر و 30 دانشآموز پسر برای درس زیستشناسی که دارای 78 سوال بوده است، نمره دادهاند. در این بین؛ رویههای مصححان، دانشآموزان و سوالات به عنوان رویههای تصادفی با جهانهایی نامحدود و جنسیت دانشآموزان به عنوان رویهی ثابت در نظر گرفته شدهاند. واریانس هر کدام از رویههای مورد مطالعه برآورد و در جدول زیر ارائه گردیده است.
جدول 4-13 : منابع تغییر درس زیست شناسی برای طرحهای اندازه گیری SGR/I، I/SGR، R/SGI
منبع تغییرات
مجموع مجذورات
درجه آزادی
میانگین مجذورات
مؤلفه ها
درصد

خطای استاندارد

تصادفی
مختلط
تصحیح شده

R

37/4
6
73/0
00013/0-
00009/0
00009/0
6/0
00016/0
G:R

48/9
7
35/1
00046/0
00046/0
00023/0
4/1
00027/0
S:G:R

07/115
406
28/0
00350/0
00350/0
00350/0
9/21
00025/0
I

67/57
77
75/0
00175/0
00175/0
00175/0
9/10
00028/0
RI

97/5
462
01/0
00003/0-
00004/0
00004/0
3/0
00002/0
GI:R

03/8
539
01/0
00015/0
00015/0
00008/0
5/0
00003/0
SI:G:R

27/322
31262
01/0
01031/0
01031/0
01031/0
4/64
00008/0
Total

87/522
32759




100

همانطور که نتایج تحلیل واریانس نشان میدهد، بزرگترین سهم از واریانس نمره کل 4/64 درصد است که در نتیجهی تعامل سوالات با دانشآموزان (SI:G:R) است. این مولفه با دیگر منابع واریانس ناشناخته و خطای تصادفی آمیخته است. در مرتبهی دوم، واریانس بین دانشآموزان S:G:R با 9/21 درصد و در مرتبهی سوم، واریانس بین سوالات I با 9/10 درصد قرار دارند. مولفههای واریانس مرتبط با مصححان، جنسیت دانشآموزان و تعاملات این دو با سوالات، کوچک است و سهم اندکی در واریانس نمره کل دارند به طوریکه در مجموع کمتر از 3 درصد واریانس کل را به خود اختصاص دادهاند.
آیا امکان مقایسه نمرات دانشآموزان به صورت معتبر وجود دارد؟
برای پاسخگویی به این سوال، رویهی دانشآموزان (درون جنسیت)، جنسیت (درون مصححان) و مصححان به عنوان رویه‏های تفکیکی محسوب میشوند.
جدول4-14 : مطالعه G برای طرح اندازه گیری SGR/I
منبع واریانس
واریانس تفکیکی
منبع واریانس

واریانس خطای نسبی
درصد
نسبی

واریانس خطای مطلق
درصد مطلق
R
00009/0

G:R
00023/0

S:G:R
00350/0


I

00002/0
4/14


RI

00000/0
4/0

00000/0
4/0


GI:R

00000/0
7/0

00000/0
6/0


SI:G:R

00013/0
8/98

00013/0
6/84
مجموع واریانس
00382/0

00013/0
100

00016/0
100
انحراف استاندارد
06184/0

خطای استاندارد نسبی 01156/0

خطای استاندارد مطلق 01250/0
ضریب تعمیم پذیری نسبی
97/0
ضریب تعمیم پذیری مطلق
96/0
اثر تعاملی سوالات با دانشآموزان بزرگترین اثر منفی را در دقت اندازهگیری مطلق و نسبی نمرات دانشآموزان دارد. این مولفه 8/98% از واریانس خطای نسبی و 6/84% از واریانس خطای مطلق را به خود اختصاص داده است. همچنین، سهم رویهی سوالات از واریانس خطای مطلق 4/14% است.
واریانس تفکیکی بیش از 29 برابر واریانس نسبی و بیش از 23 برابر واریانس مطلق است. در ادامه، نتایج مطالعهی G نشان میدهد که اندازهی هر دو نوع ضریب تعمیمپذیری برای اندازهگیری نسبی و مطلق، بیش از 95/0 است که میتوان نتیجه گرفت؛ اندازهگیری نمرات دانشآموزان از اعتبار بالایی برخوردار است. اگر هدف مقایسهی نمرات دانشآموزان در درس زیستشناسی با یکدیگر باشد، ضریب تعمیمپذیری نسبی نشان میدهد که با ضریب اعتبار (97/0) بالا، امکان تفکیک نمرات زیستشناسی دانشآموزان وجود دارد. حتی اگر هدف مشخص کردن جایگاه یک دانشآموز در مقیاس نمره زیستشناسی باشد، مقدار ضریب مطلق (96/0) نشان میدهد که به صورت معتبری امکانپذیر است.
آیا میتوان دشواری سوالات زیستشناسی را به طور معتبری اندازهگیری کرد؟
برای پاسخگویی به این سوال، میتوان طرح اندازهگیری I/SGR را آزمون کرد که رویهی سوالات به عنوان رویهی تفکیکی در نظر گرفته شده است. جدول 4-15، نتایج مطالعهی G مربوط به این طرح را نشان میدهد.
جدول 4-15 : مطالعه G برای طرح اندازه گیری I/SGR
منبع واریانس
واریانس تفکیکی
منبع واریانس

واریانس خطای نسبی
درصد
نسبی

واریانس خطای مطلق
درصد مطلق


R

00001/0
7/25


G:R

(00000/0)
0/0


S:G:R

00001/0
8/15
I
00175/0


RI

00001/0
2/20

00001/0
8/11


GI:R

(00000/0)
0

(00000/0)
0


SI:G:R

00002/0
8/79

00002/0
6/46
مجموع واریانس
00175/0

00003/0
100

00005/0
100
انحراف استاندارد
04186/0

خطای استاندارد نسبی
00555/0

خطای استاندارد مطلق
00725/0
ضریب تعمیم پذیری نسبی
98/0
ضریب تعمیم پذیری مطلق
97/0
در این روش اندازهگیری، منابع تشکیل دهندهی واریانس خطای مطلق عبارتند از: اثر تعاملی سوالات با دانشآموزان(6/46%)، مصححان(7/25%)، دانشآموزان(8/15%) و اثر تعاملی سوال با مصححان(8/11%). همچنین اثر تعاملی سوالات با دانشآموزان با 8/79 %، بزرگترین اثر منفی را در دقت اندازهگیری نسبی دشواری سوالات دارد. اثر تعاملی سوالات و مصححان نیز با 2/20% سهم قابل توجهی در واریانس خطای نسبی دارد. با این وجود، هر دو واریانس خطای نسبی و مطلق در در مجموع، کمتر از 5 درصد از واریانس کل را به خود اختصاص دادهاند. همانطور که نتایج مطالعه ی G در جدول 4-15 نشان میدهد، هر دو ضرایب تعمیمپذیری بدست آمده برای اندازهگیری نسبی و مطلق سوال اختلاف ناچیزی با هم داشته و خیلی نزدیک به یک است. بنابراین میتوان نتیجه گرفت که نه تنها قرار دادن سوالات زیستشناسی بهطور معتبری در مراتب دشواری (از آسانترین به مشکلترین- اندازهگیری نسبی) امکانپذیر است بلکه به طور رضایتبخشی و با دقت بالا میتوان دشواری سوال را برای سوالات مختلف زیستشناسی فراهم کرد.
آیا نمرات اختصاص داده شده توسط مصححان، اعتبار لازم را دارد؟
برای پاسخ به این سوال، مصححان به عنوان رویه تفکیکی در نظر گرفته شدهاند.
جدول4-16 : مطالعه G برای طرح اندازه گیری R/SGI
منبع واریانس
واریانس تفکیکی
منبع واریانس

واریانس خطای نسبی
درصد
نسبی

واریانس خطای مطلق
درصد مطلق
R
00009/0


G:R

(00000/0)
0

(00000/0)
0


S:G:R

00006/0
5/95

00006/0
8/69


I

00002/0
9/26


RI

0
9/0

0
7/0


GI:R

(00000/0)
0

(00000/0)
0


SI:G:R

0
6/3

0
6/2
مجموع واریانس
00009/0

00006/0
100

00008/0
100
انحراف استاندارد
00973/0

خطای استاندارد نسبی
00782/0

خطای استاندارد مطلق
00914/0
ضریب تعمیم پذیری نسبی
61/0
ضریب تعمیم پذیری مطلق
53/0
نتایج مطالعهی G ارائه شده در جدول 4-16 نشان میدهد، هر دو واریانس خطای نسبی و مطلق در مجموع، 87/60% از واریانس کل را به خود اختصاص دادهاند. همچنین، ضرایب تعمیمپذیری به دست آمده برای اندازهگیری نسبی و مطلق، کمتر از 70/0 است و حاکی از عدم اعتبار نمرهگذاری مصححان است. پایین بودن ضرایب تعمیمپذیری را میتوان این گونه تبیین کرد؛ انحراف استاندارد مرتبط با رویهی تفکیکی (009/0) خیلی پایین است. یعنی، تفاوتهای نمرهگذاری بین مصححان خیلی کوچک است، یا به این دلیل است که بیشتر مصححان در نمرهگذاریهایشان مشابه هستند یا به دلیل خطای اندازهگیری بالا، تفاوتها ظاهر نشدهاند. علاوه بر این، عاملی که به طور منفی بر روی مقدار ضرایب تاثیر میگذارد، اندازهی اثر دانشآموز است که سهم چشمگیری در واریانس خطای نسبی و مطلق دارد و منبع اصلی بیدقتی در اندازهگیری است. همچنین، عامل سوال با 9/26% سهم قابل توجهی در واریانس خطای مطلق دارد.
با تغییر تعداد سطوح رویهها، چه تغییری در اندازه ی ضرایب تعمیمپذیری بوجود میآید؟
پاسخگویی به این سوال، مستلزم انجام مطالعهی D (طرح بهینهسازی) است که برای هر طرح اندازهگیری و به دنبال مطالعهی G انجام گرفته است.
در طرح اندازهگیری SGR/I با کاهش سطوح رویهی ابزاری(سوالات) به یک دوم،یک سوم و یک چهارم، اندازهی ضریب تعمیمپذیری نسبی در مطالعهی G (97/0) به ترتیب به 93/0، 91/0 و 88/0 میرسد و همچنین اندازهی ضریب تعمیمپذیری مطلق در مطالعهی G (96/0) بهترتیب به 92/0، 89/0 و 86/0 کاهش پیدا میکند. با وجود کاهش تعداد سوالات از 78 به 15 باز ضرایب تعمیمپذیری بالاتر از حداقل حد مطلوب پذیرفته شده(80/0) میباشند.
در طرح اندازهگیری I/SGR، اگر تعداد مصححان از 7 به 3 و همزمان تعداد دانشآموزان نیز از 30 به 15 برسد، هر دو ضرایب تعمیمپذیری با وجود کاهش در اندازه، همچنان 90/0 به بالا هستند. علاوه بر این، اگر در سطوح رویهی دانشآموزان تغییری ایجاد نشود و سطوح مصححان به دو نفر کاهش پیدا کند، اندازهی ضریب تعمیمپذیری نسبی از 98/0 به 94/0 و ضریب تعمیمپذیری مطلق از 97/0 به 90/0 میرسد.
در طرح اندازهگیری R/SGI، با کاهش همزمان تعداد سطوح رویههای ابزاری به یک چهارم ، میزان ضرایب تعمیمپذیری به اندازهی 10/0 کاهش مییابد. همچنین با کاهش یک سومی سطوح، ضرایب تعمیمپذیری به یک دوم مقدار فعلیشان کاهش پیدا میکنند. اگر تعداد سطوح سوالات ثابت نگه داشته شود و تعداد دانشآموزان به دو برابر افزیش یابد، ضریب تعمیمپذیری نسبی از 61/0 به 75/0 و ضریب تعمیمپذیری مطلق از 53/0 به 64/0 میرسد که همچنان پایینتر از حداقل حد مطلوب پذیرفته شده است. اگر تعداد سطوح دانشآموزان به سه برابر افزایش یابد اندازهی ضریب تعمیمپذیری نسبی به حد قابل قبول میرسد ولی ضریب مطلق همچنان در سطح نامطلوب و ناکافی قرار میگیرد.
سوال : آیا سوالات امتحانات نهایی بر اساس نظریه کلاسیک از ویژگیهای روانسنجی مطلوب برخوردارند؟
در پاسخ به این سوال بعد از محاسبه اعتبار آزمون، آن را با استفاده از روش لوپ مورد بررسی قرار داده و سپس به شاخصهای آماری سوالات که شامل درجه دشواری و ضریب تمیز سوال است، براساس دادههای خام و کد گذاری شده اشاره میشود.
تحلیل سوالات آزمون ادبیات فارسی بر اساس مدل کلاسیک
الف) اعتبار بر اساس روش لوپ
این تحلیل ما را در شناسایی سوالاتی که نقش مهمی در هماهنگی با کل آزمون ایفا می کنند و سوالاتی که اثری بر اعتبار آزمون ندارند کمک می کند. ضریب اعتبار کل آزمون با استفاده از فرمول آلفای کرونباخ، (956/0 = α) بدست آمد. سپس بعد از حذف هر سوال میزان اعتبار آزمون مجدداً مورد بررسی قرار گرفت که نتایج آن در جدول زیر آمده است.
جدول4-17: میزان اعتبار به روش لوپ در آزمون ادبیات فارسی
سوال حذف شده
میزان اعتبار
سوال حذف شده
میزان اعتبار
سوال حذف شده
میزان اعتبار
سوال حذف شده
میزان اعتبار
1
956/0
16
955/0
30
955/0
43 الف
955/0
2
956/0
17
955/0
31
955/0
43 ب
955/0
3
956/0
18
955/0
32
955/0
44 الف
955/0
4
956/0
19
955/0
33
955/0
44 ب
955/0
5
955/0
20
956/0
34
955/0
a45
955/0
6
955/0
21
955/0
35
955/0
b45
955/0
7
955/0
22
955/0
36
956/0
46
955/0
8
955/0
23
955/0
a37
955/0
47 الف
955/0
9
955/0
24
955/0
b37
955/0
47 ب
955/0
10
955/0
25
956/0
38 الف
955/0
47 پ
955/0
11
955/0
26
955/0
38

پایان نامه
Previous Entries تحقیق با موضوع تعمیم پذیری، ادبیات فارسی، میانگین مجذورات، زیست شناسی Next Entries تحقیق با موضوع ادبیات فارسی، زیست شناسی، توزیع فراوانی