امروز دوشنبه 04 مهر 1401

کاربرد “اندازه اثر” در روش شناسی DIF

0

کاربرد “اندازه اثر” در روش شناسی DIF
به طور کلی توصیه شده است که در زمان کار با آزمون‏های آماری، نتیجه را در آن زمینه‏ی خاص از طریق اندازه های اثر آزمون کرد(کیرک،1996)، چون در حجم ها ی پایین نمونه ممکن است از لحاظ آماری نتایج معنادار نباشد؛ حال آنکه اندازه‏ی اثر معنادار باشد، از طرف دیگر ممکن است حجم بالای نمونه به طور کاذب منجر به معناداری نتایج شود؛ حال آنکه اندازه‏ی اثر مقدار کوچکی داشته باشد. بنابراین توصیه شده که در مطالعات DIF، اندازه‏ی اثر به همراه آزمون معناداری ارائه شود و این منجر به قضاوت صحیح‏تر در مورد حضور یا عدم حضور DIF در یک سوال می‏شود، علاوه بر اینکه شناسایی نتایج غلط ممکن می‏شود.
جودوین و گیرل(2001) به منظور ارزشیابی خطای نوع اول و توان آزمون “اندازه اثر”LR DIF  مطالعات شبیه سازی شده را انجام دادند. آماره‏ی حداقل مجذورات وزنی، مقدار DIF یکنواخت و غیر یکنواخت را به صورت کمی ارائه می‏دهد. این آماره به عنوان “اندازه‏ی اثر” روش LR DIF محسوب می‏شود. زومبو و توماس(1996) مشخص کردند برای آزمون معناداری DIF رگرسیون لجستیک به دو آزمون 〖 x〗^2با دو درجه آزادی و یک اندازه از بزرگی اثر احتیاج است. آنها برای ‏اندازه گیری ‏”اندازه اثر” در رگرسیون لجستیک R2 را بر آماره‏های دیگر ترجیح دادند. برای این که ‏یک سوال به عنوان سوال دارای DIF تشخیص داده شود باید آزمون مجذور خی با دو درجه‏ی آزادی در رگرسیون لجستیک ارزش P  کمتر یا برابر 01/0 داشته باشد و همچنین “اندازه اثر” زومبو و توماس حداقل از 13/0 بیشتر باشد. تحقیقات پاپ و همکاران (1997) نشان داده است که مقیاس “اندازه اثر” زومبو و توماس همبستگی بالایی با تکنیک های دیگر DIF از قبیل منتل هنزل و SIBTEST دارد.x^2  با دو درجه‏ی آزادی  می‏تواند به دو آزمون با یک درجه آزادی برای آزمون‏های یکنواخت و غیر یکنواخت تبدیل شود(جودوین و گیرل، 2001). جودوین و گیرل(2001) دریافتند که اگر آزمون‏های یکنواخت و غیر یکنواخت در تعامل با “اندازه‏ی اثر” به دو آزمون جدا تبدیل شوند، روش اتخاذ شده منجر به قدرت بیشتری در کشف DIF یکنواخت و غیر یکنواخت نسبت به زمانی خواهد شد که از یک آزمون x^2 با دو درجه‏ی آزادی استفاده می‏کنیم. این وضعیت حتی زمانی که از نمونه‏های با حجم کوچک استفاده می‏کنیم نیز صادق است. آنها ذکر می‏کنند اگر “اندازه اثر” برای LR DIF وجود داشته باشد می‏توان آزمون x^2 با دو درجه آزادی را به دو آزمون جداگانه با یک درجه آزادی تبدیل کرد. آنها دریافتند در صورتی که آزمون‏های یکنواخت و غیر یکنواخت در دو آزمون جداگانه باشند و در عین حال از طریق “اندازه‏ی اثر” به هم مربوط شوند، نتایج برآمده نسبت به زمانی که آزمون‏های با دو درجه آزادی استفاده می‏شود، قدرت بالاتری در کشف DIF یکنواخت و غیر یکنواخت خواهند داشت، حتی اگر حجم نمونه کوچک تر شود. به دلیل توان بالای آزمون‏های با یک درجه آزادی جودوین و گیرل(2001) استفاده از آزمون‏های با یک درجه آزادی را برای کشف DIF یکنواخت و غیر یکنواخت پیشنهاد کردند. این آزمون‏ها احتمال کشف DIF یکنواخت و غیر یکنواخت را افزایش داده و میزان خطای نوع اول را کاهش می‏دهد. توضیح “اندازه‏ی اثر”R2 ∆ برای LR DIF  در ادامه می‏آید.
R2∆:  اندازه ا ثر LR DIF 
فرمول LR DIF  براساس بیان سوامیناتان و رگرز(1990) به صورت زیر است:
P(uij = 1|өij) = e(βoj+ β1jө1j)/[1 + e(βoj+ β1jө1j)],

J=1,2 & i=1,….,nj

B0پارامتر قاطع(عرض از مبدا)، B1 پارامتر شیب، u پاسخ به سوال و θ توانایی فرد می‏باشند. اگر چه این معادله خطی نیست اما توسط زومبو و توماس(1996) به صورت خطی تبدیل شده است. مدل معادله خطی به صورت زیر است:
Ln (P/1-P) =τ0 +τ1 +τ2g +τ3 (өg).
P احتمال پاسخ صحیح به سوالات وg   بیانگر عضویت در گروه g است.
زمانی که از نتایج پرگیبون (1998) مربوط به بردار برآورد درستنمایی بیشینه، تاو، برای ضریب LR در معادله‏ی بالا استفاده می‏شود، معادله تبدیل به ‏یک مدل حداقل مجذورات وزنی می‏شود. فرمول برای برآورد پیشینه‏ی درستنمایی، تاو(τ) به صورت زیر است:
τ = (X’VX)-1 X’Vz
که در آنXτ+ V-1  Z= و  r=(u=p)، v یک ماتریس قطری N*N با مولفه‏های Pi(1-Pi) می‏باشد،I=1,.......,N   یک ماتریس داده‏های N*4 است که ردیف های آن (1,θI,gi,θigi) می‏باشد. P یک بردارN*1  از ارزش‏های برازش یافته‏ی مدل LR است، U یک بردار N*1 از پاسخ آزمودنی‏ها و N جمع حجم نمونه مربوط به گروه‏های هدف و مرجع است(جودوین و گیرل، 2001).
به منظور توضیح LR DIF از طریق مدل حداقل مجذورات، زومبو و توماس(1996) بوسیله‏ی هندسه‏ی مربوط به حداقل مجذورات ثابت کردند که اضافه کردن متغیرهای توضیحی و تبیینی می‏تواند ایده‏ی قابل قبولی باشد.
جودوین(2001) R12 و R22 را مجموع حاصل ضرب ضرایب رگرسیونی استاندارد شده برای متغیرهای می‏داند. زومبو و توماس(1996) به منظور اهداف مقایسه ای‏”اندازه اثر” حداقل مجذورات وزنی(R2Δ)، دست به طبقه‏بندی این “اندازه اثر” زدند. زویک و اریکان(1989) نیز دست به طبقه‏بندی لگاریتم نسبت شانس Δα(MH) زدند. بر اساس این طبقه‏بندی‏ها مقدار R2Δ کمتر از 0.13 ضعیف و قابل اغماض، R2Δ بین 0.13 تا 0.26 متوسط و R2Δ  بیشتر از 0.26 بزرگ است. برای Δα(MH) مقدار کمتر از |1| ضعیف، بین |1| و |1.5|  متوسط و مقدارDIF  بزرگ بیشتر از |1.5| است.
 “اندازه اثر”، R2Δ از طریق تجربی و مطالعات شبیه سازی شده مورد تحقیق قرار گرفته و با  SIBTEST   مقایسه شده است. SIBTEST و “اندازه اثر” LR DIF رابطه غیر خطی(انحنایی) با یکدیگر دارند. “اندازه‏ی اثر” LR DIF نیاز به مطالعه‏ی بیشتر و مقایسه‏ی آن با روش‏های مشابه DIF مانند روش MH DIF دارد.