امروز جمعه 02 آذر 1403

آزمون های نرمال بودن برای تحلیل های آماری

0

زمینه

خطاهای آماری در ادبیات علمی معمول هستند و حدود 50 درصد از مقالات منتشر شده دست کم یک خطا دارند. بسیاری از فرایندهای آماری همچون همبستگی، رگرسیون، آزمون T، و تحلیل واریانس یعنی آزمونهای پارامتری بر مبنای فرض توزیع نرمال یا توزیع گاوسی هستند به این معنا که جمعیتی که داده ها از آنها گرفته شدهاند، توزیع نرمال دارند. فرض نرمال بودن به ویژه زمان انجام فواصل مرجع برای متغیرها حیاتی هستند. نرمال بودن و فروض دیگر باید جدی گرفته شوند. زمانی که این فرضیات برقرار نیستند ناممکن است که نتایج دقیق و قابل اعتماد در مورد واقعیت به دست آوریم.

با حجم نمونههای به اندازه کافی بزرگ (بیش از 30 یا 40 مورد) انحراف از فرض نرمال بودن باعث مشکلات جدی نمی گردد. به این معنا که ما می توانیم پروسههای آماری را استفاده نماییم حتی هنگامی که دادهها توزیع نرمال ندارند. در نمونههای بزرگ، توزیع نمونهگیری تمایل به نرمال بودن دارد فارغ از شکل توزیع خود دادهها، و میانگین نمونههای تصادفی از هر توزیعی خود توزیع نرمال دارند.

با این همه، برای توزیع نرمال، ما به صورت دیداری و آمارههای معناداری نگاه می کنیم.

روشهای دیداری جهت توزیع دادهها استفاده می شوند هر چند این روشها معمولا غیرقال اتکا هستند و تضمین نرمال بودن توزیع را ندارند. توزیع فراوانی (هیستوگرام)، نمودار ساقه و برگ، نمودار جعبه، P-P نمودار (نمودار احتمال-احتمال) و نمودار Q-Q (نمودار چارک-چارکی) برای این مقصود استفاده می گردند.

نمودار P-P احتمال تجمعی یک متغیر را در برابر احتمال تجمعی یک توزیع خاص (مثلا توزیع نرمال) نشان می دهد.

بعد ازاین که دادهها رتبه بندی شده و ذخیره گردیدند، نمرات استاندارد متناظر برای هر رتبه محاسبه می گردد. در واقع، نمرات استاندار اصلی در برابر نمرات استاندار مورد انتظار به صورت نمودار ارایه می گردد. اگر دادهها دارای توزیع نرمال باشند، نتایج باید در خط مستقیم قطری باشد. نمودار Q_Qشبیه همین نمودار است.

آزمونهای نرمال بودن

مهمترین آزمون نرمال بودن، آزمون کولموگروف-اسمیرنوف است. آزمونهای دیگر شامل آزمون تصحیح لیلیفورس کولموگروف-اسمیرنوف، آزمون شپیرو ویلک و... می باشد. در این آزمونها، فرض صفر آن است که توزیع نمونه نرمال می باشد، پس اگر معناداری آزمون برقرار شود، توزیع غیرنرمال می باشد. برای نمونههای کوچک، این آزمونها قدرت کمتری برای رد فرض صفر دارند و اغلب باید نمونههای کوچک آزمون نرمال بودن را بگذراند. در نمونههای بزرگ، نتایج معناداری حتی در صورت تخطی اندک از نرمال بودن، به دست میآید. هر چند این انحراف اندک نتایج آزمونهای پارامتری را با مشکل مواجه نخواهد ساخت. آزمون کول-اسمیر یک تابع توزیع تجربی می باشد که در آن توزیع نظری تجمعی با توزیع آزمون در برابر توزیع تجربی قرار می گیرد. یک محدودیت آزمون حساس بودن بالا به مقادیر پرت است. تصحیح لیلیفورس این آزمون را با محافظهکاری کمتر انجام می دهد. گزارش شده است که این آزمون قدرت کمی دارد و نباید خیلی جدی مورد توجه قرار گیرد برای آزمون نرمال بودن. همچنین، توصیه نمی شود وقتی که پارامترها از دادهها برآورد می گردند فارغ از اندازه نمونه.

آزمون شپیرو ویلک قدرت بهتری را نسبت به آزمون کول-اسمیر دارد حتی بعد از تصحیح لیلیفورس. قدرت رایجترین اندازه آزمون نرمال بودن است.

تبلیغات متنی