امروز دوشنبه 04 مهر 1401

lهم خطی چندگانه

0

بسم الله الرحمن الرحیم

هم خطی چندگانه

در تمام فنون چندگانه مفرضه ای مورد نظر است که متاسفانه از دید پژوهشگران مورد غفلت واقع شده است و در بررسی پیش فرض های روش های چندگانه یا همان چند متغییری کمتر مورد توجه بوده است. متغیرهای پیش بین و یا متغییرهای کواریانس نباید همبستگی بالایی با یکدیگر داشته باشند. وجود همبستگی های بالا به این معنی است که متغییرهای دارای همبستگی بالا یا به تعبیر دیگر متغییرهای دارای هم خطی چندگانه واریانس مشابهی را در Y  تبیین می کنند. این امر در رگرسیون چندگانه از طریق آماره ای به نام تولرانس یا تحمل سنجیده می شود. تولرانس یک متغییر پیش بین از طریق انجام تحلیل رگرسیون در حالتی که متغییرهای دیگر به آن برگشت داده می شوند محاسبه می شود. این مشخصه نشان می دهد که آن متغییر تا چه حد می تواند توسط سایر متغییرهای پیش بین موجود در الگو پیش بینی شود. هر چه تولرانس بالاتر باشد نشان می دهد که میزان هم پوشی با سایر متغییرهای پیش بین کمتر است. 

یکی دیگر از مشکلات موجود در هم خطی چندگانه این است که همبستگی بالای متغییرهای پیش بین با یکدیگر خطای استاندار ضرایب آنها را متورم می سازد. یعنی مقادیر آن متغییرها احتمالا در جریان تکرار 

پژوهش نوسان خواهد داشت. این مساله به عامل تورم واریانس که به صورت VIF نیز نشان داده می شود مشهور است و از طریق 1تقسیم بر R2-1محاسبه می شود. بنابراین از مقادیر بزرگ باید اجتناب شود. مثلا باید از مقادیر بزرگتر از 10 اجتناب شود. 

سه روش معمول در مواجهه با همبستگی های بالای متغییرهای پیش بین وجود دارد. اول خارج کردن یکی از آنها از معادله. دوم ترکیب آنها با یکدیگر و سوم استفاده از روشی به نام روش رگرسیون کمکی یا همان رگرسیون RIDGE.