
۳-۲۰ آزمونهای مربوط به مفروضات مدل رگرسیون خطی
برای اینکه در مدل رگرسیون خطی، تخمین زنهای حداقل مربعات معمولی ضرایب رگرسیون، بهترین تخمین زنهای بدون تورش خطی (BLUE) باشند لازم است تا مفروضات این مدل به صورت زیر بررسی و آزمون شوند:
۳-۲۱- فرض نرمال بودن باقیماندهها
یکی دیگر از مفروضات در نظر گرفته شده در رگرسیون آن است که خطاها دارای توزیع نرمال با میانگین صفر میباشند. بدیهی است در صورت عدم برقراری این پیش گزیده نمیتوان از رگرسیون استفاده کرد. بدین منظور باید مقادیر استاندارد خطاها محاسبه شود و نمودار توزیع دادهها و نمودار نرمال آنها رسم شود و سپس مقایسهای بین دو نمودار صورت گیرد. باید میانگین دادهها کوچک و نزدیک به صفر بوده و انحراف از معیار آن نیز نزدیک به یک باشد. این آزمون و همچنین رسم نمودارها به وسیله نرمافزار Spss قابل اجرا میباشد.
علاوه بر این برای آزمون نرمال بودن باقیماندهها از آزمون کولموگروف – اسمیرنوف استفاده میشود که یک نوع آزمون ناپارامتریک میباشد. محاسبه آماره این آزمون توسط نرم افزار Spss امکانپذیر میباشد.
نحوه داوری: در صورتی که مقدار آماره ارائه شده توسط این آزمون بیشتر از ۵% باشد، فرض صفر آماری مبنی بر نرمال بودن توزیع متغیر مورد بررسی با اطمینان ۹۵% پذیرفته میشود.
۳-۲۲- فرض عدم وجود هم خطی[۹۷] بین متغیرهای مستقل
هم خطی وضعیتی است که نشان میدهد یک متغیر مستقل تابعی خطی از سایر متغیرهای مستقل است. اگر هم خطی در یک معادله رگرسیون بالا باشد بدین معنی است که بین متغیرهای مستقل همبستگی بالایی وجود دارد و ممکن است با وجود بالا بودن ، مدل دارای اعتبار بالایی نباشد. به عبارتی دیگر با وجود آنکه مدل خوب به نظر میرسد ولی دارای متغیرهای مستقل معناداری نمیباشد و این متغیرها بر یکدیگر تأثیر میگذارند. این آزمون نیز به وسیله نرم افزار Spss قابل اجراست. نتایج این آزمون، ۴ خروجی میباشد. در دو خروجی اول تولرانس[۹۸] و عامل تورم واریانس (VIF) ارائه میشود. هر چه قدر تولرانس کمتر (نزدیک به صفر) باشد، اطلاعات مربوط به متغیرها کم بوده و مشکلاتی در استفاده از رگرسیون ایجاد میشود.
عامل تورم واریانس نیز معکوس تولرانس بوده و هر چه قدر افزایش یابد واریانس ضرایب رگرسیون افزایش یافته و رگرسیون را برای پیشبینی نامناسب سازد.
دو خروجی دیگر مقدار ویژه[۹۹] و شاخص وضعیت[۱۰۰] را نشان میدهد. مقادیر ویژه نزدیک به صفر نشان میدهد همبستگی داخلی پیشبینیها زیاد است و تغییرات کوچک در مقادیر داده به تغییرات بزرگ در برآورد ضرایب معادله رگرسیون منجر میشود. شاخصهای وضعیت با مقدار بیشتر از ۱۰ نشان دهنده احتمال هم خطی بین متغیرهای مستقل میباشد و مقدار بیشتر از ۳۰ بیانگر مشکل جدی در استفاده از رگرسیون در وضعیت موجود آن است.
یکی دیگر از راههای شناسایی رابطه هم خطی یا عدم هم خطی، بررسی رابطه همبستگی بین متغیرهای مستقل است.
۳-۲۳- فرض مستقل بودن باقیماندهها
یکی از مفروضاتی که در رگرسیون مدنظر قرار میگیرد، استقلال خطاها (تفاوت بین مقادیر واقعی و مقادیر پیشبینی شده توسط مدل رگرسیون) از یکدیگر است. در صورتی که فرضیه استقلال خطاها رد شود و خطاها با یکدیگر همبستگی داشته باشند امکان استفاده از رگرسیون وجود ندارد. برای بررسی استقلال خطاها از یکدیگر از آزمون دوربین – واتسون استفاده میشود. آماره این آزمون در دامنه ۰ و ۴+ قرار میگیرد. چنانچه این آماره در بازه ۵/۱ تا ۵/۲ قرار گیرد، فرض (عدم همبستگی بین خطاها) پذیرفته شده و میتوان از رگرسیون استفاده نمود. در صورت رد فرض فوق همبستگی بین خطاها وجود داشته و نمیتوان از مدل استفاده نمود. این آزمون نیز توسط نرم افزار Spss قابل اجرا میباشد (مومنی و فعال قیومی، ۱۳۸۶).
نحوه داوری: اگر مقدار آماره دوربین واتسون مابین عدد ۵/۱ و ۵/۲ باشد، میتوان استقلال باقیماندهها را بپذیریم.
۳-۲۴- فرض عدم وجود ناهمسانی واریانسها[۱۰۱] میان باقیماندهها
با توجه به استفاده از روش دادههای پانل برای آزمون ناهمسانی واریانس بین گروهی از آماره ضریب لاگرانژ[۱۰۲] (LM) استفاده شده است. این آماره پس از انجام OLS کلی روی مدل مورد نظر، با استفاده از
دادههای تلفیقی به صورت زیر قابل محاسبه خواهد بود:
که در آن T تعداد سالهای سری زمانی، واریانس حاصل از برآورد کلی مدل، و واریانس تک تک
واحدهای مقطعی میباشد. آماره LM به طور مجانبی، دارای توزیع «کای- دو» با درجه آزادی N-1 خواهد بود (N برابر با تعداد واحدهای مقطعی میباشد).
نحوه داوری: در آزمون فرضیه، اگر مقدار آماره محاسباتی از مقدار بحرانی جدول در سطح اطمینان بزرگتر باشد، فرضیه رد شده و ناهمسانی واریانس بین واحدهای مقطعی تأیید میشود که باید برای رفع آن بر اساس روشهای موجود اقدام نمود. در صورتی که مقدار آماره محاسبه شده از مقدار بحرانی جدول در سطح اطمینان ۹۵% کوچکتر باشد فرضیه پذیرفته میشود و میتوان با اطمینان ۹۵% وجود ناهمسانی واریانس بین واحدهای مقطعی را رد کرد.
۳- ۲۵ فرض عدم وجود خطای تصریح مدل و خطی بودن مدل:
عدم وارد کردن متغیرهایی که باید در معادله لحاظ شوند (به علت عدم آگاهی از وجود آنها، در دسترس نبودن اطلاعات مربوط به آنها و…)، اضافه کردن متغیری که لازم نیست در معادله جای بگیرد، انتخاب فرم تبعی غلط (مثلاً انتخاب فرم خطی به جای لگاریتمی و…) و غیره باعث به وجود آمدن خطای تصریح در مدل میگردند که هر یک از انواع این خطاها میتواند مشکلات مختلفی را برای مدل به وجود بیاورد. بنابراین لازم است تا پس از برآورد مدل نسبت به آزمون عدم وجود خطای تصریح در آن اقدام نمود. یکی از آزمونهایی که در زمینه بررسی خطای تصریح در مدل بکار گرفته میشود آزمون رمزی[۱۰۳] است که یک آزمون عمومی برای کشف انواع خطای تصریح موجود در مدل بوده و در این تحقیق نیز مورد استفاده قرار میگیرد. فرضیه آماری این آزمون به صورت زیر بیان میشود:
مراحل انجام این آزمون به شرح ذیل است:
به دست آوردن Y های تخمینی ( ها)
برآورد مجد مدل به صورت
محاسبه آماره آزمون به صورت:
که در آن F آماره آزمون رمزی میباشد. ضریب تعیین معادله جدید و ضریب تعیین معادله اولیه است. به تعداد متغیرهای توضیحی اضافه شده در مدل جدید و بر تعداد پارامترها در مدل جدید اشاره دارد.
حال اگر F محاسباتی از F جدول بزرگتر باشد، آنگاه در مدل خطای تصریح وجود دارد. در این تحقیق برای بررسی خطای تصریح در مدل از آزمون رمزی استفاده میشود.
فصل چهارم :
تجزیه و تحلیل داده ها
۴-۱- مقدمه
تجزیه و تحلیل دادهها فرایندی چند مرحلهای است که طی آن دادههایی که به طرق مختلف جمعآوری شدهاند؛ خلاصه، دستهبندی و در نهایت پردازش میشوند تا زمینه برقراری انواع تحلیلها و ارتباط بین دادهها به منظور آزمون فرضیهها فراهم آید. در این فرایند، دادهها هم از لحاظ مفهومی و هم از جنبه تجربی پالایش میشوند و تکنیکهای گوناگون آماری نقش به سزایی در استنتاجها و تعمیم به عهده دارند (خاکی، ۱۳۸۴، ص ۳۰۵). در این فصل با استفاده از دادههای جمع آوری شده از نمونه آماری تحقیق که شامل ۱۰۱ شرکت در دوره زمانی ۱۳۸۵-۱۳۹۰ میباشد، فرضیههای تحقیق مورد آزمون قرار میگیرند. روش آزمون فرضیات در مطالعه حاضر روش دادههای پانل[۱۰۴] میباشد که با بهرهگیری از نرمافزارهای ۲۰ Spss، Eviews 7 و ۱۶ Minitab انجام خواهد شد. در ادامه ابتدا به منظور کسب شناخت بیشتر درباره جامعه آماری و متغیرهای مورد مطالعه، خلاصهای از آمار توصیفی متغیرهای تحقیق ارائه و نرمال بودن توزیع متغیرهای وابسته آزمون میگردد. سپس بر اساس طبقهبندی صورت گرفته در خصوص فرضیههای تحقیق، به گزارش آزمون فرضیهها و تجزیه و تحلیل نتایج حاصل پرداخته میشود.
۴-۲- آمار توصیفی متغیرهای تحقیق
به طور کلی، روشهایی را که به وسیله آنها میتوان اطلاعات جمعآوری شده را پردازش کرده و خلاصه نمود، آمار توصیفی مینامند. این نوع آمار صرفاً به توصیف جامعه یا نمونه میپردازد و هدف از آن محاسبه پارامترهای جامعه یا نمونه تحقیق است (آذر و مؤمنی، ۱۳۸۹، ص ۸). در بخش آمار توصیفی، تجزیه و تحلیل دادهها با استفاده از شاخصهای مرکزی هم چون میانگین و میانه و شاخصهای پراکندگی انحراف معیار، چولگی[۱۰۵] و کشیدگی[۱۰۶] انجام پذیرفته است. در این ارتباط میانگین، اصلیترین شاخص مرکزی بوده و متوسط دادهها را نشان میدهد، به طوری که اگر دادهها بر روی یک محور به صورت منظم ردیف شوند، مقدار میانگین دقیقاً نقطه تعادل یا مرکز ثقل توزیع قرار میگیرد. انحراف معیار از پارامترهای پراکندگی بوده و میزان پراکندگی دادهها را نشان میدهد. چولگی نیز از پارامترهای تعیین انحراف از قرینگی بوده و شاخص تقارن دادههاست. در صورتی که جامعه از توزیع متقارن برخوردار باشد، ضریب چولگی مساوی صفر، در صورتی که جامعه چوله به چپ باشد، ضریب چولگی منفی و در صورتی که دارای چوله به راست باشد، ضریب چولگی مثبت خواهد بود. کشیدگی نیز شاخص سنجش پراکندگی جامعه نسبت به توزیع نرمال میباشد (مومنی و قیومی، ۱۳۹۰ ). خلاصه وضعیت آمار توصیفی مربوط به متغیرهای مدل پس از
غربالگری و حذف دادههای پرت[۱۰۷] به کمک نرم افزار ۲۰ Spss در نگاره ۴-۱ ارائه شده است.
نگاره ۴-۱، آمار توصیفی متغیرهای تحقیق
برای دانلود متن کامل این فایل به سایت torsa.ir مراجعه نمایید. |