
Sx = انحراف استاندارد متغیر مستقل
Xn…,X2,X1= متغیرهای مستقل
Bn,…,b2,b1= ضریبهای رگرسیون
xو= y میانگین مشاهدات مقادیرxو y میباشند.
فرضهای اساسی رگرسیون : در هر مدل رگرسیون خطی باید فرضهای خاصی برقرار باشد که در صورت نقض هر یک از آنها مشکلاتی درباره مطلوبیت برآورد پارامترهای رگرسیون، یا آزمون فرضیههـا به بــار می آید. مهمترین فرضهای اساسی رگرسیون عبارتنداز:
۱- میانگین جملات خطا(t ) مساوی صفر باشد : به علت تصادفی بودن t میتوان این فرض را به صورت۰= ( t E( نوشت. معنی این فرض آن است که، عوامل تشکیل دهنده خطاها، اثرات مثبت و منفی خود را طوری بر جا میگذارند که متوسط مقادیر جمله خطاها برابر صفر شود.
۲-کلیه داده ها(متغیرها)دارای توزیع نرمال باشد : جهت آزمون نرمال بودن داده ها از روش کولموگوروف- اسمیرنوف[۱۱۹] (K-S) استفاده شده است.
۳- جملات خطاها در مشاهدات مختلف ناهمبستهاند : اگر این فرض نقض شود با مسئلهای موسوم به خود همبستگی[۱۲۰] مواجه خواهیم بود. به طور کلی هرگاهt ها از نظم خاصی پیروی کنند، فرض ناهمبسته بودن t ها نقض شده، خود همبستگی مثبت، منفی یا تلفیقی ازخود همبستگی مثبت ومنفی را خواهیم داشت. جهت آزمون این خطا از روش دوربین- واتسون(D.W) استفاده میکنیم.
۴- بین متغیرهای مستقل هم خطی (همبستگی) وجود نداشته باشد: برای این کار تکنیکهای متعددی وجود دارد.یکی از معیارهای تشخیص هم خطی، مقدارR2 یا Fبسیار بزرگ ومقادیر کوچک t ودیگری شاخص وضعیت بالای۳۰ می باشد. نکته مهم دراین آزمون برخلاف سایر آزمونها این است که آیا این هم خطی حاد است یا خیر؟ حاد بودن هم خطی بیانگر مشکل جدی در استفاده از رگرسیون می باشد(مومنی و فعال قیومی،۱۲۸،۱۳۸۶).
۳-۶-۲- همبستگی
تحلیل همبستگی ابزاری آماری است که به وسیله آن میتوان درجهای که یک متغیر به متغیری دیگر، از نظر خطی، مرتبط است را اندازهگیری کرد. همبستگی معیاری برای تعیین میزان ارتباط دو متغیر بوده و معمولاً با تحلیل رگرسیون به کار برده میشود. موضوع همبستگی، با بحث درباره دو معیار ضریب تعیین (۲R) و ضریب همبستگی(r) به صورت زیر دنبال می شود (آذر و مومنی،۱۸۲،۱۳۸۳).
الف) ضریب همبستگی: ضریب همبستگی(r) ریشه دوم ضریب تعیین است که میتواند مقادیری بین ۱- و۱+ را به خود بگیرد. علامت آن، همان علامت شیب خط رگرسیون (b) است یعنی اگر شیب خط رگرسیون مثبت باشد ضریب همبستگی نیز مثبت، و اگر شیب خط رگرسیون منفی باشد ضریب همبستگی نیز منفی خواهد بود. همچنین اگر شیب خط رگرسیون صفر باشد ضریب همبستگی، صفر می گردد. ضریب همبستگی، شدت رابطه و همچنین نوع رابطه، را نیز نشان میدهد. لازم به ذکر است که ضریب تعیین در مقایسه با ضریب همبستگی، معیار گویاتری است.
ب) ضریب تعیین: ضریب تعیین(R2) مهمترین معیاری است که باآن میتوان رابطه بین دو متغیر x و y را توضیح داد که میزان انحراف مشاهدات (y) را با برآورد خط رگرسیون اندازه میگیرد. این ضریب، بین صفر تا یک در نوسان بوده بطوریکه مقدار صفر بیانگر آن است که خط رگرسیون هرگز نتوانسته است تغییرات y را به تغییرات متغیر مستقل x نسبت دهد. مقدار یک نیز بیانگر آنست که خط رگرسیون به طور دقیق توانسته است تغییرات y را به تغییرات x نسبت دهد.
ج) ضریب تعیین تعدیل شده: تفاوت بین ضریب تعیین و ضریب تعیین تعدیل شده می تواند ناشی ازحجم نمونه وتعدادمتغیرها باشد. درصورتی که نمونه کوچک باشد، ضریب تعیین تعدیل شده برای تفسیر مناسبتراست. با بزرگ شدن حجم نمونه این دوضریب به هم نزدیک میشوند.با افزودن تعداد متغیرها به مدل رگرسیون ، مقدار ضریب تعیین ممکن است افزایش یابد. اما درجه آزادی کمتر می شود. برای جلوگیری ازاین وضعیت و کنترل تورم(تورش) ضریب تعیین ، آماره دیگری به نام ضریب تعیین تعدیل شده مطرح می شود که مشکلات ضریب تعیین را برطرف میسازد(مومنی،۱۲۲،۱۳۸۶).
۳-۶-۳- روش آزمون فرضیهها (روش دادههای پانل)
برای آزمون فرضیههای تحقیق ابتدا لازم است فرضیههای پژوهشی تحقیق، به صورت فرضیات آماری بیان گردد. هدف از بیان فرضیههای پژوهشی تحقیق به صورت فرضیههای آماری، توانمند کردن محقق در آزمون کردن فرضیه است. مدلها از لحاظ استفاده از اطلاعات آماری به سه گروه تقسیم میشوند. برخی از مدلها با استفاده از «اطلاعات سری زمانی[۱۲۱]» یا به عبارتی طی دوره نسبتاً طولانی چند ساله برآورد میشوند. بعضی دیگر از مدل ها بر اساس «دادههای مقطعی[۱۲۲]» برآورد می شوند یعنی متغیرها در یک دوره زمانی معین برای مثال یک هفته، یک ماه یا یک سال در واحدهای مختلف بررسی میشوند. روش سوم برآورد مدل، که در این پژوهش نیز مورد استفاده قرار گرفته است، برآورد بر اساس «دادههای پانل[۱۲۳]» است. در این روش یک سری واحدهای مقطعی (برای مثال شرکت ها) در طی چند سال مورد توجه قرار میگیرند. با کمک این روش که در مطالعات سالهای اخیر نیز زیاد استفاده شده است تعداد مشاهدات تا حد مطلوب افزایش مییابد. مهمترین مزیت استفاده از دادههای پانل، کنترل نمودن ویژگیهای ناهمگن و در نظر گرفتن تک تک افراد، شرکتها، ایالات و کشورها میباشد. در حالی که در مطالعات مقطعی و سری زمانی این ناهمگنی کنترل نمیگردد و با تخمین مدل با استفاده از این روشها احتمال اریب بودن نتایج، میباشد. بنابراین با توجه به اینکه مشاهدههای ادغام شده باعث تغییرپذیری بالاتر، همخطی چندگانه کمتر میان متغیرهای توضیحی، درجه آزادی بیشتر و کارآیی بالاتر تخمین کنندهها میشود، مطالعات پانل نسبت به مطالعات مقطعی و سری زمانی دارای مزیت است (بالتاجی[۱۲۴]، ۲۰۰۸).
۳-۶-۳-۱- روش اثراث ثابت
در روش اثرات ثابت فرض بر این است که ضرایب مربوط به متغیرها (شیبها) ثابت هستند و اختلافات بین واحدها را میتوان به صورت تفاوت عرض از مبداء نشان داد. در این حالت اگر عرض از مبداء تنها برای واحدهای مختلف مقطعی متفاوت باشد اصلاحاً روش اثرات ثابت یکطرفه[۱۲۵] نامیده شده و مدل آن بهصورت زیر میباشد:
و اگر عرض از مبداء هم ما بین مقاطع و هم مابین دورهها متفاوت باشد روش اثرات ثابت دوطرفه[۱۲۶] نامیده می شود و مدل آن بصورت زیر خواهد بود:
در مدل های فوق متغیری است که برای واحدهای مقطعی متفاوت اما در طول زمان ثابت میباشد و متغیری است که برای تمام واحدهای مقطعی در زمان مشابه یکسان بوده اما در طول زمان تغییر میکند. برای برآورد روش اثرات ثابت از مدل حداقل مربعات متغیر مجازی[۱۲۷] (LSDV) استفاده میشود. مدل اخیر یک مدل رگرسیونی کلاسیک بوده و هیچ شرط جدیدی برای تجزیه و تحلیل آن لازم نیست و از طریق روش حداقل مربعات معمولی[۱۲۸] قابل برآورد میباشد.
۳-۶-۳-۲- آزمون چاو[۱۲۹] یا F مقید
در بررسی دادههای مقطعی و سریهای زمانی، اگر ضرایب اثرات مقطعی و اثرات زمانی معنیدار نشود، میتوان دادهها را با یکدیگر ترکیب کرده و به وسیله یک رگرسیون حداقل مربعات معمولی تخمین بزنیم. از آنجایی که در اکثر دادههای ترکیبی اغلب ضرایب مقاطع یا سریهای زمانی معنیدار هستند این مدل که به مدل رگرسیون ترکیب شده[۱۳۰] معروف است کمتر مورد استفاده قرار میگیرد (یافی[۱۳۱]، ۲۰۰۳). بنابراین برای اینکه بتوان مشخص نمود که آیا دادههای پانل برای برآورد تابع موردنظر کارآمدتر خواهد بود یا نه، فرضیه ای را آزمون می کنیم که در آن کلیه عبارات ثابت برآورد با یکدیگر برابر هستند.
۳-۶-۳-۳- آزمون هاسمن[۱۳۲]
در صورتی که بر اساس نتایج آزمون چاو برای هر یک از فرضیه ها، استفاده از روش دادههای پانل مورد تأیید واقع شود، به منظور اینکه مشخص گردد کدام روش (اثرات ثابت و یا اثرات تصادفی) برای برآورد مناسبتر میباشد (تشخیص ثابت یا تصادفی بودن تفاوتهای واحدهای مقطعی) از آزمون هاسمن استفاده میشود. در روش اثرات تصادفی بار متغیرهای حذف شده روی جمله اخلال قرار میگیرند، اما این مشروط بر آن است که بین متغیرهای مستقل و مؤلفه خطای مقطعی همبستگی وجود نداشته باشد. آزمون هاسمن وجود این همبستگی را بررسی میکند. این آزمون مبتنی بر این فرض اولیه است که در صورت وجود همبستگی، روش اثرات ثابت سازگار و روش اثرات تصادفی ناسازگار است. فرضیه صفر به این معنی است که ارتباطی بین جزء اخلال مربوط به عرض از مبدأ و متغیرهای توضیحی وجود ندارد و آنها از یکدیگر مستقل هستند. در حالی که فرضیه مقابل به این معنی است که بین جزء اخلال موردنظر و متغیرهای توضیحی همبستگی وجود دارد. از آنجایی که به هنگام وجود همبستگی بین اجزاء اخلال و متغیر توضیحی با مشکل تورش و ناسازگاری مواجه میشویم، بنابراین بهتر است در صورت پذیرفته شدن (رد ) برای آزمون فرضیات از روش اثرات ثابت استفاده کنیم. هنگامی که بین اجزاء اخلال و متغیر توضیحی همبستگی وجود نداشته باشد ( قبول )، هر دو روش اثرات ثابت و اثرات تصادفی سازگار هستند ولی روش اثرات ثابت ناکارآ بوده و بایستی برای آزمون فرضیات از روش اثرات تصادفی استفاده شود (جانستون و دیناردو[۱۳۳]، ۲۰۰۵).
۳-۶-۴- آزمون های معنادار بودن در الگوی رگرسیون
در رگرسیون چند گانه دو یا چند متغیر مستقل وجود دارد و لازم است که برای مشخص شدن معنادار بودن آنها دو آزمون انجام گیرد. ابتدا آزمون معنادار بودن معادله رگرسیون استفاده ازجدول(ANOVA) ودرمرحله بعد،آزمون معنادار بودن هر کدام از ضرایب متغیرهای مستقل که به اختصار در زیر شرح داده میشوند(مومنی و فعال قیومی،۱۱۹،۱۳۸۶).
– آزمون معنادار بودن معادله رگرسیون: در یک معادله رگرسیون چندگانه، چنانچه هیچ گونه رابطهای میان متغیر وابسته و متغیرهای مستقل وجود نداشته باشد، بایدتمامی ضرایب متغیرهای مستقل در معادله، مساوی صفر باشند. بدین ترتیب ما میتوانیم معنادار بودن معادله رگرسیون را آزمون کنیم. این کار با استفاده از آمارهF با فرضهای زیر صورت میگیرد:
معادله رگرسیون معنادار نیست.
معادله رگرسیون معنادار است.
چنانچه در سطح اطمینان ۹۵% (خطای ۵%= )، آماره F محاسبه شده از معادله رگرسیون کوچکتر از مقدارF به دست آمده از جدول باشد، فرض را نمیتوان رد کرد و در غیر این صورت رد میشود. واضح است که در صورت رد شدن معادله رگرسیون معنادار خواهد بود؛وفرض خطی بودن مدل تایید میشود.
– آزمونهای معنادار بودن ضرایب: بعد از آزمون معنادار بودن رگرسیون، بایستی معنادار بودن هرکدام از ضرایب آزمون گردد . هدف از انجام این آزمون آن است که مشخص شود آیا در سطح اطمینان مورد نظر ضریب محاسبه گردیده مخالف صفر میباشد یا خیر؟ فرضهای این آزمون به شرح زیر میباشند:
ضریب متغیرهای مستقل(شیب خط رگرسیون) در جامعه صفر است.
ضریب متغیرهای مستقل(شیب خط رگرسیون)در جامعه مخالف صفر است.
برای آزمون این فرضیهها از آماره t استفاده میشود.اگر در سطح اطمینان ۹۵% (خطای ۵%= ) آماره به دست آمده ازآزمون کوچکتراز t به دست آمده ازجدول با همان درجه آزادی باشد،فرض رانمیتوان رد کرد ودرغیر این صورت رد میشود.در این آزمون تأیید به مفهوم بی معنا بودن ضریب مورد نظر و رد به مفهوم معنادار بودن ضریب مورد نظر است.
برای دانلود متن کامل پایان نامه به سایت ۴۰y.ir مراجعه نمایید. |