نماد خطی پانل دیتا:
که به زبان ماتریسی به صورت زیر است:
اندیس i برای افراد یا مقاطع (تعداد N) و اندیس t برای زمان (از ۱ تا T) در نظر گرفته شده است. (هادی, امیری; خاندانی , حسین;, ۱۳۹۳)
۳-۸) مزایای پانلدیتا در مقایسه با داده های مقطعی یا سری زمانی
تعداد مشاهدات و داده ها در پانل دیتا بسیار بیشتر بوده و باعث میشود اعتماد به برآوردها بیشتر شود.
به محققان تجربی اجازه میدهد مدلهای پیشرفتهتری را تبیین کرده و آزمون کنند که فرضیههای مقیدکننده کمتری دربر داشته باشد.
زیاد بودن تعداد مشاهدات مسأله همخطی بودن را نیز تا حدود زیادی حل میکند.
با این مجموعه داده ها میتوان اثراتی را شناسایی و اندازهگیری کرد که در داده های مقطعی محض یا سری زمانی قابل شناسایی نیست، استفاده از داده های پانل دیتا، تورش برآورد را از بین میبرد و یا کم میکند.
۳-۹) آزمون ناهمسانی واریانسها
با توجه به اینکه در نرم افزار Eviwesدر حالت پنل دیتا امکان تست خود همبستگی سریالی و ناهمسانی واریانس وجود ندارد و باید از نرم افزار STATAاستفاده کرد، به منظور بررسی اینکه برای تخمین مدل از روش رگرسیونی [۳۸]OLS یا [۳۹]DF-GLS استفاده کنیم آزمون ناهمسانی واریانسها را با بهرهگیری از برنامه STATA انجام میدهیم که فرض یک این آزمون، نشاندهنده ناهمسانی واریانس و الزام به استفاده از DF-GLS برای تخمین مدل و فرض صفر، مبنی بر رد ناهمسانی و استفاده از OLS میباشد. (امیری , هادی; خاندانی, حسین;, ۱۳۹۳)
۳-۱۰) آزمون خودهمبستگی
میتوان اصطلاح خودهمبستگی را چنین تعریف کرد: «همبستگی بین اعضای سریهای مشاهداتی است که در زمان (مانند سریهای زمانی) یا مکان (مانند داده های مقطعی) ردیف شدهاند».
یکی از مفروضاتی که در رگرسیون مد نظر قرار میگیرد استقلال(تفاوت بین مقادیر واقعی ومقادیر پیشبینی شده توسط معادله رگرسیون)از یکدیگر است، خودهمبستگی مشکلی است که در نتیجه همبستگی بین جزء خطاها رخ میدهد. خودهمبستگی اثری بر روی ویژگیهای ناتور بودن و سازگاری ضرایب برآوردی نخواهد داشت، چون این ویژگیها ارتباطی به برقراری یا عدم برقراری فرض عدمهمبستگی بین جزء خطاها ندارد اما تأثیر این مسئله بر روی کارایی تخمین زنها میباشد که در نتیجه نقض فرض عدم وجود خودهمبستگی، دیگر تخمین زنها کارا نخواهند بود. در اثر این مشکل، واریانس ضرایب تخمینی تورشدار و ناسازگار بوده و آزمون فرضیهها دیگر معنادار نخواهند بود. در اکثر مواقع R2 بیش از حد تخمین زده شده که به غلط، نشانی از خوبی برازش مدل را ارائه خواهد داد. در این حالت آماره t نیز بیشتر از مقدار واقعی خود به دست خواهد آمد که معناداری بالاتری از تخمینها را به اشتباه نشان خواهد داد. در صورتی که فرضیه استقلال خطاها رد شود و خطاها با یکدیگر همبستگی داشته باشند امکان استفاده از رگرسیون وجود ندارد، به منظور بررسی استقلال خطاها از یکدیگر(عدم وجود خودهمبستگی)از آزمون وولدریج[۴۰] استفاده میشود، در این آزمون فرض صفر، مبتنی بر عدم وجود خودهمبستگی و فرض یک، حاکی از وجود خودهمبستگی است، با توجه به نتیجه این آزمون اگر سطح معنی داری بیش تر از۵%باشد بیانگر عدم وجود خود همبستگی میباشد. (امیری , هادی; خاندانی, حسین;, ۱۳۹۳)
آزمون پایایی (مانایی) متغیرها
سری زمانی[۴۱]، یکی از مهمترین داده های آماری مورد استفاده در تجزیه تحلیل تجربی است. در تحقیقات همواره چنین فرض شده است که سری زمانی پایا[۴۲] است و اگر این حالت وجود نداشته باشد، آزمونهای آماری متعارفی که اساس آن ها بر پایه t، f و آزمونهای مشابه بنا شده است، مورد تردید قرار میگیرد. از طرفی، اگر متغیرهای سری زمانی مانا نباشد، ممکن است مشکلی به نام رگرسیون کاذب بروز کند. در اینگونه رگرسیونها، در عین حالی که ممکن است هیچ رابطه معنیداری بین متغیرهای الگو وجود نداشته باشد، ضریب تعیین (R2) به دست آمده آن ممکن است بسیار بالا باشد و موجب شود که محقق به استنباطهای غلطی در مورد میزان ارتباط بین متغیرها برسد، از اینرو در ادامه به بررسی پایای(مانایی)متغیرها پرداخته میشود. (امیری , هادی; خاندانی, حسین;, ۱۳۹۳)
۳-۱۱)روش های آزمون پایایی(مانایی) متغییرهای سری زمانی :
استفاده از روش حداقل مربعات(OLS)در کارهای تجربی بر این فرض استوار است که متغییرهای سری زمانی مورد نظر پایا هستند،این در حالی است که بسیاری ازسری های واقعی در اقتصاد چنین نیستند، از این رو قبل از استفاده از این متغییرها لازم است از پایایی یا عدم پایایی آن ها اطمینان حاصل نمود.
روندهای قطعی و تصادفی:گاه ممکن است یک سری زمانی در عین حال که دارای روند زمانی است حول این روند زمانی پایا باشد از این رو بحث روندهای تصادفی و قطعی پیش میآید،سری زمانی دارای روند قطعی است که مسیر کلی حرکت آن در طول زمان کاملا مشخص و قابل پیشبینی است،اما اگر روند یک متغییر در طول زمان به طور تصادفی تغییر کند به گونه ای که مسیر حرکت آن قابل پیشبینی نباشد این متغییر دارای روند تصادفی است ،در مورد روندها این دو الگو مفروض است:
(۱)
(۲)
در این روابط µ مقدار ثابت غیر تصادفی و متغیر تصادفی با میانگین صفر و واریانس است،با شروع از زمان t=0خواهیم داشت؛
(۱)
(۲)
یک روند قطعی است در حالی که یک روند تصادفی است ، یک فرایند تصادفی ناپایا است زیرا واریانس آن یعنی به زمان بستگی دارد.
فرآیندهای روند – پایا و تفاضل –پایا : به الگوهای مانند سری زمانی (۱) که با کم کردن روند از مدل فرایند پایا می شود،فرایند «روند – پایا»اطلاق می شود،اصطلاح «تفاضل- پایا» برای توصیف روند های تصادفی مانند الگوی (۲) مناسب است زیرا تفاضل گیری تنها راهی است که این الگو را پایا میسازد().
در این تحقیق چون از سری زمانی و مقطعی به طور همزمان استفاده شده است با در با این فرض که تغییرات متغییرهای مورد بررسی در مورد سری های زمانی نوعی روند تصادفی میباشد از تفاضل- پایا استفاده شده است.
فصل چهارم:
تجزیه و تحلیل داده ها