جدول۴-۱۹) آزمون دایبولد-ماریانو و آماره تعدیل شده برای مقایسه دو مدل ترکیبی(قدر مطلق خطا)……………………………………….۱۱۴
جدول ۴-۲۰) آزمون مقایسه زوجی دو مدل ترکیبی( قدر مطلق درصد خطا)………………………………………………………………………………..۱۱۴
جدول۴-۲۱) آزمون دایبولد-ماریانو و آماره تعدیل شده برای مقایسه دو مدل ترکیبی(قدر مطلق درصد خطا)……………………………۱۱۵
فصل اول:
طرح تحقیق
۱-۱) مقدمه
سرمایه و نیروی انسانی از ارکان اصلی تولید هستند و تامین این عوامل و تخصیص بهینه آنها لازمه رشد اقتصادی است. این تخصیص مستلزم وجود بازار و عملکرد مطلوب نیروهای بازار است. دررابطه با سرمایه بازار بورس می تواند این وظیفه را بر عهده داشته باشد. مهمترین وظیفه بازار بورس، جذب سرمایه های پراکنده و هدایت آنها بسوی فعالیتهای سرمایه گذاری از طریق یک فرایند تخصیص بهینه است.
نوسان قیمت سهام نیز در تمام بازارهای بورس امر طبیعی و عادی است، اما در هر صورت میتوان با یک پیش بینی از قیمت سهام ترکیبی مطلوب از آنها را انتخاب و نوسانها را کاهش داد. پیش بینی شاخص های مهم بازار بورس می تواند گامی در جهت افزایش و شفاف نمودن اطلاعات در بازار سرمایه باشد.
پیش بینی شاخص های بورس یا بازار سرمایه همواره مورد توجه مطالعات بوده است. این توجه در سالهای اخیر منجر به پیشرفت الگوهای مورد استفاده در پیشپیشبینی شده است. لیکن باید پیش بینی را مورد توجه قرار داد که با دقت بیشتری صورت گیرد و نسبت به نتایج واقعی مشاهده شده خطای کمتری داشته باشد.
پیش بینی سریهای زمانی یکی از مهمترین روشهای پیش بینی است که در آن از مشاهدات گذشتهی یک متغیر به منظور توسعه مدل و پیش بینی در آینده استفاده میگردد. روشهای سری زمانی، درطول چند دهه گذشته توسعه بسیاری یافته اند، اما یکی از مهمترین و پرکاربردترین آنها مدل خودرگرسیو میانگین متحرک انباشته (ARIMA[1]) میباشد که تحت عنوان روش باکس و جنکینز شناخته می شود.
خودرگرسیو میانگین متحرک انباشته (ARIMA) که خلاصه شدهی (Autoregressive Integrated Moving Average) میباشد، یکی از پرکاربردترین مدلها در پیشبینی سریهای زمانی در طول سه دهه گذشته بوده است، اما پیشفرض اصلی آن این است که رابطهی خطی میان ارزشهای سری برقرار باشد. بنابراین رابطههای غیرخطی بوسیلهی مدل خودرگرسیو میانگین متحرک انباشته نمیتوانند خوب توضیح داده شوند.
یکی دیگر از روشهای مورد استفاده در پیشبینی سریهای زمانی شبکهی عصبی است که توان تخمین روابط غیرخطی مختلفی را دارا میباشد (اصطلاحاً به شبکهی عصبی تخمین زنندهی همگانی[۲] میگویند). اما استفاده از شبکه، طبق ادبیات تحقیق در روابط خطی نتایج پیچیدهای در بر داشته است.
نوع دیگر از روشهای پیش بینی سری زمانی رگرسیون بردار پشتیبان(SVR [۳] ) است. ماشین بردار پشتیبان، تابع رگرسیون را با به کارگیری یک دسته تابع خطی تخمین می زند و عملیات رگرسیون را با تابعی که انحراف از مقدار واقعی در آن به میزان کمتر از ɛ مجاز است انجام می دهد سپس با کمینه کردن ریسک ساختاری ، بهترین جواب را ارائه می دهد.[۵۷]
بطور کلی باید به این نکته اشاره کرد که دانستن الگوی دادهها، مبنی بر خطی و غیرخطی بودن در دنیای واقعی کمی دشوار است و به ندرت سریهای زمانی به طور خالص خطی و غیرخطی میباشند و اغلب از هر دو الگو تبعیت میکنند. بنابراین مسأله اینجاست که چگونه میتوانیم قیمت پایانی و دامنهی نوسان قیمت را با خطای کمتری پیشبینی کنیم؟
۱-۲) تشریح و بیان موضوع
در زمینه مدلسازی سریهای زمانی، روشهای متفاوتی مورد استفاده قرار میگیرد. مدلهای سنتی مانند میانگین متحرک، هموارسازی نمایی و خودرگرسیو میانگین متحرک انباشته پیشبینی آینده را به روابط خطی از گذشته محدود مینمایند و الگوهای خطی را مدل سازی می کنند. از این مدلها به دلیل سادگی در فهم و کاربرد در دهه های اخیر بسیار استفاده شده است. با وجود انعطاف پذیری بالای مدل خودرگرسیو میانگین متحرک انباشته در مدل سازی الگوهای خطی این مدل نمیتواند الگوهای غیر خطی را خوب مدل سازی کند.
به دلیل مشاهده الگوهای غیرخطی در دنیای واقعی یک سری از مدلهای غیرخطی مانند[۴]ARCH GARCH, [۵] ،[۶]TGARCH مطرح گردیدند. همگی این مدلها، الگوهای غیرخطی بخصوصی را توضیح میدهند.
اما شبکه عصبی مجازی([۷]ANN) توان و قدرت پیشبینی روابط غیرخطی را داراست و کاملاً انعطاف پذیر عمل می کند. شبکه های عصبی مصنوعی از عناصر عملیاتی سادهای ساخته میشوند که به صورت موازی در کنار یکدیگر عمل می کنند. این عناصر که از سیستمهای عصبی زیستی الهام گرفته شده اند، در تلاشاند که به صورت ناپارامتریک، مغز انسان را شبیه سازی نمایند. نکته حائز اهمیت در استفاده از مدل شبکه عصبی وجود نتایج متفاوت برای روابط خطی است. برای مثال مارکهام[۸] و راکس[۹] اذعان داشتند عملکرد شبکه عصبی برای مسالههای رگرسیون خطی وابسته به اندازه نمونه و سطح شوک (Noise) میباشد. [۵۳]
از طرفی ماشین بردار پشتیبان (SVM)[10] به عنوان تکنیک نوین یکی از روشهای یادگیری ماشینی است که بر مبنای تئوری یادگیری آماری واپنیک[۱۱] در دهه ۹۰ میلادی توسط واپنیک و همکارانش ارائه گردید. این روش از جمله روشهای نسبتاً جدیدی است که در سالهای اخیر کارایی خوبی نسبت به روشهای قدیمیتر از جمله شبکههای عصبی پرسپترون نشان داده است. رگرسیون بردار پشتیبان این عمل را با تابعی که انحراف از مقدار واقعی در آن به میزان کمتر از ɛ مجاز است، انجام میدهد.
همانطور که ذکر شد با وجود مزایای متعدد، شبکه های عصبی با محدودیت هایی از جمله مدلسازی روابط خطی و همچنین نیازمند بودن به شمار بالای نمونه برای آموزش(به منظور انجام فرایند یادگیری) مواجه میباشد. اما چون دانستن خصوصیات داده ها مبنی بر خطی و یا غیر خطی بودن در واقعیت کمی دشوار است و از طرفی به ندرت روابط کاملا خطی و یا کاملا غیر خطی مشاهده می شود، بنابراین این ایده به ذهن میرسد که ترکیب مدل خطی آریما با مدلهای غیر خطی شبکه عصبی پیشخور و ماشین بردار پشتیبان می تواند باعث بهبود دقت پیش بینی گردد.
در مدل ترکیبی سعی بر این داریم ابتدا روابط غیرخطی در پسماندها را با بهره گرفتن از شبکه عصبی و رگرسیون بردار پشتیبان شناسایی کرده سپس پسماندهای بدست آمده را به مدل خودرگرسیو میانگین متحرک انباشته اضافه کنیم. با این ترکیب، بخش خطی بوسیلهی مدل خودرگرسیو میانگین متحرک انباشته و بخش غیرخطی بوسیلهی شبکه عصبی و رگرسیون بردار پشتیبان پیشبینی خواهد شد.
با عنایت به مطالبی که ذکر شد این سوال پیش می آید که کدامیک از مدلهای رگرسیون بردار پشتیبان، شبکه عصبی، خودرگرسیو میانگین متحرک انباشته و مدلهای ترکیبی، با دقت بالاتر و خطای کمتری توانایی پیش بینی شاخص بورس اوراق بهادار تهران را دارد؟
۱-۳) ضرورت انجام تحقیق
پیش بینی بازده شاخص یکی از مسایل بسیار مهم در بازارهای مالی است که توجه بسیاری از فعالان بازار سرمایه و کارشناسان این حوزه را در چند دهه گذشته به خود جلب کرده است. اهمیت این موضوع از آن جا ناشی می شود که پیش بینی در بازار مالی یکی از متغیرهای مهم در زمینه تصمیمات سرمایه گذاری، قیمت گذاری اوراق بهادار و مشتقهها، مدیریت ریسک، تدوین مقررات و سیاستگذاری پولی است.
همواره پیش بینی روند شاخص بورس یکی از چالشهای پیشروی معاملهگران در بازارهای سرمایه بوده که این مساله به عنوان یک امر ضروری وکاربردی مطرح می شود .البته باید پیش بینی را مورد توجه قرار داد که با دقت بیشتری صورت گیرد و نسبت به نتایج واقعی مشاهده شده خطای کمتری داشته باشد. بنابراین با وجود تمام این شرایط ما نیازمند مدلی هستیم که بتواند با خطای کمتری بازده شاخص کل بورس را که موضوع مورد بررسی در این تحقیق می باشد را پیش بینی کند.
۱-۴) سابقه تحقیقات و مطالعات انجام گرفته
۱) فنگپای و شنگ لین در سال۲۰۰۵ در مقاله ای تحت عنوان"ترکیب خودرگرسیو میانگین متحرک انباشته و رگرسیون بردار پشتیبان برای پیش بینی قیمت سهام"بیان کردند که ترکیب سریهای زمانی آریما و ماشین بردار پشتیبان،در مقایسه با مدلهای خودرگرسیومیانگین متحرک انباشته و ماشین بردار پشتیبان، معیارهای ارزیابیمیانگین قدرمطلق درصد خطا MAPE)) [۱۲]و ریشه میانگین مربع خطا ( RMSE[13]) کمتری را نشان می دهند.[۵۵]
۲) ژانگ و همکاران در سال ۲۰۱۲در مقاله ای تحت عنوان"ترکیب خودرگرسیو میانگین متحرک انباشته و رگرسیون بردار پشتیبان برای پیش بینی بارگذاری کوتاه مدت الکتریسیته” که به پیش بینی مدیریت کارای سیستم نیرو می پردازد، بیان نمودند که پیش بینی سریهای زمانی از طریق مدل ترکیبی خودرگرسیو میانگین متحرک انباشته و ماشین بردار پشتیبان در مقایسه با هر یک از مدلهای خودرگرسیو میانگین متحرک انباشته و رگرسیون بردار پشتیبان از دقت بیشتری برخودار است و معیارهای ارزیابی MAPE و RMSEکمتری را نشان میدهد.[۶۸]
۳)ژانگ[۱۴] (۲۰۰۳) در مقالهای تحت عنوان « پیش بینی سریهای زمانی با بهره گرفتن از مدلهای ترکیبی خودرگرسیو میانگین متحرک انباشته و شبکه عصبی»، اذعان داشت، با توجه به ماهیت خطی مدل خودرگرسیو میانگین متحرک انباشته و غیرخطی شبکه عصبی، پیش بینی بخش خطی بوسیلهی میانگین متحرک انباشته و پسماند غیرخطی بوسیله ی شبکه می تواند منجر به افزایش دقت در پیشبینی شود.
وی از سه سری زمانی Sunspots، Lynx کانادا و نرخ مبادله دلار آمریکا و پوند انگلیس و معیارهای میانگین مجذور خطا (MSE) و میانگین قدر مطلق خطا (MAD) برای آزمون این ادعا و ارزیابی دقت پیش بینی بهره جست.[۶۷]
نتایج این پژوهش دال بر موفقیت مدل ترکیبی نسبت به مدلهای خودرگرسیو میانگین متحرک انباشته و شبکه عصبی میباشد.
۴) فرجام نیا،ایمان (۱۳۸۴) در پایان نامه خود تحت عنوان “مقایسه پیش بینی قیمت نفت توسط مدلهای شبکه عصبی و خودرگرسیو میانگین متحرک انباشته “با توجه به نتایج به دست آمده از این تحقیق نشان دادند که شبکه های عصبی مصنوعی در پیش بینی قیمت روزانه نفت خام میزان MSE[15] وSSE[16] کمتری را نسبت به مدل خودرگرسیو میانگین متحرک انباشته دارند. و با توجه به معیارهای ارزیابی فوق مشخص شد که شبکه های عصبی مصنوعیعملکردی بهتر از مدلهای خودرگرسیو میانگین متحرک انباشته در خصوص پیش بینی قیمت های روزانه نفت خام دارند.در نتیجه می توان از مدل شبکه های عصبی مصنوعی به عنوان ابزاری دقیق برای پیش بینی متغیرهای اقتصادی در کنار سایر روشها بهره جست. [۱۷]
۵)رمضانی،رضا (۱۳۸۳) در پایان نامه خود تحت عنوان” مقایسه عملکرد پیش بینی در مدلهای شبکه عصبی مصنوعی و خودرگرسیو میانگین متحرک انباشته (مورد مطالعه : تقاضای ماهیانه برق در ایران) “با بهره گرفتن از داده های مربوط به سال های ۱۳۷۰ تا سال ۱۳۸۱ ، برای هر کدام از مدل های شبکه عصبی مصنوعی وخود رگرسیو میانگین متحرک انباشته داده های سالهای ۱۳۸۰ و۱۳۸۱ به عنوان معیار ارزیابی انتخاب گردیده و در نهایت با توجه به پیش بینی های انجام گرفته توسط بهترین مدل از مدل های شبکه عصبی میزان MSE وMAPE کمتری را در پیش بینی انجام گرفته نسبت به مدل خود رگرسیو میانگین متحرک انباشته داشته است و با توجه به معیارهای ارزیابی فوق مشخص است که شبکه های عصبی مصنوعی عملکردی بهتر از مدل های خود رگرسیو میانگین انباشته درخصوص پیش بینی مقادیر سری زمانی دارند.[۷]
۶) هانسن[۱۷] و نلسون[۱۸] در مقاله ای تحت عنوان” شبکه ی عصبی و سری های زمانی سنتی و ترکیب هم افزا در پیش بینی های اقتصادی” بعد از بیان کردن اهمیت پیش بینی درآمد مشمول مالیات اذعان داشتند عواملی مثل بحران مالی باالقوه می توانند موجب انحراف تحلیلهای مبتنی بر سریهای زمانی سنتی گردند .آنها اذعان داشتند در این موارد شبکه می تواند با معرفی الگوهای جدید این مدلها را اصلاح نماید و نتایج تحقیقشان حاکی بر موفقیت آنها در ترکیب شبکههای عصبی مانند شبکههای Time –delay و شبکههای پس انتشار با مدلهای سری زمانی سنتی بود. [۳۹]
۷) لئو،تانگ،سو[۱۹] در مقالهای تحت “عنوان ترکیب سریهای زمانی و شبکهی عصبی برای مدلهای پیشبینی قابل اطمینان ” پیشبینی بهتر مدل ترکیبی نسبت به مدل سریهای زمانی و شبکهی عصبی در دادههای دارای روند رشد را اذعان داشتند. [۵۹]
۱-۵) فرضیههای تحقیق
۱- عملکرد مدل ترکیبی شبکه عصبی پیشخور - خودرگرسیو میانگین متحرک انباشته از مدل خودرگرسیو میانگین متحرک انباشته بهتر است.
۲- عملکرد مدل ترکیبی شبکه عصبی پیشخور - خودرگرسیو میانگین متحرک انباشته از مدل شبکه عصبی پیشخور بهتر است.
۳- عملکرد مدل ترکیبی رگرسیون بردار پشتیبان - خودرگرسیو میانگین متحرک انباشته از مدل خودرگرسیو میانگین متحرک انباشته بهتر است.
۴- عملکرد مدل ترکیبی رگرسیون بردار پشتیبان - خودرگرسیو میانگین متحرک انباشته از مدل رگرسیون بردار پشتیبان بهتر است
۵- بین عملکرد مدل ترکیبی خودرگرسیو میانگین متحرک انباشته –شبکه عصبی پیشخور( FFNN)[20] با مدل ترکیبی خودرگرسیو میانگین متحرک انباشته - رگرسیون بردار پشتیبان اختلاف معناداری وجود دارد.
۱-۶) اهداف اساسی از انجام تحقیق
-
- پیشبینی شاخص بورس تهران برای یک گام جلوتر (one step ahead)
-
- مقایسه توان پیشبینی مدل ترکیبی خودرگرسیو میانگین متحرک انباشته - رگرسیون بردار پشتیبان نسبت به مدل ترکیبی خودرگرسیو میانگین متحرک انباشته - شبکه عصبی
-
- افزایش دقت پیش بینی شاخص بورس تهران در صورت امکان