ویروس کرونا ویروسی مقاومت ناپذیر است که به طور کلی بر چارچوب تنفسی تأثیر می گذارد. تأثیر مؤثری بر اقتصاد جهانی به ویژه بر حرکت مالی بازارهای سهام دارد. اخیراً پیش بینی دقیق بازار سهام مورد توجه سرمایه گذاران قرار گرفته است. تغییر ناگهانی در حرکت سهام به دلیل ظهور COVID-19 باعث ایجاد مشکلاتی برای سرمایه گذاران می شود. از این نقطه، ما یک سیستم کارآمد را پیشنهاد میکنیم که از تحلیل احساسات اخبار و مقالات COVID-19 برای استخراج تأثیر نهایی COVID-19 بر بازار سهام مالی استفاده میکند. در این مقاله، ما یک سیستم پیشبینی بازار سهام را پیشنهاد میکنیم که حرکت سهام را با گسترش COVID استخراج میکند. پیش بینی تأثیر این بیماری ها بر اقتصاد برای آمادگی برای هر گونه تغییر بیماری و حفاظت از اقتصاد مهم است. در این مقاله، ما از تحلیل احساساتی برای سرفصلهای اخبار سهام برای پیشبینی روند روزانه آتی سهام در دوره COVID-19 استفاده میکنیم. همچنین، ما از طبقهبندیکنندههای یادگیری ماشینی برای پیشبینی تأثیر نهایی COVID-19 بر برخی سهام مانند سهام TSLA، AMZ و GOOG استفاده میکنیم. برای بهبود عملکرد و کیفیت پیشبینیهای روند آینده، انتخاب ویژگی و کاهش توییتهای هرزنامه بر روی مجموعه دادهها انجام میشود. در نهایت، سیستم پیشنهادی ما یک سیستم ترکیبی است که متن کاوی را در دادهکاوی رسانههای اجتماعی روی مجموعه دادههای سهام تاریخی اعمال میکند تا کل عملکرد پیشبینی را بهبود بخشد. سیستم پیشنهادی حرکت سهام را برای TSLA، AMZ و GOOG با میانگین دقت پیشبینی به ترتیب 90، 91. 6 و 92. 3 درصد پیشبینی میکند.
روی یک دست نوشته کار می کنید؟
مقدمه
این روزها، جهان ناگهان دچار بلایایی به نام کووید-19 شده است. با موافقت سازمان بهداشت جهانی (WHO)، کرونا ویروس خطرناک و خطرناکی است که از هم اکنون در جهان وجود دارد. از آنجایی که ویروسهای عفونی به طور مداوم خطری برای نوع بشر بودهاند، بهویژه آنهایی که در اطراف آنها اطلاعات کوچک یا هیچ چیز مانند COVID-19 وجود ندارد [21]. کووید 19، برای شروع، در ووهان، منطقه هوبی، چین در دسامبر 2019 آموزش دیده است. کووید-19 یک ویروس مقاومت ناپذیر است که توسط یک کروناویروس مدرن (SARS-CoV-2) که در چین یافت می شود، ایجاد می شود. بر اساس اطلاعات WHO (2020)، تا 6 آوریل 2020، 1،210،956 مورد تایید شده و 67،594 مورد تایید وجود داشته است [21]. در اسپانیا، موارد COVID-19 در روز 12 فوریه ماه سال 2020 شناسایی شد. قابل توجه ترین گسترش موارد کووید-19 در 26 مارس 2020 با 8271 مورد (World meter, 2020) رخ داد [1]. بر اساس اطلاعات نمایش داده شده توسط World meter در 8 آوریل 2020، تعداد موارد تایید شده کووید-19 در اسپانیا 148220 نفر با 14792 مورد عبور بوده و 48021 نفر بهبود یافته اند و دومین کشور برتر جهان با موارد تایید شده کووید-19 هستند.-19 (متر جهانی، 2020) [1].
حرکت اقتصادی تحت تأثیر عوامل ناگهانی مانند بیماری های جدید است. بنابراین، اقتصاد به شدت تحت تأثیر ظاهر Covid-19 است. تأثیر عوامل جدید بر اقتصاد بهویژه بازارهای سهام را میتوان از اخبار و تاریخچه تغییرات دادههای آن در این دوره استخراج کرد [21]. در این مقاله، ما سیستمی را پیشنهاد میکنیم که حرکت آتی سهام را بر اساس تحلیل احساسات خبری و تحلیل دادههای تاریخی سهام پیشبینی میکند.
سفته بازی در ویترین سهام ناامن است، اما زمانی که به روشی آموزش داده شده نزدیکتر شود، یکی از مهمترین راههای موثر برای درک مزایای قابل توجه است [12]. اخیراً، بیشتر توصیهها و سیستمهای تصمیمگیری بر اساس نتیجه پیشبینی، بهویژه در زمینه مالی است. بنابراین لازم است پیشبینیهای دقیقی در مرحله تصمیمگیری ارائه شود تا سرمایهگذاران از پسانداز سهام خود کمک کنند [20]. متخصصان مالی اجرای شرکتی را ارزیابی می کنند که اخیراً تصمیم به خرید سهام خود برای طفره رفتن از خرید سهام ناامن کرده است [12، 19، 20]. این ارزیابی شامل بررسی عملکرد شرکت در رسانه های اجتماعی و وب سایت های خبری بودجه است. در هر صورت، متخصصان مالی نمی توانند از چنین حجم عظیمی از رسانه های اجتماعی و اطلاعات خبری مرتبط با پول استفاده کنند. پس از آن، لازم است یک چارچوب تقویت کننده انتخاب کامپیوتری برای کمک به سفته بازان کشف شود، زیرا این سیستم الگوهای سهام را در نتیجه با استفاده از تجزیه و تحلیل این مبالغ گسترده اطلاعات پیش بینی می کند.
این چارچوب روباتیک را می توان با استفاده از محاسبات یادگیری ماشین و مبانی تحلیل احساسات ساخته شد. یافتن الگوریتم هایی که عملیات حساس تر و حیاتی تر هستند. رسانههای اجتماعی و وبسایتهای خبری بودجهای که بهعنوان منابع اطلاعات خارجی برای نمایش یادگیری ماشین پیشنهادی ما در نظر گرفته میشوند، اطلاعات محتوای خام را در قالب مقالات و سرفصلهای اخبار ارائه میکنند. این اطلاعات خام با محاسبات یادگیری ماشینی قابل توجیه نیست. داده ها باید از قبل پردازش شوند تا متن ناخواسته حذف شود و کلمات متوقف شوند. در رویکرد تحلیل بنیادی، باید از زبان های طبیعی برای پیش پردازش داده های متنی استفاده شود [1].
تحلیل و پیشبینی سریهای زمانی مالی، بهویژه پیشبینی قیمت سهام، یکی از زمینههای پژوهشی مؤثر است و دانشمندان و کارشناسان بسیاری را به خود جذب کرده است. چندین تکنیک برای پیشبینی غیرخطی بودن سریهای زمانی و بهبود دقت پیشبینی روند سهام با استفاده از یادگیری ماشین یا یادگیری عمیق توسعه داده شدهاند. از آنجایی که دادههای سهام طبیعتاً پر سر و صدا و ناپایدار هستند، نیاز به یک مدل مؤثر وجود دارد که با دادههای تاریخی کار کند. حجم عظیمی از اخبار و مقالات وجود دارد که تأثیر کووید-19 را بر اقتصاد، به ویژه توسعه سهام توصیف می کند [1، 21]. بنابراین استفاده و استفاده از این خبر می تواند در پیش بینی روند آتی حرکت سهام جذاب باشد. توسعه مدلی که بتواند تأثیر بیماری های جدید بر اقتصاد مانند کووید-19 را پیش بینی کند بسیار مهم است، زیرا این می تواند به محافظت از اقتصاد در برابر ضرر کمک کند. همچنین، این عملیات برای سرمایه گذاران موثرتر است، زیرا به سرمایه گذاران کمک می کند تا از پول خود محافظت کنند. اما، برای کار با اخبار و داده های متنی، یک مشکل بزرگ با نیازهای ذخیره سازی است. برای این مشکل، توسعه مدلی برای کار با اخبار و داده های متنی بدون نیاز به ذخیره سازی ضروری است. این مشکل توسط سیستم پیشنهادی ما که با عناوین اخبار بلادرنگ کار می کند، حل شده است.
در نتیجه، این مقاله یک سیستم خودکار ترکیبی را ارائه میکند که از ماژولهای مختلفی مانند ماژول تحلیل تاریخی، ماژول تحلیل احساسات، ماژول تجزیه و تحلیل ترکیبی و ماژول تحلیل نهایی برای پیشبینی روند بازار در طول همهگیری COVID-19 کنونی تشکیل شده است. سهم این مقاله را می توان به شرح زیر خلاصه کرد:
مفاهیم تحلیل احساسات و پیش بینی سهام را ارائه می دهد.
یک ماژول کارآمد برای پیشبینی روند آینده سهام از طریق احساسات خبری از طریق اخبار بلادرنگ ارائه کنید و طبقهبندیکنندههای یادگیری ماشین را روی اخبار سهام با یک الگوریتم انتخاب ویژگی کارآمد برای کاهش ابعاد دادههای دادههای بهدستآمده اعمال کنید.
با ارائه موارد زیر، ماژولهای مؤثری را برای اهداف پیشبینی روند آینده سهام در تاریخ ارائه کنید:
تجزیه و تحلیل دادههای تاریخی با استفاده از طبقهبندیکنندههای یادگیری ماشین برای ذخیره دادههای تاریخی با انتخاب ویژگی کارآمد و فرآیند عادیسازی دادهها.
پیشبینی روند آینده تاریخی سهام از طریق تجزیه و تحلیل دادههای تاریخی به علاوه تحلیل اخبار و استفاده از طبقهبندیکنندههای ML و یک الگوریتم انتخاب ویژگی کارآمد برای دادههای ترکیبی.
یک سیستم ترکیبی ماهر برای پیشبینی روند سهام و حرکت با استفاده و بهرهبرداری از LSTM با تکنیکهای Sentiment پیشنهاد کنید. این استفاده خروجی همه ماژول های قبلی را دریافت می کند و طبقه بندی کننده های DL مانند Stacked-LSTM را اعمال می کند.
انجام یک ارزیابی سیستماتیک از سیستم پیشنهادی از طریق آزمایش های مختلف بر روی مجموعه داده های مختلف. از نتایج، سیستم پیشنهادی در مقایسه با روشهای موجود، عملکرد خوبی از خود نشان داد.
بقیه این مقاله به شرح زیر تهیه شده است: بخش 2 یک پایه مختصر در مورد پیش بینی سهام علاوه بر تجزیه و تحلیل احساسات ارائه می دهد. بخش 3 تحقیقات مرتبط در حوزه پیش بینی سهام را مورد بحث قرار می دهد. بخش 4 مدل پیش بینی سهام پیشنهادی را معرفی می کند در حالی که بخش 5 مطالعه محیطی تجربی را نشان می دهد. نتایج آزمایشات ما در بخش 6 ارائه و مورد بحث قرار می گیرد در حالی که این مقاله نتیجه گیری خود را در بخش 7 ارائه می دهد.
دانش مقدماتی
در این قسمت مروری بر تحلیل احساسات و سهام و برخی از الگوریتمهای یادگیری ماشینی و عمیق را معرفی میکنیم. بازار سهام به سهامداران اجازه می دهد تا سهام شرکت های سهامی عام را از طریق معامله در بورس یا بازارهای خارج از بورس داشته باشند. این بازار به سرمایه گذاران فرصت دستیابی به سود و داشتن زندگی مرفه را از طریق سرمایه گذاری مقادیر اندک اولیه پول داده است [19]. توانایی پیشبینی قیمت سهام موضوع مهمی در حوزه دانشگاهی و همچنین کسبوکار است [19]. بازار سهام منطقه ای است که سهام را می توان انتقال، معامله و توزیع کرد. این کانال مهمی برای شرکت های بزرگ برای جذب سرمایه از سهامداران در نظر گرفته شده است. از یک سو، از طریق انتشار سهام، مقدار زیادی سرمایه به بازار سهام سرازیر میشود که با ارتقای تمرکز سرمایه، پیکربندی ارگانیک سرمایه شرکت را تقویت میکند [19]. اما فرآیند پیشبینی قیمت سهام و روند آتی سهام به دلیل ویژگیهای سهام مانند نویز و نوسانات، عموماً فرآیندی دشوار و پیچیده در نظر گرفته میشود. با این حال، مکانیسم توسعه پیشبینی روند سهام بسیار پیچیده است. زیرا مستلزم اختلاط در استفاده بین عوامل مختلف و رفتار خاص عوامل فردی از جمله عوامل سیاسی، اقتصادی و بازار و همچنین فناوری و رفتار سرمایه گذار است که همگی منجر به تغییر در قیمت سهام می شود [19].
در بازارهای سهام فعلی، نظر مشتریان و اخبار منتشر شده اعم از مثبت یا منفی، شاخص قابل توجهی از ارزش آتی آن سهام است [19]. تجزیه و تحلیل احساسات برای این داده ها یک فرآیند مهم است که بر حرکت بعدی این سهام تأثیر می گذارد. بنابراین، این فرآیند باید به طور دقیق و کارآمد انجام شود [19]. پیشبینی دقیق قیمت آتی سهام، سود سهامداران را بهبود میبخشد [19]. از آنجایی که حجم عظیمی از دادههای تولید شده توسط بخش مالی مانند دادههای مشتری، گزارشهای مربوط به محصولات مالی آنها و دادههای عملیاتی وجود دارد. این می تواند با داده های خارجی مانند داده های رسانه های اجتماعی و داده های وب سایت ها برای کمک به فرآیند تصمیم گیری ادغام شود [19]. تحلیل احساسات ابزاری مفید برای پیشبینی قیمت سهام است. با تجزیه و تحلیل داده های تاریخی سهام و/یا داده های آنلاین مربوط به سهام برای پیش بینی قیمت آتی این سهم. همچنین می تواند بهترین گام برای سیستم توصیه باشد که می تواند بهترین زمان را برای فروش و خرید سهام توصیه کند [24]. با تجزیه و تحلیل اخبار مالی از طریق فرآیند تحلیل احساسات، سیستم می تواند جهت حرکت سهام را تعیین کند. تجزیه و تحلیل احساسات استخراج خودکار دیدگاهها و احساسات را از محتوای مورد نظر فراهم میکند. برای استخراج خودکار دیدگاهها، نگرشها و احساسات از محتوای مورد نظر استفاده میشود.
تجزیه و تحلیل سهام
مبادلات مالی بخش پر انرژی اقتصاد یک کشور است. شاید این بزرگترین درب باز برای سرمایه گذاری توسط سازمان ها و متخصصان مالی باشد. یک سازمان می تواند با رشد کسب و کار خود از طریق عرضه های عمومی اولیه، پول نقد را افزایش دهد. این یک فرصت ایده آل مناسب برای یک سفته باز است تا سهام جدید بخرد و مزایای بیشتری از سود ارائه شده در برنامه پاداش سازمان به دست آورد [1]. بنابراین، استخراج تأثیر اخبار مهم مانند اخبار COVID بر این سهام مهم است. این فرآیند را می توان با اعمال تحلیل احساسات در اخبار و مقالات رسانه های اجتماعی برای استخراج تأثیر اخبار بر این سهام انجام داد.
کارگزاران بورس باید الگوهایی را در رفتار مبادلات مالی پیش بینی کنند تا در مورد فرآیند فروش، نگهداری سهامی که در اختیار دارند یا خرید سهام دیگر، انتخاب درستی داشته باشند [12]. در صورت روند مثبت، قیمت سهام افزایش می یابد، بنابراین سرمایه گذار باید این سهام را خریداری کند. در غیر این صورت، در صورت روند منفی، چون قیمت سهام کاهش می یابد، پس بهتر است سرمایه گذار این سهام را بفروشد. در غیر این صورت، سرمایه گذار باید سهام خود را در صورتی که روند آتی آن عصبی باشد، نگه دارد. در این راستا، پیشبینی الگوهای آتی مبادلات مالی برای پویایی کارگزاران سهام قابل توجه است. در هر صورت، مبادلات اوراق بهادار ناپایدار هستند و پیشبینی آن دشوار است و عناصر بیرونی، مشابه رسانههای مبتنی بر وب و اخبار روزانه پولی، بر هزینههای سهام بهطور قاطع یا معکوس تأثیر میگذارند. این متغیرها باید برای پیش بینی دقیق مبادلات مالی علمی باشند [6]. بسیاری از مدلهای یادگیری ماشین و شبکههای عصبی به طور گسترده در فرآیندهای پیشبینی سهام مانند RF و Stacked - LSTM که در پیشنهاد ما استفاده میشوند، استفاده میشوند.
تحلیل احساسات
این یک واقعیت شناخته شده است که روندهای خبری به شدت بر ذهنیت افراد تأثیر می گذارد [13، 24]. در دهه گذشته، تجزیه و تحلیل احساسات به دلیل دسترسی به حجم عظیمی از اطلاعات ادبی از طریق رسانه های آنلاین و مراحل خبری، به یک حوزه تحقیقاتی مؤثر تبدیل شده است [27، 31]. این اطلاعات چاپی را می توان برای یافتن ارزیابی های مشتریان برای مناطق کاربردی مختلف بررسی کرد. برای ارزیابی این حجم عظیم از اطلاعات ادبی، اطلاعات کاوی و هوش مصنوعی اهمیت فوقالعادهای را بیان میکنند. فرآیندی که از یادگیری ماشین و الگوریتمهای یادگیری عمیق برای تعیین مثبت و منفی محتوای متن استفاده میکند، به عنوان تحلیل احساسات شناخته میشود. این عملیات استخراج اطلاعات معنی دار از متن بدون ساختار است. متن کاوی فرآیند استخراج کلمات مرتبط و روابط بین آنها برای تسهیل طبقه بندی آنها است. بنابراین، تحلیل احساسات می تواند در متن کاوی استفاده شود. کارکرد اساسی تحلیل احساسات استخراج احساس از متن متن است [23]. به همین ترتیب، میتوان از آن در فرآیند نظرکاوی استفاده کرد، زیرا نظرکاوی استخراج، تجزیه و تحلیل و طبقهبندی نظرات متعدد از چندین منبع خبری آنلاین است [5، 7، 18، 34].
مراحل فرآیند تحلیل احساسات عمومی [3] همانطور که در شکل 1 نشان داده شده است عبارتند از:
کسب داده ها: این مرحله جمع آوری داده های متنی برای ساخت یک مجموعه داده مناسب مناسب برای پردازش بعدی است. منابع مختلفی برای جمع آوری اخبار و مقالاتی مانند توییتر ، فین ویز ، فیس بوک و غیره وجود دارد [3 ، 5 ، 18].
پیش پردازش متن: این مرحله یک عمل مهم و مؤثر است ، جایی که متن ناخواسته و بی فایده مانند کلمات متوقف شده (کلمات منظم و بدون معنایی و هیچ گونه داده مربوط به موارد ، به عنوان مثال "A" حذف می شود."an") ، حاکم بر (کلمات تطبیقی گرامری ، به عنوان مثال ، جمع ، انواع کلامی که اهمیت مشابهی دارند) ، تخلیه URL و غیره پس از این پیشرفت ، هر مؤلفه محتوا - یک جمله به دلیل رونق متن - در نظر گرفته می شودیک بردار n بعدی [3 ، 5 ، 18]. بنابراین ، استفاده از برخی از اندازه گیری ها در این فضا برای سنجش مقایسه بین اجزای متن قابل تصور است.
انتخاب و استخراج ویژگی ها: انتخاب مناسب و استخراج ویژگی ها نقش مهمی در پیشبرد دقت مدل دارد. از این رو ، برای استخراج ویژگی ها باید یک روش استخراج ویژگی مناسب انتخاب شود [3].
طبقه بندی احساسات: در این مرحله ، از تکنیک های مختلف طبقه بندی احساسات برای طبقه بندی متن استفاده می شود. برخی از تکنیک های طبقه بندی احساساتی محبوب ، ماشین آلات وکتور پشتیبانی (NB) و پشتیبانی (SVM) هستند. این کل اسناد یا متن را طبقه بندی می کند یا مطابق عقاید مربوط به اشیاء خاص است [3].
تشخیص قطبیت: پس از طبقه بندی احساسات ، قطبیت احساسات تعیین می شود. هدف از تشخیص قطبیت ، تأثیر احساسات مثبت ، منفی یا خنثی است. اگر قطبیت مثبت باشد ، این یک شاخص قدرتمند از شی مورد بحث است. در غیر این صورت ، منفی است ، بنابراین یک شاخص ناامیدکننده برای این شی است. در غیر این صورت ، این هیچ تأثیر جدیدی بر این شی نیست.
اعتبار سنجی و ارزیابی: سرانجام ، اعتبار سنجی و ارزیابی نتایج به دست آمده برای تعیین دقت کلی تکنیک های مورد استفاده برای تجزیه و تحلیل احساسات انجام می شود. در این مرحله ، برخی از معیارهای ارزیابی برای تعیین کیفیت فرآیند تجزیه و تحلیل احساسات مانند دقت و معیارهای خطا استفاده می شود.
مراحل تحلیل احساسات
یادگیری ماشین و تجزیه و تحلیل سهام
یادگیری ماشین به طور گسترده ای در فرآیندهای پیش بینی و توصیه مانند رگرسیون خطی ، جنگل تصادفی ، درخت تصمیم گیری ، نزدیکترین همسایگان و شبکه های عصبی مانند شبکه های عصبی حلقوی (CNN) و شبکه های عصبی مکرر مانند حافظه کوتاه مدت کوتاه استفاده می شود (LSTM). stacked- lstm ، و LSTM دو طرفه همانطور که در نظرسنجی بحث شده است که توسط نویسندگان در [19] معرفی شده است. سیستم ما مبتنی بر استفاده از جنگل تصادفی و LSTM انباشته شده در فرآیند تجزیه و تحلیل و پردازش است. جنگل تصادفی یک گروه از درختان تصادفی ایجاد می کند. تعداد درختان توسط کاربر تعیین می شود. هر درخت فرآیند پیش بینی را برای همان ورودی انجام می دهد. در پایان ، RF خروجی را بر اساس روند رای گیری برای همه درختان تعیین می کند [19]. جنگل تصادفی به عنوان طبقه بندی کننده متشکل از مجموعه ای از طبقه بندی کننده های ساختار یافته درخت تعریف شده است. ایده اصلی RF این است که عملکرد بسیاری از مدلهای نسبتاً غیر مرتبط (درختان) از هر یک از مدلهای تشکیل دهنده فردی بهتر عمل می کنند [19]. کلاس خروجی همان خروجی درختی است که اکثریت آن را دارد. عملکرد RF در شکل 2 نشان داده شده است.
عملکرد جنگل تصادفی
همچنین چندین مدل شبکه عصبی وجود دارد که میتواند در فرآیند تحلیل سهام برای فرآیند پیشبینی قیمت سهام و/یا روند سهام مانند شبکه عصبی کانولوشن (CNN) و شبکههای عصبی تکراری مانند حافظه بلند مدت - کوتاه مدت (LSTM) استفاده شود.)، انباشته – LSTM و LSTM دوطرفه. در مدل ما، Stacke d-LSTM برای پردازش و تجزیه و تحلیل علاوه بر RF استفاده می شود. عملکرد Stacked-LSTM در شکل 3 توضیح داده شده است. Stacked LSTM توسعه ای از LSTM است که دارای چندین لایه پنهان LSTM است که در آن هر لایه حاوی چندین سلول حافظه است. همانطور که در LSTM، یک لایه پنهان وجود دارد، LSTM برای حل مشکل CNN ظاهر می شود، همانطور که در CNN، هیچ بازخوردی از خروجی به ورودی وجود ندارد. برای حل این مشکل در CNN، مشکلات Overfitting و/یا underfitting ظاهر شد. RNN مشکلات اضافه برازش و/یا عدم تناسب CNN را حل می کند. اما RNN در ذخیره سازی حالت های ورودی برای مدت طولانی با مشکل مواجه است. بنابراین، نیاز به LSTM وجود دارد که بتواند ورودی را برای مدت طولانی با استفاده از واحد خاصی به نام واحد حافظه/حالت ذخیره کند [15]. LSTM حالت های قبلی ورودی را در سلول حافظه خود ذخیره می کند، بنابراین می تواند به طور موثر با مدل های بلند مدت کار کند و مشکل طولانی مدت RNN را حل کند. LSTM می تواند اطلاعات را از یا به حالت سلول حذف یا اضافه کند که به طور موثر توسط ساختارهایی به نام گیت انجام می شود. گیت های LSTM روشی برای انتقال اطلاعات هستند. آنها از یک لایه شبکه عصبی سیگموئید و یک عملیات ضرب نقطه ای تشکیل شده اند. یک LSTM از سه دروازه برای نظارت و محافظت از وضعیت سلول تشکیل شده است.
همانطور که Stacked-LSTM یک ماژول پیشرفته LSTM با چندین لایه مخفی برای افزایش عملکرد آموزشی است. این مکانیسم لایههای انباشته میتواند قدرت شبکههای عصبی را با اعمال یادگیری عمیق در دادهها برای ارائه پیشبینیهای دقیقتر بهبود بخشد. ارسال خروجی از هر لایه به عنوان ورودی لایه بعدی به مدل اجازه می دهد تا عمیقاً ویژگی استخراج را داشته باشد. شکل 4 عملکرد Stacke d-LSTM را نشان می دهد.
کار مرتبط
در دهه گذشته، تحلیل احساسات یک حوزه تحقیقاتی موثر برای دسترسی به حجم عظیمی از اطلاعات ادبی در رسانههای اجتماعی و مراحل خبری بوده است. همچنین، بسیاری از انواع تحقیقات بر روی فرآیند پیشبینی سهام متمرکز شدهاند. علاوه بر برخی تحقیقات اخیر که بر تأثیر کووید-19 بر اقتصاد به ویژه سهام متمرکز است. در این مقاله برخی از آنها را به شرح زیر معرفی می کنیم:
تجزیه و تحلیل احساسات: در سال 2021، علاوه بر [5]، نویسندگان چارچوبی را ارائه کردند که از تجزیه و تحلیل احساسات برای استخراج تأثیر کووید19 استفاده می کند. در سال 2020، [10] نویسندگان از تکنیکهای یادگیری ماشینی با اخبار رسانههای اجتماعی برای استخراج چگونگی تأثیر دادهها بر حرکت سهام استفاده میکنند. همچنین، [9] نویسندگان یک مدل پیشبینی ارائه کردند که در آن نویسندگان یک مدل پیشبینی برای قیمت سهام بر اساس تحلیل احساسات اخبار ارائه کردند. در سال 2019، [35] نویسندگان مدلی را پیشنهاد کردند که رابطه بین پستهای آنلاین و حرکت سهام را استخراج میکند. در نهایت، در [14] نویسندگان مدلی را با ترکیبی از بررسی تخصصی و حیاتی از طریق کاربرد علم اطلاعات و روشهای یادگیری ماشین برای پیشبینی تبلیغات سهام پیشنهاد کردند.
تجزیه و تحلیل سهام: در سال 2020، [29] نویسندگان مدلی برای انتظار هزینه سهام بر اساس شبکه عصبی LSTM و الگوریتم انتخاب ویژگی PCA پیشنهاد کردند. همچنین، در [25] نویسندگان یک روش پیشبینی به نام ارجاع متقابل به پیشبینی روند سهام مبتنی بر بورس را پیشنهاد کردند که روند آینده سهام را بر اساس دادههای روزانه سهام با استفاده از شبکه عصبی LSTM پیشبینی میکند. یک چارچوب مبتنی بر یادگیری عمیق در [32] پیشنهاد شده است که حرکت سهام را با استفاده از شبکه عصبی بازگشتی (RNN) و شبکه کانولوشن گراف پیش بینی می کند. علاوه بر [4] که در آن محققین مدل Stacked LSTM و پرسپترون چندلایه (MLP) را برای افزایش دقت پیشبینی سهام پیشنهاد کردند. در نهایت، نویسندگان [16] تبدیل موجک را به داده های سهام برای حذف نویز و بهبود دقت پیش بینی سهام اعمال کردند. محققان [30] یک مدل پیشبینی سهام بر اساس Stacked LSTM و پرسپترون چندلایه (MLP) برای افزایش دقت پیشبینی سهام معرفی کردند. نویسندگان [26] یک مدل پیشبینی سهام بر اساس LSTM و یک تکنیک توجه پیشنهاد کردند و سپس از تبدیل موجک برای پاک کردن نویز از دادههای موجودی تاریخی استفاده میکنند. در سال 2019، نویسندگان [33] یک حالت شبکه عصبی بازگشتی عمیق مرتبط بر اساس RNN مانند LSTM را برای افزایش دقت پیشبینی با استفاده از ورودیها و خروجیهای زیاد پیشنهاد کردند. در نهایت، در [15] نویسندگان الگوریتمی را با استفاده از دادههای بازار برای پیشبینی قیمت سهم با استفاده از یک شبکه عصبی تکراری مانند حافظه کوتاهمدت طولانی پیشنهاد کردند، که در آن وزنهای فرآیند برای هر نقطه داده با استفاده از نزول گرادیان تصادفی تصحیح میشوند.
COVID-19 و تجزیه و تحلیل سهام: در سال 2020 ، [17] نویسندگان با استفاده از تجزیه و تحلیل احساسات پیام توییتر ، یک مطالعه آماری از تأثیر COVID-19 را ارائه دادند. همچنین ، در [22] ، نویسندگان مدلی را برای پیش بینی قیمت سهام با استفاده از تجزیه و تحلیل شاخص COVID-19 و سهام ارائه دادند. علاوه بر [2] ، نویسندگان مطالعه ای را بر اساس پیش بینی موارد COVID-19 و سهام اسپانیا ارائه دادند. با استفاده از روش Suttearima.
درک می شود که چندین نویسنده تحقیقات زیادی در مورد تجزیه و تحلیل سهام ، تجزیه و تحلیل احساسات و تأثیر COVID-19 ارائه داده اند. بیشتر تکنیک ها با استفاده از تکنیک های ML یا DL ، مدل های تجزیه و تحلیل قیمت سهام را توسعه می دهند و برخی از محققان مدل های پیش بینی را بر اساس تجزیه و تحلیل احساسات اخبار اجتماعی توسعه می دهند.
سرانجام ، با ظاهر Covid-19 ، برخی از محققان در مورد تأثیر Covid-19 بر جهان ، به ویژه در مورد جنبش اقتصادی بحث می کنند. اما ، در این مقاله ، ما یک سیستم ترکیبی را پیشنهاد می کنیم که از مدل های ML و DL در کنار هم استفاده می کند تا دقت پیش بینی را افزایش دهد. علاوه بر استفاده از تجزیه و تحلیل داده های تاریخی با تجزیه و تحلیل احساسات خبری برای پیش بینی روند دقیق تر سهام با گسترش COVID-19.
علاوه بر کار با اخبار در زمان واقعی که نیازهای حافظه فرآیند تحلیل احساسات را حل می کند. سرانجام ، ما یک سیستم ترکیبی کارآمد با استفاده از تکنیک های ML و DL برای استفاده از تجزیه و تحلیل داده ها و تجزیه و تحلیل اخبار در زمان واقعی برای پیش بینی روند آینده سهام در طول اثر COVID-19 پیشنهاد می کنیم.
سیستم پیشنهادی
در این بخش سیستم پیشنهادی ما توضیح داده شده است. هدف اصلی سیستم پیشنهادی بررسی تأثیر COVID-19 بر اقتصاد ، به ویژه بازار سهام است. در ماه های گذشته ، یک بیماری جدید به نام COVID-19 ظاهر می شود که تأثیر ناگهانی جهان در کل داشته است. از آنجا که برخی از سهام به دلیل ظاهر COVID-19 با کاهش ناگهانی قیمت خود روبرو هستند ، در حالی که برخی دیگر قیمت بیشتری مانند سهام پزشکی دارند. در دوره گسترش COVID-19 ، افراد به خرید داروهای بیشتر از حد معمول هدایت می شوند که منجر به افزایش قیمت سهام پزشکی می شود. در صورت بروز هرگونه بیماری جدید که اقتصاد هر کشور را به طور مؤثر تهدید می کند ، می تواند از سیستم ما استفاده شود.
در سیستم پیشنهادی ، ما سعی می کنیم روند آینده سهام را بر اساس تجزیه و تحلیل متن رسانه های اجتماعی ، اخبار مالی و داده های تاریخی پیش بینی کنیم. این سیستم با هدف دستیابی به دقت پیش بینی بهتر نسبت به سایرین انجام شده است. در این سیستم ، ما سعی می کنیم از متن رسانه های اجتماعی و اخبار مربوط به پول استفاده کنیم تا تأثیر COVID-19 را در برخی از سهام مانند TSLA ، AMZ و GOOG پیش بینی کنیم. سیستم ما از چندین فرآیند فرعی تشکیل شده است همانطور که در شکل 5 نشان داده شده است. این فرآیندهای فرعی را می توان به شرح زیر توصیف کرد:
پیش بینی روند آینده بر اساس عناوین خبری COVID-19 تجزیه و تحلیل احساسات
تجزیه و تحلیل داده های تاریخی سهام
تجزیه و تحلیل بانک اطلاعاتی مختلط تجزیه و تحلیل احساسات و تجزیه و تحلیل داده های تاریخی