یک سیستم پیش‌بینی روند سهام ترکیبی کارآمد در طول همه‌گیری کووید-19 بر اساس تجزیه‌وتحلیل LSTM انباشته و احساسات خبری

  • 2022-05-17

ویروس کرونا ویروسی مقاومت ناپذیر است که به طور کلی بر چارچوب تنفسی تأثیر می گذارد. تأثیر مؤثری بر اقتصاد جهانی به ویژه بر حرکت مالی بازارهای سهام دارد. اخیراً پیش بینی دقیق بازار سهام مورد توجه سرمایه گذاران قرار گرفته است. تغییر ناگهانی در حرکت سهام به دلیل ظهور COVID-19 باعث ایجاد مشکلاتی برای سرمایه گذاران می شود. از این نقطه، ما یک سیستم کارآمد را پیشنهاد می‌کنیم که از تحلیل احساسات اخبار و مقالات COVID-19 برای استخراج تأثیر نهایی COVID-19 بر بازار سهام مالی استفاده می‌کند. در این مقاله، ما یک سیستم پیش‌بینی بازار سهام را پیشنهاد می‌کنیم که حرکت سهام را با گسترش COVID استخراج می‌کند. پیش بینی تأثیر این بیماری ها بر اقتصاد برای آمادگی برای هر گونه تغییر بیماری و حفاظت از اقتصاد مهم است. در این مقاله، ما از تحلیل احساساتی برای سرفصل‌های اخبار سهام برای پیش‌بینی روند روزانه آتی سهام در دوره COVID-19 استفاده می‌کنیم. همچنین، ما از طبقه‌بندی‌کننده‌های یادگیری ماشینی برای پیش‌بینی تأثیر نهایی COVID-19 بر برخی سهام مانند سهام TSLA، AMZ و GOOG استفاده می‌کنیم. برای بهبود عملکرد و کیفیت پیش‌بینی‌های روند آینده، انتخاب ویژگی و کاهش توییت‌های هرزنامه بر روی مجموعه داده‌ها انجام می‌شود. در نهایت، سیستم پیشنهادی ما یک سیستم ترکیبی است که متن کاوی را در داده‌کاوی رسانه‌های اجتماعی روی مجموعه داده‌های سهام تاریخی اعمال می‌کند تا کل عملکرد پیش‌بینی را بهبود بخشد. سیستم پیشنهادی حرکت سهام را برای TSLA، AMZ و GOOG با میانگین دقت پیش‌بینی به ترتیب 90، 91. 6 و 92. 3 درصد پیش‌بینی می‌کند.

روی یک دست نوشته کار می کنید؟

مقدمه

این روزها، جهان ناگهان دچار بلایایی به نام کووید-19 شده است. با موافقت سازمان بهداشت جهانی (WHO)، کرونا ویروس خطرناک و خطرناکی است که از هم اکنون در جهان وجود دارد. از آنجایی که ویروس‌های عفونی به طور مداوم خطری برای نوع بشر بوده‌اند، به‌ویژه آنهایی که در اطراف آن‌ها اطلاعات کوچک یا هیچ چیز مانند COVID-19 وجود ندارد [21]. کووید 19، برای شروع، در ووهان، منطقه هوبی، چین در دسامبر 2019 آموزش دیده است. کووید-19 یک ویروس مقاومت ناپذیر است که توسط یک کروناویروس مدرن (SARS-CoV-2) که در چین یافت می شود، ایجاد می شود. بر اساس اطلاعات WHO (2020)، تا 6 آوریل 2020، 1،210،956 مورد تایید شده و 67،594 مورد تایید وجود داشته است [21]. در اسپانیا، موارد COVID-19 در روز 12 فوریه ماه سال 2020 شناسایی شد. قابل توجه ترین گسترش موارد کووید-19 در 26 مارس 2020 با 8271 مورد (World meter, 2020) رخ داد [1]. بر اساس اطلاعات نمایش داده شده توسط World meter در 8 آوریل 2020، تعداد موارد تایید شده کووید-19 در اسپانیا 148220 نفر با 14792 مورد عبور بوده و 48021 نفر بهبود یافته اند و دومین کشور برتر جهان با موارد تایید شده کووید-19 هستند.-19 (متر جهانی، 2020) [1].

حرکت اقتصادی تحت تأثیر عوامل ناگهانی مانند بیماری های جدید است. بنابراین، اقتصاد به شدت تحت تأثیر ظاهر Covid-19 است. تأثیر عوامل جدید بر اقتصاد به‌ویژه بازارهای سهام را می‌توان از اخبار و تاریخچه تغییرات داده‌های آن در این دوره استخراج کرد [21]. در این مقاله، ما سیستمی را پیشنهاد می‌کنیم که حرکت آتی سهام را بر اساس تحلیل احساسات خبری و تحلیل داده‌های تاریخی سهام پیش‌بینی می‌کند.

سفته بازی در ویترین سهام ناامن است، اما زمانی که به روشی آموزش داده شده نزدیکتر شود، یکی از مهمترین راههای موثر برای درک مزایای قابل توجه است [12]. اخیراً، بیشتر توصیه‌ها و سیستم‌های تصمیم‌گیری بر اساس نتیجه پیش‌بینی، به‌ویژه در زمینه مالی است. بنابراین لازم است پیش‌بینی‌های دقیقی در مرحله تصمیم‌گیری ارائه شود تا سرمایه‌گذاران از پس‌انداز سهام خود کمک کنند [20]. متخصصان مالی اجرای شرکتی را ارزیابی می کنند که اخیراً تصمیم به خرید سهام خود برای طفره رفتن از خرید سهام ناامن کرده است [12، 19، 20]. این ارزیابی شامل بررسی عملکرد شرکت در رسانه های اجتماعی و وب سایت های خبری بودجه است. در هر صورت، متخصصان مالی نمی توانند از چنین حجم عظیمی از رسانه های اجتماعی و اطلاعات خبری مرتبط با پول استفاده کنند. پس از آن، لازم است یک چارچوب تقویت کننده انتخاب کامپیوتری برای کمک به سفته بازان کشف شود، زیرا این سیستم الگوهای سهام را در نتیجه با استفاده از تجزیه و تحلیل این مبالغ گسترده اطلاعات پیش بینی می کند.

این چارچوب روباتیک را می توان با استفاده از محاسبات یادگیری ماشین و مبانی تحلیل احساسات ساخته شد. یافتن الگوریتم هایی که عملیات حساس تر و حیاتی تر هستند. رسانه‌های اجتماعی و وب‌سایت‌های خبری بودجه‌ای که به‌عنوان منابع اطلاعات خارجی برای نمایش یادگیری ماشین پیشنهادی ما در نظر گرفته می‌شوند، اطلاعات محتوای خام را در قالب مقالات و سرفصل‌های اخبار ارائه می‌کنند. این اطلاعات خام با محاسبات یادگیری ماشینی قابل توجیه نیست. داده ها باید از قبل پردازش شوند تا متن ناخواسته حذف شود و کلمات متوقف شوند. در رویکرد تحلیل بنیادی، باید از زبان های طبیعی برای پیش پردازش داده های متنی استفاده شود [1].

تحلیل و پیش‌بینی سری‌های زمانی مالی، به‌ویژه پیش‌بینی قیمت سهام، یکی از زمینه‌های پژوهشی مؤثر است و دانشمندان و کارشناسان بسیاری را به خود جذب کرده است. چندین تکنیک برای پیش‌بینی غیرخطی بودن سری‌های زمانی و بهبود دقت پیش‌بینی روند سهام با استفاده از یادگیری ماشین یا یادگیری عمیق توسعه داده شده‌اند. از آنجایی که داده‌های سهام طبیعتاً پر سر و صدا و ناپایدار هستند، نیاز به یک مدل مؤثر وجود دارد که با داده‌های تاریخی کار کند. حجم عظیمی از اخبار و مقالات وجود دارد که تأثیر کووید-19 را بر اقتصاد، به ویژه توسعه سهام توصیف می کند [1، 21]. بنابراین استفاده و استفاده از این خبر می تواند در پیش بینی روند آتی حرکت سهام جذاب باشد. توسعه مدلی که بتواند تأثیر بیماری های جدید بر اقتصاد مانند کووید-19 را پیش بینی کند بسیار مهم است، زیرا این می تواند به محافظت از اقتصاد در برابر ضرر کمک کند. همچنین، این عملیات برای سرمایه گذاران موثرتر است، زیرا به سرمایه گذاران کمک می کند تا از پول خود محافظت کنند. اما، برای کار با اخبار و داده های متنی، یک مشکل بزرگ با نیازهای ذخیره سازی است. برای این مشکل، توسعه مدلی برای کار با اخبار و داده های متنی بدون نیاز به ذخیره سازی ضروری است. این مشکل توسط سیستم پیشنهادی ما که با عناوین اخبار بلادرنگ کار می کند، حل شده است.

در نتیجه، این مقاله یک سیستم خودکار ترکیبی را ارائه می‌کند که از ماژول‌های مختلفی مانند ماژول تحلیل تاریخی، ماژول تحلیل احساسات، ماژول تجزیه و تحلیل ترکیبی و ماژول تحلیل نهایی برای پیش‌بینی روند بازار در طول همه‌گیری COVID-19 کنونی تشکیل شده است. سهم این مقاله را می توان به شرح زیر خلاصه کرد:

مفاهیم تحلیل احساسات و پیش بینی سهام را ارائه می دهد.

یک ماژول کارآمد برای پیش‌بینی روند آینده سهام از طریق احساسات خبری از طریق اخبار بلادرنگ ارائه کنید و طبقه‌بندی‌کننده‌های یادگیری ماشین را روی اخبار سهام با یک الگوریتم انتخاب ویژگی کارآمد برای کاهش ابعاد داده‌های داده‌های به‌دست‌آمده اعمال کنید.

با ارائه موارد زیر، ماژول‌های مؤثری را برای اهداف پیش‌بینی روند آینده سهام در تاریخ ارائه کنید:

تجزیه و تحلیل داده‌های تاریخی با استفاده از طبقه‌بندی‌کننده‌های یادگیری ماشین برای ذخیره داده‌های تاریخی با انتخاب ویژگی کارآمد و فرآیند عادی‌سازی داده‌ها.

پیش‌بینی روند آینده تاریخی سهام از طریق تجزیه و تحلیل داده‌های تاریخی به علاوه تحلیل اخبار و استفاده از طبقه‌بندی‌کننده‌های ML و یک الگوریتم انتخاب ویژگی کارآمد برای داده‌های ترکیبی.

یک سیستم ترکیبی ماهر برای پیش‌بینی روند سهام و حرکت با استفاده و بهره‌برداری از LSTM با تکنیک‌های Sentiment پیشنهاد کنید. این استفاده خروجی همه ماژول های قبلی را دریافت می کند و طبقه بندی کننده های DL مانند Stacked-LSTM را اعمال می کند.

انجام یک ارزیابی سیستماتیک از سیستم پیشنهادی از طریق آزمایش های مختلف بر روی مجموعه داده های مختلف. از نتایج، سیستم پیشنهادی در مقایسه با روش‌های موجود، عملکرد خوبی از خود نشان داد.

بقیه این مقاله به شرح زیر تهیه شده است: بخش 2 یک پایه مختصر در مورد پیش بینی سهام علاوه بر تجزیه و تحلیل احساسات ارائه می دهد. بخش 3 تحقیقات مرتبط در حوزه پیش بینی سهام را مورد بحث قرار می دهد. بخش 4 مدل پیش بینی سهام پیشنهادی را معرفی می کند در حالی که بخش 5 مطالعه محیطی تجربی را نشان می دهد. نتایج آزمایشات ما در بخش 6 ارائه و مورد بحث قرار می گیرد در حالی که این مقاله نتیجه گیری خود را در بخش 7 ارائه می دهد.

دانش مقدماتی

در این قسمت مروری بر تحلیل احساسات و سهام و برخی از الگوریتم‌های یادگیری ماشینی و عمیق را معرفی می‌کنیم. بازار سهام به سهامداران اجازه می دهد تا سهام شرکت های سهامی عام را از طریق معامله در بورس یا بازارهای خارج از بورس داشته باشند. این بازار به سرمایه گذاران فرصت دستیابی به سود و داشتن زندگی مرفه را از طریق سرمایه گذاری مقادیر اندک اولیه پول داده است [19]. توانایی پیش‌بینی قیمت سهام موضوع مهمی در حوزه دانشگاهی و همچنین کسب‌وکار است [19]. بازار سهام منطقه ای است که سهام را می توان انتقال، معامله و توزیع کرد. این کانال مهمی برای شرکت های بزرگ برای جذب سرمایه از سهامداران در نظر گرفته شده است. از یک سو، از طریق انتشار سهام، مقدار زیادی سرمایه به بازار سهام سرازیر می‌شود که با ارتقای تمرکز سرمایه، پیکربندی ارگانیک سرمایه شرکت را تقویت می‌کند [19]. اما فرآیند پیش‌بینی قیمت سهام و روند آتی سهام به دلیل ویژگی‌های سهام مانند نویز و نوسانات، عموماً فرآیندی دشوار و پیچیده در نظر گرفته می‌شود. با این حال، مکانیسم توسعه پیش‌بینی روند سهام بسیار پیچیده است. زیرا مستلزم اختلاط در استفاده بین عوامل مختلف و رفتار خاص عوامل فردی از جمله عوامل سیاسی، اقتصادی و بازار و همچنین فناوری و رفتار سرمایه گذار است که همگی منجر به تغییر در قیمت سهام می شود [19].

در بازارهای سهام فعلی، نظر مشتریان و اخبار منتشر شده اعم از مثبت یا منفی، شاخص قابل توجهی از ارزش آتی آن سهام است [19]. تجزیه و تحلیل احساسات برای این داده ها یک فرآیند مهم است که بر حرکت بعدی این سهام تأثیر می گذارد. بنابراین، این فرآیند باید به طور دقیق و کارآمد انجام شود [19]. پیش‌بینی دقیق قیمت آتی سهام، سود سهامداران را بهبود می‌بخشد [19]. از آنجایی که حجم عظیمی از داده‌های تولید شده توسط بخش مالی مانند داده‌های مشتری، گزارش‌های مربوط به محصولات مالی آنها و داده‌های عملیاتی وجود دارد. این می تواند با داده های خارجی مانند داده های رسانه های اجتماعی و داده های وب سایت ها برای کمک به فرآیند تصمیم گیری ادغام شود [19]. تحلیل احساسات ابزاری مفید برای پیش‌بینی قیمت سهام است. با تجزیه و تحلیل داده های تاریخی سهام و/یا داده های آنلاین مربوط به سهام برای پیش بینی قیمت آتی این سهم. همچنین می تواند بهترین گام برای سیستم توصیه باشد که می تواند بهترین زمان را برای فروش و خرید سهام توصیه کند [24]. با تجزیه و تحلیل اخبار مالی از طریق فرآیند تحلیل احساسات، سیستم می تواند جهت حرکت سهام را تعیین کند. تجزیه و تحلیل احساسات استخراج خودکار دیدگاه‌ها و احساسات را از محتوای مورد نظر فراهم می‌کند. برای استخراج خودکار دیدگاه‌ها، نگرش‌ها و احساسات از محتوای مورد نظر استفاده می‌شود.

تجزیه و تحلیل سهام

مبادلات مالی بخش پر انرژی اقتصاد یک کشور است. شاید این بزرگترین درب باز برای سرمایه گذاری توسط سازمان ها و متخصصان مالی باشد. یک سازمان می تواند با رشد کسب و کار خود از طریق عرضه های عمومی اولیه، پول نقد را افزایش دهد. این یک فرصت ایده آل مناسب برای یک سفته باز است تا سهام جدید بخرد و مزایای بیشتری از سود ارائه شده در برنامه پاداش سازمان به دست آورد [1]. بنابراین، استخراج تأثیر اخبار مهم مانند اخبار COVID بر این سهام مهم است. این فرآیند را می توان با اعمال تحلیل احساسات در اخبار و مقالات رسانه های اجتماعی برای استخراج تأثیر اخبار بر این سهام انجام داد.

کارگزاران بورس باید الگوهایی را در رفتار مبادلات مالی پیش بینی کنند تا در مورد فرآیند فروش، نگهداری سهامی که در اختیار دارند یا خرید سهام دیگر، انتخاب درستی داشته باشند [12]. در صورت روند مثبت، قیمت سهام افزایش می یابد، بنابراین سرمایه گذار باید این سهام را خریداری کند. در غیر این صورت، در صورت روند منفی، چون قیمت سهام کاهش می یابد، پس بهتر است سرمایه گذار این سهام را بفروشد. در غیر این صورت، سرمایه گذار باید سهام خود را در صورتی که روند آتی آن عصبی باشد، نگه دارد. در این راستا، پیش‌بینی الگوهای آتی مبادلات مالی برای پویایی کارگزاران سهام قابل توجه است. در هر صورت، مبادلات اوراق بهادار ناپایدار هستند و پیش‌بینی آن دشوار است و عناصر بیرونی، مشابه رسانه‌های مبتنی بر وب و اخبار روزانه پولی، بر هزینه‌های سهام به‌طور قاطع یا معکوس تأثیر می‌گذارند. این متغیرها باید برای پیش بینی دقیق مبادلات مالی علمی باشند [6]. بسیاری از مدل‌های یادگیری ماشین و شبکه‌های عصبی به طور گسترده در فرآیندهای پیش‌بینی سهام مانند RF و Stacked - LSTM که در پیشنهاد ما استفاده می‌شوند، استفاده می‌شوند.

تحلیل احساسات

این یک واقعیت شناخته شده است که روندهای خبری به شدت بر ذهنیت افراد تأثیر می گذارد [13، 24]. در دهه گذشته، تجزیه و تحلیل احساسات به دلیل دسترسی به حجم عظیمی از اطلاعات ادبی از طریق رسانه های آنلاین و مراحل خبری، به یک حوزه تحقیقاتی مؤثر تبدیل شده است [27، 31]. این اطلاعات چاپی را می توان برای یافتن ارزیابی های مشتریان برای مناطق کاربردی مختلف بررسی کرد. برای ارزیابی این حجم عظیم از اطلاعات ادبی، اطلاعات کاوی و هوش مصنوعی اهمیت فوق‌العاده‌ای را بیان می‌کنند. فرآیندی که از یادگیری ماشین و الگوریتم‌های یادگیری عمیق برای تعیین مثبت و منفی محتوای متن استفاده می‌کند، به عنوان تحلیل احساسات شناخته می‌شود. این عملیات استخراج اطلاعات معنی دار از متن بدون ساختار است. متن کاوی فرآیند استخراج کلمات مرتبط و روابط بین آنها برای تسهیل طبقه بندی آنها است. بنابراین، تحلیل احساسات می تواند در متن کاوی استفاده شود. کارکرد اساسی تحلیل احساسات استخراج احساس از متن متن است [23]. به همین ترتیب، می‌توان از آن در فرآیند نظرکاوی استفاده کرد، زیرا نظرکاوی استخراج، تجزیه و تحلیل و طبقه‌بندی نظرات متعدد از چندین منبع خبری آنلاین است [5، 7، 18، 34].

مراحل فرآیند تحلیل احساسات عمومی [3] همانطور که در شکل 1 نشان داده شده است عبارتند از:

کسب داده ها: این مرحله جمع آوری داده های متنی برای ساخت یک مجموعه داده مناسب مناسب برای پردازش بعدی است. منابع مختلفی برای جمع آوری اخبار و مقالاتی مانند توییتر ، فین ویز ، فیس بوک و غیره وجود دارد [3 ، 5 ، 18].

پیش پردازش متن: این مرحله یک عمل مهم و مؤثر است ، جایی که متن ناخواسته و بی فایده مانند کلمات متوقف شده (کلمات منظم و بدون معنایی و هیچ گونه داده مربوط به موارد ، به عنوان مثال "A" حذف می شود."an") ، حاکم بر (کلمات تطبیقی گرامری ، به عنوان مثال ، جمع ، انواع کلامی که اهمیت مشابهی دارند) ، تخلیه URL و غیره پس از این پیشرفت ، هر مؤلفه محتوا - یک جمله به دلیل رونق متن - در نظر گرفته می شودیک بردار n بعدی [3 ، 5 ، 18]. بنابراین ، استفاده از برخی از اندازه گیری ها در این فضا برای سنجش مقایسه بین اجزای متن قابل تصور است.

انتخاب و استخراج ویژگی ها: انتخاب مناسب و استخراج ویژگی ها نقش مهمی در پیشبرد دقت مدل دارد. از این رو ، برای استخراج ویژگی ها باید یک روش استخراج ویژگی مناسب انتخاب شود [3].

طبقه بندی احساسات: در این مرحله ، از تکنیک های مختلف طبقه بندی احساسات برای طبقه بندی متن استفاده می شود. برخی از تکنیک های طبقه بندی احساساتی محبوب ، ماشین آلات وکتور پشتیبانی (NB) و پشتیبانی (SVM) هستند. این کل اسناد یا متن را طبقه بندی می کند یا مطابق عقاید مربوط به اشیاء خاص است [3].

تشخیص قطبیت: پس از طبقه بندی احساسات ، قطبیت احساسات تعیین می شود. هدف از تشخیص قطبیت ، تأثیر احساسات مثبت ، منفی یا خنثی است. اگر قطبیت مثبت باشد ، این یک شاخص قدرتمند از شی مورد بحث است. در غیر این صورت ، منفی است ، بنابراین یک شاخص ناامیدکننده برای این شی است. در غیر این صورت ، این هیچ تأثیر جدیدی بر این شی نیست.

اعتبار سنجی و ارزیابی: سرانجام ، اعتبار سنجی و ارزیابی نتایج به دست آمده برای تعیین دقت کلی تکنیک های مورد استفاده برای تجزیه و تحلیل احساسات انجام می شود. در این مرحله ، برخی از معیارهای ارزیابی برای تعیین کیفیت فرآیند تجزیه و تحلیل احساسات مانند دقت و معیارهای خطا استفاده می شود.

figure 1

مراحل تحلیل احساسات

یادگیری ماشین و تجزیه و تحلیل سهام

یادگیری ماشین به طور گسترده ای در فرآیندهای پیش بینی و توصیه مانند رگرسیون خطی ، جنگل تصادفی ، درخت تصمیم گیری ، نزدیکترین همسایگان و شبکه های عصبی مانند شبکه های عصبی حلقوی (CNN) و شبکه های عصبی مکرر مانند حافظه کوتاه مدت کوتاه استفاده می شود (LSTM). stacked- lstm ، و LSTM دو طرفه همانطور که در نظرسنجی بحث شده است که توسط نویسندگان در [19] معرفی شده است. سیستم ما مبتنی بر استفاده از جنگل تصادفی و LSTM انباشته شده در فرآیند تجزیه و تحلیل و پردازش است. جنگل تصادفی یک گروه از درختان تصادفی ایجاد می کند. تعداد درختان توسط کاربر تعیین می شود. هر درخت فرآیند پیش بینی را برای همان ورودی انجام می دهد. در پایان ، RF خروجی را بر اساس روند رای گیری برای همه درختان تعیین می کند [19]. جنگل تصادفی به عنوان طبقه بندی کننده متشکل از مجموعه ای از طبقه بندی کننده های ساختار یافته درخت تعریف شده است. ایده اصلی RF این است که عملکرد بسیاری از مدلهای نسبتاً غیر مرتبط (درختان) از هر یک از مدلهای تشکیل دهنده فردی بهتر عمل می کنند [19]. کلاس خروجی همان خروجی درختی است که اکثریت آن را دارد. عملکرد RF در شکل 2 نشان داده شده است.

figure 2

عملکرد جنگل تصادفی

همچنین چندین مدل شبکه عصبی وجود دارد که می‌تواند در فرآیند تحلیل سهام برای فرآیند پیش‌بینی قیمت سهام و/یا روند سهام مانند شبکه عصبی کانولوشن (CNN) و شبکه‌های عصبی تکراری مانند حافظه بلند مدت - کوتاه مدت (LSTM) استفاده شود.)، انباشته – LSTM و LSTM دوطرفه. در مدل ما، Stacke d-LSTM برای پردازش و تجزیه و تحلیل علاوه بر RF استفاده می شود. عملکرد Stacked-LSTM در شکل 3 توضیح داده شده است. Stacked LSTM توسعه ای از LSTM است که دارای چندین لایه پنهان LSTM است که در آن هر لایه حاوی چندین سلول حافظه است. همانطور که در LSTM، یک لایه پنهان وجود دارد، LSTM برای حل مشکل CNN ظاهر می شود، همانطور که در CNN، هیچ بازخوردی از خروجی به ورودی وجود ندارد. برای حل این مشکل در CNN، مشکلات Overfitting و/یا underfitting ظاهر شد. RNN مشکلات اضافه برازش و/یا عدم تناسب CNN را حل می کند. اما RNN در ذخیره سازی حالت های ورودی برای مدت طولانی با مشکل مواجه است. بنابراین، نیاز به LSTM وجود دارد که بتواند ورودی را برای مدت طولانی با استفاده از واحد خاصی به نام واحد حافظه/حالت ذخیره کند [15]. LSTM حالت های قبلی ورودی را در سلول حافظه خود ذخیره می کند، بنابراین می تواند به طور موثر با مدل های بلند مدت کار کند و مشکل طولانی مدت RNN را حل کند. LSTM می تواند اطلاعات را از یا به حالت سلول حذف یا اضافه کند که به طور موثر توسط ساختارهایی به نام گیت انجام می شود. گیت های LSTM روشی برای انتقال اطلاعات هستند. آنها از یک لایه شبکه عصبی سیگموئید و یک عملیات ضرب نقطه ای تشکیل شده اند. یک LSTM از سه دروازه برای نظارت و محافظت از وضعیت سلول تشکیل شده است.

figure 3

همانطور که Stacked-LSTM یک ماژول پیشرفته LSTM با چندین لایه مخفی برای افزایش عملکرد آموزشی است. این مکانیسم لایه‌های انباشته می‌تواند قدرت شبکه‌های عصبی را با اعمال یادگیری عمیق در داده‌ها برای ارائه پیش‌بینی‌های دقیق‌تر بهبود بخشد. ارسال خروجی از هر لایه به عنوان ورودی لایه بعدی به مدل اجازه می دهد تا عمیقاً ویژگی استخراج را داشته باشد. شکل 4 عملکرد Stacke d-LSTM را نشان می دهد.

figure 4

کار مرتبط

در دهه گذشته، تحلیل احساسات یک حوزه تحقیقاتی موثر برای دسترسی به حجم عظیمی از اطلاعات ادبی در رسانه‌های اجتماعی و مراحل خبری بوده است. همچنین، بسیاری از انواع تحقیقات بر روی فرآیند پیش‌بینی سهام متمرکز شده‌اند. علاوه بر برخی تحقیقات اخیر که بر تأثیر کووید-19 بر اقتصاد به ویژه سهام متمرکز است. در این مقاله برخی از آنها را به شرح زیر معرفی می کنیم:

تجزیه و تحلیل احساسات: در سال 2021، علاوه بر [5]، نویسندگان چارچوبی را ارائه کردند که از تجزیه و تحلیل احساسات برای استخراج تأثیر کووید19 استفاده می کند. در سال 2020، [10] نویسندگان از تکنیک‌های یادگیری ماشینی با اخبار رسانه‌های اجتماعی برای استخراج چگونگی تأثیر داده‌ها بر حرکت سهام استفاده می‌کنند. همچنین، [9] نویسندگان یک مدل پیش‌بینی ارائه کردند که در آن نویسندگان یک مدل پیش‌بینی برای قیمت سهام بر اساس تحلیل احساسات اخبار ارائه کردند. در سال 2019، [35] نویسندگان مدلی را پیشنهاد کردند که رابطه بین پست‌های آنلاین و حرکت سهام را استخراج می‌کند. در نهایت، در [14] نویسندگان مدلی را با ترکیبی از بررسی تخصصی و حیاتی از طریق کاربرد علم اطلاعات و روش‌های یادگیری ماشین برای پیش‌بینی تبلیغات سهام پیشنهاد کردند.

تجزیه و تحلیل سهام: در سال 2020، [29] نویسندگان مدلی برای انتظار هزینه سهام بر اساس شبکه عصبی LSTM و الگوریتم انتخاب ویژگی PCA پیشنهاد کردند. همچنین، در [25] نویسندگان یک روش پیش‌بینی به نام ارجاع متقابل به پیش‌بینی روند سهام مبتنی بر بورس را پیشنهاد کردند که روند آینده سهام را بر اساس داده‌های روزانه سهام با استفاده از شبکه عصبی LSTM پیش‌بینی می‌کند. یک چارچوب مبتنی بر یادگیری عمیق در [32] پیشنهاد شده است که حرکت سهام را با استفاده از شبکه عصبی بازگشتی (RNN) و شبکه کانولوشن گراف پیش بینی می کند. علاوه بر [4] که در آن محققین مدل Stacked LSTM و پرسپترون چندلایه (MLP) را برای افزایش دقت پیش‌بینی سهام پیشنهاد کردند. در نهایت، نویسندگان [16] تبدیل موجک را به داده های سهام برای حذف نویز و بهبود دقت پیش بینی سهام اعمال کردند. محققان [30] یک مدل پیش‌بینی سهام بر اساس Stacked LSTM و پرسپترون چندلایه (MLP) برای افزایش دقت پیش‌بینی سهام معرفی کردند. نویسندگان [26] یک مدل پیش‌بینی سهام بر اساس LSTM و یک تکنیک توجه پیشنهاد کردند و سپس از تبدیل موجک برای پاک کردن نویز از داده‌های موجودی تاریخی استفاده می‌کنند. در سال 2019، نویسندگان [33] یک حالت شبکه عصبی بازگشتی عمیق مرتبط بر اساس RNN مانند LSTM را برای افزایش دقت پیش‌بینی با استفاده از ورودی‌ها و خروجی‌های زیاد پیشنهاد کردند. در نهایت، در [15] نویسندگان الگوریتمی را با استفاده از داده‌های بازار برای پیش‌بینی قیمت سهم با استفاده از یک شبکه عصبی تکراری مانند حافظه کوتاه‌مدت طولانی پیشنهاد کردند، که در آن وزن‌های فرآیند برای هر نقطه داده با استفاده از نزول گرادیان تصادفی تصحیح می‌شوند.

COVID-19 و تجزیه و تحلیل سهام: در سال 2020 ، [17] نویسندگان با استفاده از تجزیه و تحلیل احساسات پیام توییتر ، یک مطالعه آماری از تأثیر COVID-19 را ارائه دادند. همچنین ، در [22] ، نویسندگان مدلی را برای پیش بینی قیمت سهام با استفاده از تجزیه و تحلیل شاخص COVID-19 و سهام ارائه دادند. علاوه بر [2] ، نویسندگان مطالعه ای را بر اساس پیش بینی موارد COVID-19 و سهام اسپانیا ارائه دادند. با استفاده از روش Suttearima.

درک می شود که چندین نویسنده تحقیقات زیادی در مورد تجزیه و تحلیل سهام ، تجزیه و تحلیل احساسات و تأثیر COVID-19 ارائه داده اند. بیشتر تکنیک ها با استفاده از تکنیک های ML یا DL ، مدل های تجزیه و تحلیل قیمت سهام را توسعه می دهند و برخی از محققان مدل های پیش بینی را بر اساس تجزیه و تحلیل احساسات اخبار اجتماعی توسعه می دهند.

سرانجام ، با ظاهر Covid-19 ، برخی از محققان در مورد تأثیر Covid-19 بر جهان ، به ویژه در مورد جنبش اقتصادی بحث می کنند. اما ، در این مقاله ، ما یک سیستم ترکیبی را پیشنهاد می کنیم که از مدل های ML و DL در کنار هم استفاده می کند تا دقت پیش بینی را افزایش دهد. علاوه بر استفاده از تجزیه و تحلیل داده های تاریخی با تجزیه و تحلیل احساسات خبری برای پیش بینی روند دقیق تر سهام با گسترش COVID-19.

علاوه بر کار با اخبار در زمان واقعی که نیازهای حافظه فرآیند تحلیل احساسات را حل می کند. سرانجام ، ما یک سیستم ترکیبی کارآمد با استفاده از تکنیک های ML و DL برای استفاده از تجزیه و تحلیل داده ها و تجزیه و تحلیل اخبار در زمان واقعی برای پیش بینی روند آینده سهام در طول اثر COVID-19 پیشنهاد می کنیم.

سیستم پیشنهادی

در این بخش سیستم پیشنهادی ما توضیح داده شده است. هدف اصلی سیستم پیشنهادی بررسی تأثیر COVID-19 بر اقتصاد ، به ویژه بازار سهام است. در ماه های گذشته ، یک بیماری جدید به نام COVID-19 ظاهر می شود که تأثیر ناگهانی جهان در کل داشته است. از آنجا که برخی از سهام به دلیل ظاهر COVID-19 با کاهش ناگهانی قیمت خود روبرو هستند ، در حالی که برخی دیگر قیمت بیشتری مانند سهام پزشکی دارند. در دوره گسترش COVID-19 ، افراد به خرید داروهای بیشتر از حد معمول هدایت می شوند که منجر به افزایش قیمت سهام پزشکی می شود. در صورت بروز هرگونه بیماری جدید که اقتصاد هر کشور را به طور مؤثر تهدید می کند ، می تواند از سیستم ما استفاده شود.

در سیستم پیشنهادی ، ما سعی می کنیم روند آینده سهام را بر اساس تجزیه و تحلیل متن رسانه های اجتماعی ، اخبار مالی و داده های تاریخی پیش بینی کنیم. این سیستم با هدف دستیابی به دقت پیش بینی بهتر نسبت به سایرین انجام شده است. در این سیستم ، ما سعی می کنیم از متن رسانه های اجتماعی و اخبار مربوط به پول استفاده کنیم تا تأثیر COVID-19 را در برخی از سهام مانند TSLA ، AMZ و GOOG پیش بینی کنیم. سیستم ما از چندین فرآیند فرعی تشکیل شده است همانطور که در شکل 5 نشان داده شده است. این فرآیندهای فرعی را می توان به شرح زیر توصیف کرد:

پیش بینی روند آینده بر اساس عناوین خبری COVID-19 تجزیه و تحلیل احساسات

تجزیه و تحلیل داده های تاریخی سهام

تجزیه و تحلیل بانک اطلاعاتی مختلط تجزیه و تحلیل احساسات و تجزیه و تحلیل داده های تاریخی

ثبت دیدگاه

مجموع دیدگاهها : 0در انتظار بررسی : 0انتشار یافته : ۰
قوانین ارسال دیدگاه
  • دیدگاه های ارسال شده توسط شما، پس از تایید توسط تیم مدیریت در وب منتشر خواهد شد.
  • پیام هایی که حاوی تهمت یا افترا باشد منتشر نخواهد شد.
  • پیام هایی که به غیر از زبان فارسی یا غیر مرتبط باشد منتشر نخواهد شد.