معرفی یک روش مبتنی بر یادگیری تقویتی برای تعیین زمان و تعداد مناسب خرید سهام

ولی درهمی; فاطمه دره زرشکی

معرفی یک روش مبتنی بر یادگیری تقویتی برای تعیین زمان و تعداد مناسب خرید سهام

محل انتشار: مجله پژوهش های نظری و کاربردی هوش ماشینی، دوره: 2، شماره: 1

سال انتشار: 1403

نوع سند: مقاله ژورنالی

زبان: فارسی

مشاهده: 146

فایل این مقاله در 12 صفحه با فرمت PDF قابل دریافت می باشد

دریافت فایل کامل مقاله

صدور گواهی نمایه سازی
من نویسنده این مقاله هستم

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

https://civilica.com/doc/2181567

شناسه ملی سند علمی:

JR_ABMIR-2-1_006

تاریخ نمایه سازی: 6 اسفند 1403

چکیده مقاله:

نوسان قیمت و عدم اطمینان موجود در بازار، تعیین استراتژی بهینه برای خرید سهام را به یک فرایند پیچیده تبدیل کرده است. عدم تکرار شرایط یک معامله، لزوم یادگیری به صورت تعاملی را ایجاب می کند. یادگیری تقویتی یک روش یادگیری تعاملی است که تنها با استفاده از یک سیگنال اسکالر راندمان، می تواند پارامترهای سیستم را تنظیم نماید. در این مقاله با تعریف مناسب حالت های سیستم شامل گام زمانی، تعداد کل سهام خریداری شده تا گام زمانی فعلی، میزان انحراف معیار قیمت سهام از گام نخست تا گام زمانی مورد نظر و میزان تغییرات قیمت نسبت به گام زمانی قبل و همچنین تعریف مناسب سیگنال تقویتی، از روش یادگیری کیو به عنوان یکی از معروف ترین الگوریتم های یادگیری تقویتی برای تقریب توابع ارزش حالت-عمل استفاده می شود. در این پژوهش، بازار سهام با توجه به روابط ریاضی موجود، مدل شده و روش ارائه شده در آن به کار گرفته شده است. عملکرد استراتژی حاصل از مدل پیشنهادی با استراتژی بازگشت به میانگین در ۵۰۰۰ بازار شبیه سازی شده مورد مقایسه قرار گرفته است. نتایج نشان دهنده آن است که بهره گیری از مدل پیشنهادی در مقایسه با استراتژی بازگشت به میانگین نه تنها هزینه متوسط پایین تر، بلکه قابلیت اطمینان بسیار بالاتری نیز دارد.

کلیدواژه ها:

بازار سهام ، بهینه سازی هزینه های اجرایی سهام ، یادگیری تقویتی ، یادگیری کیو

نویسندگان

ولی درهمی

دانشگاه یزد- دانشکده مهندسی کامپیوتر

فاطمه دره زرشکی

دانشگاه یزد، دانشکده مهندسی کامپیوتر