معرفی یک روش مبتنی بر یادگیری تقویتی برای تعیین زمان و تعداد مناسب خرید سهام
سال انتشار: 1403
نوع سند: مقاله ژورنالی
زبان: فارسی
مشاهده: 77
فایل این مقاله در 12 صفحه با فرمت PDF قابل دریافت می باشد
- صدور گواهی نمایه سازی
- من نویسنده این مقاله هستم
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
JR_ABMIR-2-1_006
تاریخ نمایه سازی: 6 اسفند 1403
چکیده مقاله:
نوسان قیمت و عدم اطمینان موجود در بازار، تعیین استراتژی بهینه برای خرید سهام را به یک فرایند پیچیده تبدیل کرده است. عدم تکرار شرایط یک معامله، لزوم یادگیری به صورت تعاملی را ایجاب می کند. یادگیری تقویتی یک روش یادگیری تعاملی است که تنها با استفاده از یک سیگنال اسکالر راندمان، می تواند پارامترهای سیستم را تنظیم نماید. در این مقاله با تعریف مناسب حالت های سیستم شامل گام زمانی، تعداد کل سهام خریداری شده تا گام زمانی فعلی، میزان انحراف معیار قیمت سهام از گام نخست تا گام زمانی مورد نظر و میزان تغییرات قیمت نسبت به گام زمانی قبل و همچنین تعریف مناسب سیگنال تقویتی، از روش یادگیری کیو به عنوان یکی از معروف ترین الگوریتم های یادگیری تقویتی برای تقریب توابع ارزش حالت-عمل استفاده می شود. در این پژوهش، بازار سهام با توجه به روابط ریاضی موجود، مدل شده و روش ارائه شده در آن به کار گرفته شده است. عملکرد استراتژی حاصل از مدل پیشنهادی با استراتژی بازگشت به میانگین در ۵۰۰۰ بازار شبیه سازی شده مورد مقایسه قرار گرفته است. نتایج نشان دهنده آن است که بهره گیری از مدل پیشنهادی در مقایسه با استراتژی بازگشت به میانگین نه تنها هزینه متوسط پایین تر، بلکه قابلیت اطمینان بسیار بالاتری نیز دارد.
کلیدواژه ها:
نویسندگان
ولی درهمی
دانشگاه یزد- دانشکده مهندسی کامپیوتر
فاطمه دره زرشکی
دانشگاه یزد، دانشکده مهندسی کامپیوتر