کاربرد یادگیری تقویتی در بهینه سازی مسیر ربات های هوشمند

سال انتشار: 1405
نوع سند: مقاله ژورنالی
زبان: فارسی
مشاهده: 38

فایل این مقاله در 9 صفحه با فرمت PDF قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

JR_PAYA-8-87_002

تاریخ نمایه سازی: 24 خرداد 1405

چکیده مقاله:

یادگیری تقویتی یکی از شاخه های هوش مصنوعی است که در آن ربات از طریق تجربه و تعامل با محیط یاد می گیرد چگونه عملکرد خود را بهینه کند. در مسئله ی بهینه سازی مسیر، ربات با حرکت در فضاهای مختلف و دریافت پاداش یا جریمه برای هر حرکت، به تدریج سیاستی می یابد که کوتاه ترین، ایمن ترین یا کم هزینه ترین مسیر را انتخاب کند. این روش بدون نیاز به مدل دقیق از محیط، به ربات اجازه می دهد تا در شرایط پویا و ناشناخته نیز بهینه ترین تصمیم را اتخاذ کند. در نتیجه، یادگیری تقویتی به ربات ها قابلیت خودسازگاری و تصمیم گیری هوشمند در محیط های پیچیده را می دهد. هدف پژوهش حاضر، کاربرد یادگیری تقویتی در بهینه سازی مسیر ربات های هوشمند می باشد. این پژوهش ازنظر هدف، کاربردی - نظری و ازنظر روش، توصیفی– تحلیلی است. اطلاعات و داده های موردنیاز از طریق روش کتابخانه ای جمع آوری شده است. یادگیری تقویتی چارچوبی قدرتمند برای بهینه سازی مسیر ربات های هوشمند است. در این رویکرد، ربات با آزمون و خطا در محیط خود یاد می گیرد؛ هر چه به هدف نزدیک تر شود پاداش می گیرد و با هر برخورد یا حرکت نامناسب جریمه می شود. الگوریتم ها به ربات امکان می دهند تا سیاست حرکتی بهینه را بیاموزد، حتی در محیط هایی که پیچیده، پویا یا دارای موانع غیرقابل پیش بینی هستند. این تکنیک منجر به یافتن مسیرهایی می شود که علاوه بر کوتاهی، از نظر مصرف انرژی یا زمان نیز کارآمدتر باشند.

نویسندگان

شهرام محمدی

۱. مربی هیئت علمی گروه کامپیوتر، دانشکده فنی مهندسی، دانشگاه آزاد اسلامی اصفهان خوراسگان، ایران

رامین دولت شاهی

۲. کارشناس ارشد مهندسی برق قدرت و کارمند دانشگاه ملی مهارت اصفهان، اصفهان، ایران