شباهت معنایی جملات فارسی با استفاده از تطبیق فضای برداری و یادگیری عمیق
سال انتشار: 1401
نوع سند: مقاله ژورنالی
زبان: فارسی
مشاهده: 370
فایل این مقاله در 15 صفحه با فرمت PDF قابل دریافت می باشد
- صدور گواهی نمایه سازی
- من نویسنده این مقاله هستم
این مقاله در بخشهای موضوعی زیر دسته بندی شده است:
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
JR_PADSA-10-2_005
تاریخ نمایه سازی: 24 بهمن 1401
چکیده مقاله:
امروزه، شناسایی متون مشابه، موضوعی با کاربردهای فراوان می باشد که با توجه به اهمیت آن، توسط پژوهشگران زبان های مختلف مورد تحلیل و بررسی قرار گرفته است. در گذشته اغلب برای درک جملات توسط سامانههای رایانه ای، جملات به صورت مجموعه کلمات مورد بررسی قرار میگرفتند. اما امروزه، با گسترش فناوری و استفاده از شبکههای عصبی عمیق، می توان از خود جملات، مفهوم اصلی را استخراج نمود. بنابراین، رسیدن به مدلی که بتواند جملات را کدگذاری کرده و مفهوم اصلی جمله را با دقت هر چه بیشتر استخراج نماید، یکی از نیازهای ضروری برای این هدف به شمار میرود. این مقاله قصد دارد تا میزان شباهت جملات را از نقطه نظر معنایی به دست آورد که از روش های یادگیری عمیق استفاده می کند. از آنجایی که روش های یادگیری عمیق نیاز به داده آموزشی زیادی دارند، این مقاله از ایده نگاشت بین زبانی بهره می برد. روش پیشنهادی، فضای برداری تعبیه کلمات انگلیسی را به فارسی نگاشت کرده و با کمک مدل آموزش داده شده در زبان انگلیسی، شباهت جملات فارسی به دست می آید. درنهایت، نتایج نهایی با امتیازات انسانی مورد مقایسه قرار گرفته است. نتایج حاصل از روش پیشنهادی، میزان دقت این سامانه پیشنهادی را ۸۹ درصد ارائه می دهد که نسبت به سایر مدلهای یادگیری عمیق برتری دارد.
کلیدواژه ها:
نویسندگان
سعیده سادات سدیدپور
استادیار، دانشگاه صنعتی مالک اشتر، تهران، ایران
مینا حاجی غلامرضا
کارشناسی ارشد، دانشگاه صنعتی مالک اشتر، تهران، ایران
محمدرضا محمدزاده
کارشناسی ارشد، دانشگاه صنعتی مالک اشتر، تهران، ایران
سید محمدرضا محمدی
کارشناسی ارشد، دانشگاه صنعتی مالک اشتر، تهران، ایران
محمدعلی کیوانراد
استادیار، دانشگاه صنعتی مالک اشتر، تهران، ایران
مراجع و منابع این مقاله:
لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :