فشرده سازی جمله با ترکیب حافظه ی طولانی کوتاه مدت و ویژگی های گرامری بااستفاده از مکانیزم توجه
- سال انتشار: 1400
- محل انتشار: سومین کنفرانس ملی پژوهش های نوین در مهندسی و علوم کاربردی
- کد COI اختصاصی: NREAS03_209
- زبان مقاله: فارسی
- تعداد مشاهده: 591
نویسندگان
استادیار گروه کامپیوتر مجتمع آموزش عالی زرند زرند کرمان ایران
مربی گروه فنی مهندسی پیام نورتهران ایران
کارشناس ارشد صندوق کارافرینی امید،کرمان ایران
چکیده
با توجه به حجم زیاد اطلاعات متنی موجود بر روی شبکه های کامپیوتری، یکی از راههای پاسخگویی به نیازهای کاربران به صورت سریع و دقیق، استفاده از روشهای فشرده سازی جمله است. هدف از فشرده سازی جمله کاهش طول یک جمله ضمن حفظ معنای اصلی آن بوده و روش عمده ای که برای این کار استفاده می شود، شناسایی و حذف کلمات دارای اهمیت کمتر است. در این مقاله یک روش فشرده سازی جمله با استفاده از ترکیب اطلاعات مربوط به رده ی جزء کلام و بردار کلمات با یک شبکه عصبی مبتنی بر حافظه ی طولانی کوتاه مدت و اعمال ویژگی های گرامری با استفاده از مکانیزم توجه معرفی شده است. نتایج حاصل از ارزیابی نشان میدهند میزان دقت و بازیابی مدل پیشنهادی بر روی مجموعه داده های گوگل نیوز به ترتیب ۰/۸۲۱ و ۰/۸۶۳ و بر روی مجموعه داده های ان بی سی نیوز به ترتیب۰/۳۸۸ و۰/۴۱۸و نرخ فشرده سازی نیز بر روی دو مجموعه داده به ترتیب۰/۳۷۱ و ۳۰۱/۰ بوده است.کلیدواژه ها
فشرده سازی جمله، رده ی جزء کلام، مکانیزم توجه، حافظه ی طولانی کوتاه مدت، ویژگی های گرامریمقالات مرتبط جدید
- آینده نظام آموزشی در عصر هوش مصنوعی
- کاربرد الگوریتمهای فراابتکاری ترکیبی در پیشبینی بار شبکه های هوشمند
- واکاوی ظرفیت سنجی مسئولیت حقوقی هوش مصنوعی در پرتو قوانین داخلی و بین المللی
- Design and Optimization of Catalysts with Multi-Objective Optimization Algorithms Based on Artificial Intelligence
- Enhancing Synchronizability in Identical Chaotic Complex Networks: Application of Genetic Algorithms for Edge Rewiring
اطلاعات بیشتر در مورد COI
COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.
کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.