ارائه یک رویکرد ترکیبی جدید برای یافتن بردارهای پایه معنادار جهت بازنمایی صریح بردارهای کلمه
سال انتشار: 1401
نوع سند: مقاله ژورنالی
زبان: فارسی
مشاهده: 141
فایل این مقاله در 18 صفحه با فرمت PDF قابل دریافت می باشد
- صدور گواهی نمایه سازی
- من نویسنده این مقاله هستم
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
JR_JSCIT-11-1_001
تاریخ نمایه سازی: 25 مهر 1403
چکیده مقاله:
هدف اصلی این پژوهش بازنمایی صریح بردارهای معنایی کلمه با ابعاد کم است. برای تولید بردارهای معنایی کلمه صریح، بایستی مسئلهی یافتن تعداد محدودی بردار پایه معنادار بهگونهای حل شود که با کاهش ابعاد بردارهای کلمه افت دقت زیادی ایجاد نشود. ما در این پژوهش یک رویکرد ترکیبی برای یافتن بردارهای پایه معنادار ارائه میکنیم. در ابتدا، N بردار پایه را با روشهای پیشنهادی ۱-معیار نسبت شباهت کلمه به تکرار کلمه، ۲-انتخاب ویژگی مبتنی بر مقایسه ماتریسهای فاصله، ۳-وزندهی دودویی مبتنی بر الگوریتم BPSO بدست میآوریم. سپس، برای بهره گیری از خبرگی روش های ۱و ۲ به میزان یکسان، نیمی از بردارهای پایه بدست آمده با روش معیار نسبت شباهت کلمه به تکرار کلمه را با نیمی از بردارهای پایه انتخاب شده با روش انتخاب ویژگی، ترکیب کرده و بردارهای پایه ترکیبی اول را بدست میآوریم. در مرحله بعدی، کلمات بافتار مشترک دارای وزن "۱" بدست آمده با استفاده از روش BPSO را به بردارهای پایه ترکیبی اول حاصل از روشهای نسبت شباهت کلمه به تکرار کلمه و روش انتخاب ویژگی میافزاییم. بنابراین، بردارهای پایه ترکیبی دوم بدست می آیند که معنادار هستند و هر بردار پایه معادل یک کلمه بافتار آگاهیبخش است. لذا بردارهای کلمه صریح تولید شده با استفاده از بردارهای پایه معنادار، تفسیرپذیر هستند. ما رویکرد پیشنهادی را با استفاده از پیکره UkWaC آموزش داده و بر روی وظیفه شباهت کلمه مورد ارزیابی قرار میدهیم. هر دو بردارهای پایه ترکیبی اول و دوم سبب بهبود دقت می گردند. این افزایش دقت در بردارهای پایه ترکیبی اول بیشتر است. نتایج حاصل از ارزیابی بردارهای کلمه صریح بدست آمده با بردارهای پایه اول نشان میدهد که با وجود کاهش ابعاد بردارهای کلمه از ۵۰۰۰ به ۱۵۱۱، ضریب همبستگی اسپیرمن بر روی مجموعههای آزمون MEN، RG-۶۵ و SimLex-۹۹۹ به ترتیب به میزان ۲.۴۷%، ۷.۳۹% و ۰.۵۲% افزایش می یابد.
کلیدواژه ها:
نویسندگان
Atefe Pakzad
دانشکده مهندسی کامپیوتر، دانشگاه علم و صنعت ایران-تهران
ئخ Analoui
دانشیار، دانشکده مهندسی کامپیوتر، دانشگاه علم و صنعت ایران ، تهران، ایران
مراجع و منابع این مقاله:
لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :