استفاده از پردازش زبان طبیعی برای انتخاب عنوان فارسی

سال انتشار: 1399
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 543

فایل این مقاله در 28 صفحه با فرمت PDF قابل دریافت می باشد

این مقاله در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

CARSE05_230

تاریخ نمایه سازی: 17 آذر 1399

چکیده مقاله:

در این مقاله دو روش جدید به منظور تعیین خودکار عنوان برای متون زبان فارسی ارائه شده است. در روش اول، ابتدا الگوهای رایج برای عناوین در متون فارسی با استفاده از یک پایگاه داده جمع آوری شده و سپس عناوین براساس موضوع متن دسته بندی می شوند. به منظور تعیین عنوان برای متون جدید، در این روش الگوهای پایگاه داده در متن ورودی جستجو می شود. سپس هر عبارت بصورت یک عنوان احتمالی درنظر گرفته می شود و با استفاده از یک معیار امتیازبندی بهترین عنوان انتخاب می شود. در روش دوم نیز تمامی عبارات اسمی با طول بیشتر از چهار کلمه از متن استخراج شده و به صورت عناوین احتمالی درنظر گرفته می شوند. در هر دو روش از یک معیار امتیاز بندی مبتنی برای تعیین میزان مناسب بودن عناوین برای متن استفاده شده است. این معیار، از دو روش TF-IDF و امتیازدهی براساس موقعیت استفاده می کند . نتایج پیاده سازی نشان میدهد که روش های پیشنهاد شده می توانند عناوین مناسبی را برای متون زبان فارسی تولید کنند.

کلیدواژه ها:

پردازش زبان طبیعی ، پردازش متن ، استخراج عنوان از متن ، عبارت اسمی

نویسندگان

زهرا فرید

فارغ التحصیل دانشگاه آزاد اسلامی واحد ایلام

سپیده احمدی

فارغ التحصیل دانشگاه آزاد اسلامی واحد ایلام

پریا هاشمی

فارغ التحصیل دانشگاه پیام نور تهران شمال