انتخاب عنوان برای متون فارسی با استفاده از پردازش زبان طبیعی

سال انتشار: 1399
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 592

فایل این مقاله در 23 صفحه با فرمت PDF قابل دریافت می باشد

این مقاله در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

CARSE05_217

تاریخ نمایه سازی: 17 آذر 1399

چکیده مقاله:

در این جادو روش جدید به منظور تعیین خودکار عنوان برای متون زبان فارسی ارائه شده است. در روش اول، ابتدا الگوهای رایج برای عناوین در متون فارسی با استفاده از یک پایگاه داده جمع آوری شده و سپس عناوین براساس موضوع متن دسته بندی می شوند. به منظور تعیین عنوان برای متون جدید، در این روش الگوهای پایگاه داده در متن ورودی جستجو می شود. سپس هر عبارت بصورت یک عنوان احتمالی درنظر گرفته می شود و با استفاده از یک معیار امتیازبندی بهترین عنوان انتخاب می شود. در روش دوم نیز تمامی عبارات اسمی با طول بیشتر از چهار کلمه از متن استخراج شده و به صورت عناوین احتمالی درنظر گرفته می شوند. در هر دو روش از یک معیار امتیاز بندی مبتنی برای تعیین میزان مناسب بودن عناوین برای متن استفاده شده است. این معیار، از دو روش TF-IDF و امتیازدهی براساس موقعیت استفاده می کند. نتایج پیاده سازی نشان می دهد که روش های پیشنهاد شده می توانند عناوین مناسبی را برای متون زبان فارسی تولید کنند .

کلیدواژه ها:

نویسندگان

کژال سبززاده

فارغ التحصیلی کارشناسی ارشد دانشگاه علوم و تحقیقات واحد ایلام،مهندسی کامپیوتر

طیبه سلیمانیان

فارغ التحصیل موسسه آموزش عالی باختر،مهندسی کامپیوتر