ارائه یک سیستم خلاصه ساز کاربردی بر مبنای الگوریتم رتبه صفحه و الگوریتم های فراابتکاری برای زبان فارسی
محل انتشار: فصلنامه پژوهش در علوم رایانه، دوره: 7، شماره: 28
سال انتشار: 1401
نوع سند: مقاله ژورنالی
زبان: فارسی
مشاهده: 195
فایل این مقاله در 15 صفحه با فرمت PDF قابل دریافت می باشد
- صدور گواهی نمایه سازی
- من نویسنده این مقاله هستم
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
JR_RCSJ-7-28_003
تاریخ نمایه سازی: 3 شهریور 1403
چکیده مقاله:
خلاصه سازی خودکار متن، یک پژوهش ضروری در پردازش زبان طبیعی است که تلاش می کند اسناد متنی را خلاصه کند تا کاربران بتوانند به سرعت به اطلاعات مفید دسترسی پیدا کنند. با وجود اینکه در زبان فارسی تلاش هایی برای ایجاد خلاصه سازی متون صورت گرفته است، اغلب موارد این پژوهش ها به فرم نظریه ارائه شده است. در این پژوهش سعی میشود یک سیستم بر اساس رتبه متن و گراف تحلیلگر نحوی جملات عمل کند و سپس نتایج برای پردازش به الگوریتم معروف رتبه صفحه هدایت شود که جملات با بالاترین رتبه گراف را استخراج کند. سپس به همین روش، کلمات استخراج میشود و نهایتا با استفاده از الگوریتم های فرااکتشافی، برخی از جملات دارای کلمات کلیدی به متن استخراج شده افزوده میشوند. لازم به ذکر است اگر چه الگوریتم پیشنهادی، از تحلیل صرف و نحوی برای شباهت بین جملات استفاده میکند، با این حال این کار در زبان فارسی میتواند توسط الگوریتم های مختلفی صورت پذیرد. با توجه به اینکه تا کنون سیستم مذکور پیشنهاد نشده است و همچنین در خصوص مقایسه تحلیل نحوی جملات در زبان فارسی نیز تحقیق جامعی انجام نگرفته است، این موضوعات جدید محسوب میشود. نتایج برنامه نه تنها به با جامعه آماری وسیع تری نسبت به موارد مشابه مقایسه گردیده است بلکه از نظر متون تخصصی و استفاده از سخت افزار معمول هم مورد توجه قرار گرفته است و در همه حالات توانسته نتایج عملی قابل قبولی را کسب نماید.
کلیدواژه ها:
نویسندگان
احسان باقری
کارشناسی ارشد، مدیریت فناوری اطلاعات موسسه غیرانتفاعی نورطوبی.
مهدی حسنی نسب
دکترا، دانشکده علوم و فناوری های نوین، دانشگاه تهران، تهران، ایران.
ایوب محمدیان
استادیار، سرپرست مرکز نوآوری کسب و کار دانشکده مدیریت معاونت آموزشی دانشکده مدیریت