بررسی سیستم های خلاصه ساز خودکار متون فارسی و ارائه روشی جهت بهبود عملکرد خلاصه سازهای متون فارسی

سال انتشار: 1398
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 1,292

فایل این مقاله در 10 صفحه با فرمت PDF قابل دریافت می باشد

این مقاله در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

CECCONF07_037

تاریخ نمایه سازی: 24 مرداد 1398

چکیده مقاله:

یکی از مهم ترین شاخه های هوش مصنوعی، پردازش زبان های طبیعی می باشد که به بررسی و استخراج مفاهیم زبان انسان می پردازد. پردازش زبان طبیعی دارای شاخه های گوناگونی می باشد که یکی از مهم ترین آنها خلاصه سازی متن است. با پیشرفت چشمگیر اسناد متنی منتشر شده در وب و افزایش بیش از پیش مقالات علمی، استفاده از خلاصه سازی امری لازم و ضروری می باشد. هدف اصلی در تمامی روش های خلاصه سازی،تولید خلاصه ایی از متن اولیه می باشد به گونه ایی که تمامی مفاهیم و نکات اصلی متن اولیه را به همراه داشته باشد. سیستم های تولید خلاصه به دو روش استخراجی و چکیده ایی خلاصه سازی را انجام می دهند.در روش چکیده ایی معمولا ساختار کلی جملات موجود در متن اولیه دچار تغییر می شوند، به عبارتی خلاصه های تولید شده به روش چکیده ایی شبیه به خلاصه های انسانی می باشند، در خلاصه هایی که به این روش تولید می شوند ممکن است جملات متن اصلی عینا مشاهده نشوند و فقط مفهومی از آن ها در متن خلاصه شده گنجانده شود. در مقایسه با این روش خلاصه سازی،روش خلاصه سازی استخراجی وجود دارد که در این روش جملات متن اصلی دچار تغییر نمی شوند، در روش استخراجی جملات بر اساس یک سری ویژگی های مشخص شده وزن دهی شده و جملات با وزن بالاتر برای حضور در متن خلاصه شده انتخاب می شوند. در این مقاله با بررسی روند کلی سیستم های خلاصه ساز و همچنین مروری بر روش های خلاصه سازی پیشین، به معرفی سیستمی جهت انجام خلاصه سازی متون فارسی به روش استخراجی پرداخته خواهد شد.

کلیدواژه ها:

پردازش زبان طبیعی ، خلاصه سازی استخراجی ، خلاصه سازی چکیده ایی

نویسندگان

علیرضا بهرامی

موسسه آموزش عالی آفرینش علم گستر بروجرد

داور گیوکی

دانشگاه ملایر، دانشکده فنی دانشگاه ملایر، گروه مهندسی کامپیوتر، ملایر، ایران

اشکان خطیر

پژوهشگاه علوم و فناوری اطلاعات ایران(ایرانداک)، تهران، ایران