خلاصه سازی متون فارسی به روش استخراجی با استفاده از گراف

سال انتشار: 1398
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 675

فایل این مقاله در 26 صفحه با فرمت PDF قابل دریافت می باشد

این مقاله در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

ECDS05_158

تاریخ نمایه سازی: 23 شهریور 1398

چکیده مقاله:

امروزه با افزایش حجم اسناد و اطلاعات متنی الکترونیکی امکان مطالعه و نگهداری آن مستلزم زمان و هزینه زیاد است، بنابراین باید بتوان مطالب مهم متون در اختیار مدیران قرار گیرد. روشهای گوناگونی برای خلاصه سازی متن وجود دارد که عموما از دو روش استخراجی و چکیدهای به این منظور استفاده میشود. در این مقاله ضمن برشمردن روشها و مجموعه های داده آماده برای زبان فارسی، به کمک نظریه گراف روشی استخراجی برای خلاصه سازی متون فارسی پیشنهاد شده است. در این روش پس از واکشی متن از مجموعه داده، جملات تفکیک شده و هر جمله به عنوان یک گره از گراف در نظر گرفته میشود. در ادامه ضمن پیش پردازش روی متن، مقدار ویژگی هر یال و گره ها محاسبه شده و بر این اساس گره ها رتبه بندی میشوند. خلاصه متن از بین گره های با امتیاز بالاتر ارائه میشود. در پایان ضمن پیاده سازی روش ارائه شده در زبان جاوا بر اساس معیارهای دقت، صحت و F-Measure روش ارائه شده مورد ارزیابی قرار گرفت که نشان از عملکرد مناسب آن دارد.

کلیدواژه ها:

داده کاوی ، متن کاوی ، خلاصه سازی متون فارسی ، یادگیری ماشین.

نویسندگان

علیرضا صفایی

دانشجوی کارشناسی ارشد- دانشکده فناوری اطلاعات و ارتباطات - دانشگاه جامع امام حسین (ع)- تهران- ایران

محمدعلی جوادزاده

استادیار- دانشکده فناوری اطلاعات و ارتباطات - دانشگاه جامع امام حسین (ع)- تهران- ایران