CIVILICA We Respect the Science
(ناشر تخصصی کنفرانسهای کشور / شماره مجوز انتشارات از وزارت فرهنگ و ارشاد اسلامی: ۸۹۷۱)

خلاصه سازی متون فارسی به روش استخراجی با استفاده از گراف

عنوان مقاله: خلاصه سازی متون فارسی به روش استخراجی با استفاده از گراف
شناسه ملی مقاله: ECDS05_158
منتشر شده در پنجمین همایش ملی علوم و مهندسی دفاعی در سال 1398
مشخصات نویسندگان مقاله:

علیرضا صفایی - دانشجوی کارشناسی ارشد- دانشکده فناوری اطلاعات و ارتباطات - دانشگاه جامع امام حسین (ع)- تهران- ایران
محمدعلی جوادزاده - استادیار- دانشکده فناوری اطلاعات و ارتباطات - دانشگاه جامع امام حسین (ع)- تهران- ایران

خلاصه مقاله:
امروزه با افزایش حجم اسناد و اطلاعات متنی الکترونیکی امکان مطالعه و نگهداری آن مستلزم زمان و هزینه زیاد است، بنابراین باید بتوان مطالب مهم متون در اختیار مدیران قرار گیرد. روشهای گوناگونی برای خلاصه سازی متن وجود دارد که عموما از دو روش استخراجی و چکیدهای به این منظور استفاده میشود. در این مقاله ضمن برشمردن روشها و مجموعه های داده آماده برای زبان فارسی، به کمک نظریه گراف روشی استخراجی برای خلاصه سازی متون فارسی پیشنهاد شده است. در این روش پس از واکشی متن از مجموعه داده، جملات تفکیک شده و هر جمله به عنوان یک گره از گراف در نظر گرفته میشود. در ادامه ضمن پیش پردازش روی متن، مقدار ویژگی هر یال و گره ها محاسبه شده و بر این اساس گره ها رتبه بندی میشوند. خلاصه متن از بین گره های با امتیاز بالاتر ارائه میشود. در پایان ضمن پیاده سازی روش ارائه شده در زبان جاوا بر اساس معیارهای دقت، صحت و F-Measure روش ارائه شده مورد ارزیابی قرار گرفت که نشان از عملکرد مناسب آن دارد.

کلمات کلیدی:
داده کاوی، متن کاوی، خلاصه سازی متون فارسی، یادگیری ماشین.

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/920762/