طراحی و پیاده سازی سامانه خلاصه ساز خودکار و معنایی متون فارسی مبتنی بر رویکرد گراف وزن دار

سال انتشار: 1399
نوع سند: مقاله ژورنالی
زبان: فارسی
مشاهده: 294

فایل این مقاله در 13 صفحه با فرمت PDF قابل دریافت می باشد

این مقاله در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

JR_JCRSR-2-10_003

تاریخ نمایه سازی: 25 تیر 1400

چکیده مقاله:

خلاصه سازی متون یکی از روش های استخراج اطلاعات مفید و مهم از حجم عظیم داده های متنی است که در اهدافی چونتحلیل داده های متنی به کار بسته می شود. طی سالیان متمادی، تکنیک های خلاصه سازی متن بسیاری توسعه داده شده اندکه برخی تنها به انتخاب جملات کوتاه و آوردن آنها در خلاصه بسنده کرده و برخی دیگر بدون توجه به همبستگی معناییجملات، آنها را گزینش و در خلاصه می آورند. تحلیل معنایی متون نیازمند روشهای استخراج خلاصه با رویکرد معنایی است.در این پژوهش، سامانه ی خلاصه ساز زبان فارسی با استفاده از توسعه و به کارگیری الگوریتم TextRank گوگل و با بهره-گیری از مدل سازی سند متنی به صورت گرافی که در آن جملات به صورت گره و ارتباط جملات به صورت یال های گراف ومیزان ارتباط معنایی میان جملات به صورت وزن هر یال مدل گردیده، توسعه داده شده است. نتایج پژوهش با بررسی ۱۱۴۶مقاله فارسی خلاصه شده توسط این سامانه، نشان داد که سامانه توسعه داده شده با اختصاص رتبه ی بالاتر به جملات حاملمعنای بیشتر و تهیه خلاصه نهایی از آنها، عملکرد خوبی در استخراج خلاصه معنایی از متون الکترونیکی فارسی دارد.

نویسندگان

سحر اسماعیلی شایان

دانش آموخته کارشناسی ارشد- دانشگاه الزهرا