طراحی و پیاده سازی سامانه خلاصه ساز خودکار و معنایی متون فارسی مبتنی بر رویکرد گراف وزن دار
- سال انتشار: 1399
- محل انتشار: ماهنامه پژوهش های معاصر در علوم و تحقیقات، دوره: 2، شماره: 10
- کد COI اختصاصی: JR_JCRSR-2-10_003
- زبان مقاله: فارسی
- تعداد مشاهده: 297
نویسندگان
دانش آموخته کارشناسی ارشد- دانشگاه الزهرا
چکیده
خلاصه سازی متون یکی از روش های استخراج اطلاعات مفید و مهم از حجم عظیم داده های متنی است که در اهدافی چونتحلیل داده های متنی به کار بسته می شود. طی سالیان متمادی، تکنیک های خلاصه سازی متن بسیاری توسعه داده شده اندکه برخی تنها به انتخاب جملات کوتاه و آوردن آنها در خلاصه بسنده کرده و برخی دیگر بدون توجه به همبستگی معناییجملات، آنها را گزینش و در خلاصه می آورند. تحلیل معنایی متون نیازمند روشهای استخراج خلاصه با رویکرد معنایی است.در این پژوهش، سامانه ی خلاصه ساز زبان فارسی با استفاده از توسعه و به کارگیری الگوریتم TextRank گوگل و با بهره-گیری از مدل سازی سند متنی به صورت گرافی که در آن جملات به صورت گره و ارتباط جملات به صورت یال های گراف ومیزان ارتباط معنایی میان جملات به صورت وزن هر یال مدل گردیده، توسعه داده شده است. نتایج پژوهش با بررسی ۱۱۴۶مقاله فارسی خلاصه شده توسط این سامانه، نشان داد که سامانه توسعه داده شده با اختصاص رتبه ی بالاتر به جملات حاملمعنای بیشتر و تهیه خلاصه نهایی از آنها، عملکرد خوبی در استخراج خلاصه معنایی از متون الکترونیکی فارسی دارد.کلیدواژه ها
متن کاوی، خلاصه سازی خودکار، اسناد الکترونیک فارسی، گراف وزن دارمقالات مرتبط جدید
- تحلیل وبهینه سازی هزینه مصرف انرژی ایستگاه پمپاژ آبرسانی با رویکرد هزینه های دوره عمرپمپ
- بررسی تاثیر نانو ذرات ایتریوم اکسید بر امپدانس بتن
- بررسی تطبیقی خلاصه الزامات آیین نامه FDA QSR ۲۱ CFR ۸۲۰ و استاندارد بین المللی ISO ۱۳۴۸۵:۲۰۱۶
- واکاوی تاثیر روش تدریس فعال و اکتشافی و خلاقیت در تدریس درس ریاضی بر روند تحصیل دانش آموزان
- طراحی و پیاده سازی یک سیستم ارزیای سلامت بر پایه اکسیژن خون و دمای بدن
اطلاعات بیشتر در مورد COI
COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.
کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.