خلاصه سازی تک جمله ای متون فارسی

  • سال انتشار: 1392
  • محل انتشار: همایش منطقه ای برق و کامپیوتر
  • کد COI اختصاصی: MARAGHEH01_040
  • زبان مقاله: فارسی
  • تعداد مشاهده: 5575
دانلود فایل این مقاله

نویسندگان

فرشته خوشنام

گروه کامپیوتر، دانشگاه آزاد اسلامی واحد زنجان، زنجان، ایران

چکیده

امروزه استفاده از روش های خلاصه سازی خودکار متن، در راستای جستجوی اطلاعات مورد نظر در وب، ضروری به نظر می رسد. در راستای تصمیم گیری در مورد مطالعه کامل اسناد، می توان با خلاصه سازی آنها، با سرعت بیشتری به مهم ترین اطلاعات مطروحه در اسناد دست یافت. اما این امر حتی در صورت مطالعه خلاصه اسناد نیازمند زمان قابل توجهی است. با این وجود تولید خلاصه تک جمله ای از اسناد که بیانگر ایده اصلی موجود در سند باشد، می تواند مفهوم خلاصه سازی متن را به غایت دربر داشته، سرعت دست یابی به مهم ترین مفاهیم مطروحه در متن و تصمیم به مطالعه کامل آن ها را بهبود بخشد. روش های تولید خلاصه خود کار به دو دسته استخراجی و چکیده ای تقسیم می شوند. در روش های استخراجی خلاصه شامل بخش هایی از متن منبع است، در حالیکه در روش های چکیده ای، خلاصه پس از درک مهم ترین مفاهیم موجود در متن منبع، با عبارت های جدیدی بازگو می شود. در این مقاله در راستای تولید خلاصه تک جمله ای ، پس از شناسایی مهم ترین مفاهیم مطرح شده در اسناد، با استفاده از روش های آماری و مجموعه ای از ویژگی های مبتنی بر متن، به کمک روش های استخراجی به تولید خلاصه تک جمله ای از سند ورودی پرداخته شده است. نتایج حاصل، نشان دهنده حضور میزان مناسبی از اطلاعات متن در خلاصه تک جمله ای تولید شده می باشد.

کلیدواژه ها

خلاصه سازی خودکار متن، خلاصه سازی استخراجی ، خلاصه تکه جمله ای

مقالات مرتبط جدید

اطلاعات بیشتر در مورد COI

COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.

کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.