تشخیص عنوان متون فارسی با استفاده از استخراج ویژگی های معنایی حاصل از خلاصه سازی متون
- سال انتشار: 1395
- محل انتشار: سومین کنگره بین المللی کامپیوتر، برق و مخابرات
- کد COI اختصاصی: ITCC03_231
- زبان مقاله: فارسی
- تعداد مشاهده: 871
نویسندگان
گروه کامپیوتر، واحد خرم آباد، دانشگاه آزاد اسلامی، خرم آباد، ایران
گروه کامپیوتر، دانشگاه علم و صنعت، تهران، ایران
چکیده
با رشد روزافزون اسناد به صورت آنلاین بر روی شبکه جهانی وب، طبقه بندی و پردازش این مقادیر عظیم از داده های به چالشیبزرگ بدل گشته است. وجود اطلاعات نویزی تعبیه شده در این اسناد، بدست آوردن نتایج دقیق را در فرآیند تشخیص عنوان با مشکلمواجه می نماید. برای نشان دادن این مساله، بعضی از مقالات از روشهای انتخاب ویژگی برای افزایش دقت تشخیص عنوان متون استفادهمی نمایند. در این مقاله، ما تاثیر استفاده از فرآیند خلاصه سازی متون را با فرآیند انتخاب ویژگی در افزایش تشخیص عنوان متون فارسینشان می دهیم. در کارمان نشان خواهیم داد که استفاده از سامانه خلاصه ساز ایجاز، اطلاعات نویزی را کاهش و نتایج فرآیند تشخیصعنوان متون فارسی به صورت قابل توجهی افزایش می یابند که خود باعث افزایش کارایی در سیستم تشخیص عنوان می گردد. در واقعاستفاده از خلاصه سازی باعث کاهش حجم متون می گردد.کلیدواژه ها
تشخیص عنوان متون، خلاصه سازی متون، انتخاب ویژگی، طبقه بندی متون، اطلاعات نویزیمقالات مرتبط جدید
اطلاعات بیشتر در مورد COI
COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.
کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.