استخراج عبارتهای ترکیبی و بکارگیری آن دردسته بندی خودکار متون فارسی

  • سال انتشار: 1391
  • محل انتشار: دومین همایش کامپیوتر، برق و فناوری اطلاعات
  • کد COI اختصاصی: CCIEEE02_065
  • زبان مقاله: فارسی
  • تعداد مشاهده: 1751
دانلود فایل این مقاله

نویسندگان

محمدحسین بیات

دانشگاه آزاد اسلامی واحد تفرش

سیدمحمد حسینی خوزانی

محبوبه گاپله

چکیده

هرچه حجم داده ها بیشتر و روابط میان آنها پیچیده تر باشد دسترسی به اطلاعات نهفته درمیان داده ها مشکلتر می شود ونقش روشهای کشف و تحلیل داده ها از اسناد مختلف روشنتر می شود یکی از این روشها راهکاربسیارموثراستخراج کلمات کلیدی است دراین مقاله راه کاری جدید ارایه شده است که هدف آن استخراج کلمات کلیدی بادرنظر گرفتن کلمات ترکیبی کلیدی به منظور طبقه بندی کارامد آنها باشد براساس بررسی های انجام گرفته برروی چندین سندفارسی و مقایسه نتایج بدست آمده با روش دیگر این روش می تواند دسته بندی دقیقتر ی را که بیانگر مضمون اصلی متن باشد انجام دهد.

کلیدواژه ها

اسناد فارسی - طبقه بندی - عبارت ترکیبی - کلمات کلیدی

مقالات مرتبط جدید

اطلاعات بیشتر در مورد COI

COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.

کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.