شناسایی اخبار بهروز سیاسی با وزن دهیTFIDFبهبودیافته نسبت به زمان

  • سال انتشار: 1393
  • محل انتشار: اولین همایش ملی مهندسی برق و کامپیوتر در شمال کشور
  • کد COI اختصاصی: NCECN01_178
  • زبان مقاله: فارسی
  • تعداد مشاهده: 876
دانلود فایل این مقاله

نویسندگان

مرضیه سپهر

دانشجوی کارشناسی ارشد مهندسی کامپیوتر، دانشگاه صنعتی مالک اشتر ،تهران

مرتضی براری

استادیار مجتمع فناوری اطلاعات و ارتباطات، دانشگاه صنعتی مالک اشتر ،تهران

سمیه کافی

دانشجوی دکتری مهندسی کامپیوتر، دانشگاه صنعتی مالک اشتر ،تهران

چکیده

در اخبار و اطلاعاتی که مدام به روز می شوند، روزانه کلماتی به هر حوزه ی خبری اضافه و یا کم می شود. از این رو، تاریخ انتشار خبر تاثیر زیادی بر کلمات استفاده شده در متن آن دارد. در اغلب روشهای دسته بندی متن اعم از با ناظر و بی ناظر، از کلمات به عنوان بردار ویژگی استفاده می شود. در این روش ها برای وزن دهی به این کلمات اغلب از روش TFIDF استفاده می شود. به طور پیش فرض در روش کلاسیک TFIDF، زمان انتشار متن آموزشی در نظر گرفته نشده است. روش پیشنهادی این مقاله با در نظر گرفتن زمان انتشار متن آموزشی موجب بهبود شناسایی اخبار به روز سیاسی نسبت به روش TFIDF کلاسیک شده است.

کلیدواژه ها

TFIDF، وزن دهی به کلمات، وزن دهی متناسب با زمان، دسته بندی متن، شناسایی اخبار سیاسی

مقالات مرتبط جدید

اطلاعات بیشتر در مورد COI

COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.

کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.