روشی جدید برای وزن دهی واژه ها در خوشه بندی مستندات

  • سال انتشار: 1393
  • محل انتشار: اولین همایش ملی فناوری و مدیریت دانش با محوریت اقتصاد مقاومتی
  • کد COI اختصاصی: KMTTORBAT01_027
  • زبان مقاله: فارسی
  • تعداد مشاهده: 1076
دانلود فایل این مقاله

نویسندگان

سمیه گراوند

دانشجوی ارشد موسسه آموزش عالی پویش

سیداحسان یثربی نایینی

عضو هیات علمی دانشگاه تربت حیدریه

چکیده

بازیابی اطلاعات فرایند یافتن اطلاعات مربوط به جستجوی کاربر در مجموعه مدارک مورد نظر می باشد .با پیاده سازی الگوریتم های متفاوت استراتژی های مختلفی در بازیابی اطلاعات وجود دارد وجه مشترک استراتژی های بازیابی ، یافتن مدارک مشابه با موضوع جستجوی کاربر است .یکی از الگوریتم های مهمی که در بازیابی اطلاعات ،کاربردبسیار دارد،الگوریتم های فضای برداری است که می کوشد تمام مدارک را در مجموعه وجستجوهای کاربربه صورت بردارها نشان دهد وضریب تشابه میان بردارها ی مدارک و بردار جستجو را جهت بازیابی مدارک مربوط محاسبه می کند.در این مقاله یک روش جدید برای وزن دهی واژه ها ارائه شده که بابررسی روش tf و tf idf و مشکلات آنها وآزمایشاتی که انجام شده روش مناسبی برای وزن دهی واژه ها می باشد.

کلیدواژه ها

وزن دهی ،مدل فضای برداری ،tf ،tfidf

مقالات مرتبط جدید

اطلاعات بیشتر در مورد COI

COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.

کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.