سازماندهی توصیفی اسناد متنی با استفاده از برچسب زنی مبتنی بر خوشه بندی

  • سال انتشار: 1400
  • محل انتشار: چهارمین همایش ملی توسعه علوم فناوریهای نوین در مدیریت، حسابداری و کامپیوتر
  • کد COI اختصاصی: IVCONF04_254
  • زبان مقاله: فارسی
  • تعداد مشاهده: 241
دانلود فایل این مقاله

نویسندگان

بهناز کریمی یزدی

دانشجوی ارشد مهندسی فناوری اطلاعات، واحد الکترونیکی، دانشگاه آزاد اسلامی، تهران، ایران

سینا دامی

استادیار مهندسی کامپیوتر، واحد تهران غرب، دانشگاه آزاد اسلامی، تهران، ایران

چکیده

خوشه بندی یکی از محبوب ترین الگوریتم های داده کاوی است و به طور گسترده در زمینه متن مورد مطالعه قرار گرفته است.خوشه بندی وظیفه یافتن گروه هایی از اسناد مشابه در مجموعه ای از اسناد است شباهت با استفاده از یک تابع شباهت محاسبهمی شود خوشه بندی اسناد کاربردهای فراوانی در بسیاری از حوزه های داده کاوی و بازیابی اطلاعات دارد خوشه های اسناد به صورتخودکار از مجموعه اسناد تولید می شوند با آنکه خوشه بندی اسناد، گام مهمی در سازماندهی اسناد متنی است ولی به تنهایی کافینیست چون خوشه های حاصله ملموس نیستند و نیاز است تا با برچسب هایی تفسیر شوند و به این صورت قابل استفاده تر خواهد بود دراین پژوهش روشی برای برچسب زنی اسناد مبتنی بر خوشه بندی به منظور سازماندهی توصیفی اسناد متنی ارایه شد. برای سنجشنتایج حاصله از مقایسه روش پیشنهادی با دو روش دیگر مبتنی بر الگوریتم های EM و DBSCAN استفاده شده است و پنجمجموعه داده از داده های موجود در ODP استفاده شده است نتایج تجربی نشان داد که عملکرد روش پیشنهادی از هر دو روشبطور میانگین بهتر است.

کلیدواژه ها

داده کاوی، خوشه بندی، سازماندهی توصیفی اسناد، برچسب زنی اسناد متنی

مقالات مرتبط جدید

اطلاعات بیشتر در مورد COI

COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.

کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.