سازماندهی توصیفی اسناد متنی با استفاده از برچسب زنی مبتنی بر خوشه بندی

سال انتشار: 1400
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 282

فایل این مقاله در 10 صفحه با فرمت PDF قابل دریافت می باشد

این مقاله در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

IVCONF04_254

تاریخ نمایه سازی: 25 آبان 1400

چکیده مقاله:

خوشه بندی یکی از محبوب ترین الگوریتم های داده کاوی است و به طور گسترده در زمینه متن مورد مطالعه قرار گرفته است.خوشه بندی وظیفه یافتن گروه هایی از اسناد مشابه در مجموعه ای از اسناد است شباهت با استفاده از یک تابع شباهت محاسبهمی شود خوشه بندی اسناد کاربردهای فراوانی در بسیاری از حوزه های داده کاوی و بازیابی اطلاعات دارد خوشه های اسناد به صورتخودکار از مجموعه اسناد تولید می شوند با آنکه خوشه بندی اسناد، گام مهمی در سازماندهی اسناد متنی است ولی به تنهایی کافینیست چون خوشه های حاصله ملموس نیستند و نیاز است تا با برچسب هایی تفسیر شوند و به این صورت قابل استفاده تر خواهد بود دراین پژوهش روشی برای برچسب زنی اسناد مبتنی بر خوشه بندی به منظور سازماندهی توصیفی اسناد متنی ارایه شد. برای سنجشنتایج حاصله از مقایسه روش پیشنهادی با دو روش دیگر مبتنی بر الگوریتم های EM و DBSCAN استفاده شده است و پنجمجموعه داده از داده های موجود در ODP استفاده شده است نتایج تجربی نشان داد که عملکرد روش پیشنهادی از هر دو روشبطور میانگین بهتر است.

کلیدواژه ها:

نویسندگان

بهناز کریمی یزدی

دانشجوی ارشد مهندسی فناوری اطلاعات، واحد الکترونیکی، دانشگاه آزاد اسلامی، تهران، ایران

سینا دامی

استادیار مهندسی کامپیوتر، واحد تهران غرب، دانشگاه آزاد اسلامی، تهران، ایران