سازماندهی توصیفی اسناد متنی با استفاده از برچسب زنی مبتنی بر خوشه بندی
- سال انتشار: 1400
- محل انتشار: چهارمین همایش ملی توسعه علوم فناوریهای نوین در مدیریت، حسابداری و کامپیوتر
- کد COI اختصاصی: IVCONF04_254
- زبان مقاله: فارسی
- تعداد مشاهده: 241
نویسندگان
دانشجوی ارشد مهندسی فناوری اطلاعات، واحد الکترونیکی، دانشگاه آزاد اسلامی، تهران، ایران
استادیار مهندسی کامپیوتر، واحد تهران غرب، دانشگاه آزاد اسلامی، تهران، ایران
چکیده
خوشه بندی یکی از محبوب ترین الگوریتم های داده کاوی است و به طور گسترده در زمینه متن مورد مطالعه قرار گرفته است.خوشه بندی وظیفه یافتن گروه هایی از اسناد مشابه در مجموعه ای از اسناد است شباهت با استفاده از یک تابع شباهت محاسبهمی شود خوشه بندی اسناد کاربردهای فراوانی در بسیاری از حوزه های داده کاوی و بازیابی اطلاعات دارد خوشه های اسناد به صورتخودکار از مجموعه اسناد تولید می شوند با آنکه خوشه بندی اسناد، گام مهمی در سازماندهی اسناد متنی است ولی به تنهایی کافینیست چون خوشه های حاصله ملموس نیستند و نیاز است تا با برچسب هایی تفسیر شوند و به این صورت قابل استفاده تر خواهد بود دراین پژوهش روشی برای برچسب زنی اسناد مبتنی بر خوشه بندی به منظور سازماندهی توصیفی اسناد متنی ارایه شد. برای سنجشنتایج حاصله از مقایسه روش پیشنهادی با دو روش دیگر مبتنی بر الگوریتم های EM و DBSCAN استفاده شده است و پنجمجموعه داده از داده های موجود در ODP استفاده شده است نتایج تجربی نشان داد که عملکرد روش پیشنهادی از هر دو روشبطور میانگین بهتر است.کلیدواژه ها
داده کاوی، خوشه بندی، سازماندهی توصیفی اسناد، برچسب زنی اسناد متنیمقالات مرتبط جدید
- پیچیدگی سازمانی به عنوان یک عامل موثر در عملکرد نامطلوب سازمان
- قالب مدون جهت سنجش دفتر مدیریت پروژه
- نقش فعالیت های بازاریابی رسانه اجتماعی بر عملکرد برند با میانجی گری صحه برند، نگرش برند، شهرت برند و آگاهی از برند
- بررسی ارتباط مسئولیت اجتماعی شرکتها با ارزش بازار و ریسک شرکتی در شرکتهای پذیرفته شده در بورس اوراق بهادار تهران
- تاثیر شایسته سالاری در گزینش منابع انسانی بر موفقیت سازمان
اطلاعات بیشتر در مورد COI
COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.
کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.