ارائه یک الگوریتم خوشه بندی تجمعی پایدار جهت بهبود دقت و صحت دسته بندی اسناد متنی
- سال انتشار: 1399
- محل انتشار: کنگره مشترک سیستم های فازی و هوشمند ایران(نوزدهمین کنفرانس سیستم های فازی و هفدهمین کنفرانس سیستم های هوشمند)
- کد COI اختصاصی: ICFUZZYS19_010
- زبان مقاله: فارسی
- تعداد مشاهده: 447
نویسندگان
واحد توسعه تحقیقات بالینی، بیمارستان قائم، دانشگاه علوم پزشکی مشهد، مشهد، ایران
گروه مهندسی کامپیوتر، واحد قوچان، دانشگاه آزاد اسلامی، قوچان، ایران
چکیده
امروزه میزان اطلاعات و مستندات متنی، روز به روز در حال گسترش است. فراهم کردن ابزاری که بتواند به طور موثرو کارا، این اطلاعات گسترده و دانش پنهان درون آن را شناسایی، استخراج و مدیریت کند، امری مهم و ضروری است. یکی از روش های مهم در راستای برآورده کردن این نیاز کاربران، استفاده از تکنیک های متنکاوی همانند روش های دسته بندی خودکار متون است. از جمله مشکلات دسته بندی متون می توان به ابعاد بالای فضای ویژگی، عدم پایداری و کارایی قابل قبول دردسته بندی اشاره نمود. در این مقاله، یک روش سه مرحله ای برای دسته بندی متون پیشنهاد شده است که در آن ابتدا کلمات کلیدی پس از پیش پردازش اسناد ، با استفاده از روش (فراوانی - عکس فراوانی سند) استخراج می شوند. درگام بعدی، جهت حل مشکل بالابودن ابعاد فضای ویژگی، از الگوریتم کاهش ویژگی تحلیل مولفه اصلی (PCA) استفاده می شود ودر گام آخر، اسناد با استفاده از تکنیک خوشه بندی تجمعی و براساس چهارخوشه بند (Fuzzy C-means + PSO ، Complete-linkage ، K-Means و Fuzzy C-means+ WOA) دسته بندی می شوند. نتایج به دست آمده از ارزیابی این سیستم بر روی سه پایگاه داده متنی استاندارد ۲۱۵۷۸-RCV، Reuters و Classic نشان دهنده این است که روش پیشنهادی، از دقت، پایداری و قابلیت اعتماد نسبتا بالایی برخوردار است.کلیدواژه ها
متن کاوی، دسته بندی اسناد، خوشه بندی تجمعی، استخراج کلمات کلیدی، تحلیل مولفه اصلیمقالات مرتبط جدید
- مددکاری اجتماعی کودکان محروم از سرپرستی شایسته
- اثربخشی بازی درمانی مبتنی بر رابطه والد - کودک بر بهبود رابطه مادر - کودک، افزایش هوش هیجانی و کاهش مشکلات رفتاری کودکان پیش دبستانی
- پیش بینی افت تحصیلی بر اساس سبک های فرزندپروری والدین و اختلالهای رفتاری در دانش آموزان مقطع ابتدایی شهر شیراز با نقش واسطه ای تاب اوری تحصیلی
- پیشبینی دلزدگی زناشویی بر اساس سرمایه روان شناختی در دانشجویان متاهل
- طراحی و اعتباریابی بسته آموزش مهارت های یادگیری خودتنظیمی مبتنی بر نظریه پنتریج و تاثیر آن بر اهمالکاری تحصیلی ، خودناتوان سازی تحصیلی و دلزدگی تحصیلی در دانش آموزان پسر متوسطه اول
اطلاعات بیشتر در مورد COI
COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.
کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.