ارائه روش ترکیبی به منظور افزایش دقت در خوشه بندی داده های دیجیتال کتابخانه ای و اسنادی با استفاده از الگوریتم های فراابتکاری

سال انتشار: 1400
محل انتشار: پنجمین کنفرانس بین المللی مطالعات جهانی در علوم تکنولوژی و مهندسی
کد COI اختصاصی: ENGTCONF05_076
زبان مقاله: فارسی
تعداد مشاهده: 373

نویسندگان

کارشناس منابع دیجیتال سازمان اسناد و کتابخانه ملی منطقه غرب کشور – همدان

چکیده

امروزه با بکارگیری ابزارها و سیستم های کامپیوتری نوین، تولید و جمع آوری داده ها به سرعت رو به افزایش است. بنابراین باتوجه به گسترش روز افزون اطلاعاتی که بشر با آنها سر و کار دارد، بهره گیری از روش هایی همچون داده کاوی برای استخراجدانش و اطلاعات نهفته در داده ها، امری غیرقابل اجتناب است. رشد انفجاری داده ها، نیاز به تکنیک ها و ابزارهایی دارد کهبتوانند داده های ذخیره شده را پردازش کرده و اطلاعات حاصل از این پردازش را در اختیار کاربران قرار دهند ،در بسیاری ازکاربردها، بدلیل حجم بسیار بالای داده ها نیازمند استفاده از روش های خاص و سریع تر به منظور کشف الگوهای معنادار در داده هاهستیم،به عبارت دیگر از آنجا که داده هایی که باید مورد پردازش قرار گیرند، همواره بصوت پویا در حال تغییر و تحول هستند،استفاده از روشهای جدید داده کاوی که بتوانند داده ها را خوشه بندی کرده و خوشه های مناسب را استخراج نماید، احساسمیشود.به خصوص در زمینه منابع دیجیتال و اطلاعات داده های کتابخانه ای و اسنادی که روز به روز به تعداد آنها افزوده میگردد ، بنابراین از میان روش های خوشه بندی داده ها ی دیجیتال روش kmeans روشی انحصاری و مسطح می باشد که بهشدت به انتخاب تصادفی خوشه های اولیه وابستگی دارد و روالی مشخص برای محاسبه اولیه مراکز خوشه ها ندارد لذا برای رفعاین مشکل با بررسی چگالی نقاط، مکان سرخوشه ها و تعداد خوشه ها به صورت دقیق تر به دست می آید و در این پایان نامهسعی گردیده که با اعمال ترکیب الگوریتم رقابت استعماری و جهش قورباغه که در متن مقاله به تفضیل توضیح داده شدهاست این مشکل روش kmeans بهبود داده شده و خوشه بندی به صورت دقیق تر انجام می پذیرد .لذا با ترکیب الگوریتم هاینام برده شده روشی نوین برای خوشه بندی داده های حجیم ارائه دادیم که خوشه هایی با کیفیت بهتر را ایجاد نماییم .

کلیدواژه ها

داده کاوی ، منابع دیجیتال ، خوشه بندی ، الگوریتم جهش قورباغه ، الگوریتم رقابت استعماری

مقالات مرتبط جدید

اطلاعات بیشتر در مورد COI

COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.

کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.