ارائه یک سیستم طبقه بندی اتوماتیک سند بر اساس ترکیب KMeans-PSO و طبقه بندی (ACM )

  • سال انتشار: 1398
  • محل انتشار: سومین کنفرانس ملی کامپیوتر، فناوری اطلاعات و کاربردهای هوش مصنوعی
  • کد COI اختصاصی: CEITCONF03_028
  • زبان مقاله: فارسی
  • تعداد مشاهده: 481
دانلود فایل این مقاله

نویسندگان

سیده راضیه محمودی نژاددزفولی

کارشناسی ارشد هوش مصنوعی و رباتیکزدانشگاه آزاد اسلامی واحد دزفول،

سیدعطاالدین محمودی نژاددزفولی

دکتری رباتیک پزشکی دانشگاه علوم پزشکی تهران

یونس کیانی علی آبادی

دکتری هوش مصنوعی و رباتیکزدانشگاه آزاد اسلامی واحد تهران مرکز

چکیده

استفاده از وب، ایجاد اطلاعات دیجیتال را به شیوه ای سریع و در حوزه های مختلف افزایش داده است. طبقه بندی متن به طور گسترده ای برای فیلتر کردن ایمیل ها، طبقه بندی صفحات وب و سازماندهی نتایج بازیابی شده توسط مرورگرهای وب مورد استفاده قرار گرفته است. در این مقاله، مسئله طبقه بندی اتوماتیک متون علمی، به عنوان یک مشکل بهینه سازی مطرح شده است تا بتوان گروه ها را از یک مجموعه داده به دست آورد. استفاده از الگوریتم های بهینهسازی برای حل مشکلات طبقه بندی یک رویکرد رایج است. با این حال، روشهایی وجود دارد که در آنها مشکلات طبقه بندی حل میشوند و ویژگیهای داده برای طبقه بندی از نوع متن هستند. به این ترتیب، پیشنهاد شده است که از روش طبقه بندی ماشین تکسونومی (ACM (برای به دست آوردن شباهت بین اسناد استفاده کرد با این فرض که هر سند شامل مجموعه ای از کلمات کلیدی است. در این روش از خوشه بندی kmeans به منظور خوشه بندی و با ترکیب با PSO به منظور رفع نواقص Kmeans استفاده شده است. نتایج بدست آمده نشان میدهد که پیشنهاد یک الگوریتم KMeans-PSO مبتنی بر دانش و استفاده از طبقه بندی اتوماتیک ACM یک رویکرد قابل قبول برای حل مشکل طبقه بندی است.

کلیدواژه ها

الگوریتم های طبقه بندی، الگوریتم ازدحام ذرات، طبقه بندی ACM ،الگوریتم Kmeans ،بهینه سازی

مقالات مرتبط جدید

اطلاعات بیشتر در مورد COI

COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.

کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.