خوشه بندی اسناد ایکس ام ال با رویکردی مبتنی بر سطح و هستی شناسی کلمات درشبکه های معنایی
سال انتشار: 1393
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 729
فایل این مقاله در 7 صفحه با فرمت PDF قابل دریافت می باشد
- صدور گواهی نمایه سازی
- من نویسنده این مقاله هستم
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
IPRIA02_040
تاریخ نمایه سازی: 28 شهریور 1394
چکیده مقاله:
منابع متنی موجود در وب که دارای ساختار مبتنی بر ایکس ام ال می باشند به سرعت در حال افزایش هستند و یکی از روش هایمتداول برای سازماندهی آنها استفاده از شیوه های خوشه بندی می باشد. ارزیابی شباهت به عنوان یک مسئاله مهم در خوشه بندی مطرح استو الگوریتم های زیادی در این زمینه بر اساس ساختار و محتوا ارائه شدهاند. در خوشه بندی با چالش هایی مانند ابعاد بالا و دقت مواجه هستیم،در ارزیابی شباهت محتوا انتخاب کلمات کلیدی می تواند در رفع این چالش ها بسیار موثر باشد و استفاده از اطلاعات معنایی میتواند منجر بهانتخاب مناسب این کلمات شود، که این اطلاعات به صورت مجموعه های هستی شناسی مانند وردنت موجود می باشند. از این رو در این مقالهتمرکز بر استفاده از شبکه های معنایی به منظور کاهش ابعاد و افزایش دقت بوده و رویکرد پیشنهادی با تعیین سطوح کلمات در شبکه معنایی ومفاهیم نظریه اطلاعات و تشکیل زنجیره های معنایی کلمات و انتخاب کلمات کلیدی مناسب ارائه می شود، نتایج به دست آمده در مقایسه باکارهای گذشته نشان دهنده افزایش میانگین دقت و شاخص خوشه بندی به میزان 0.28 و 0.24 می باشد.
کلیدواژه ها:
نویسندگان
سارا اسدی حقی
دانشجوی کارشناسی ارشد، گروه مهندسی کامپیوتر، دانشگاه آزاد اسلامی واحد قزوین، قزوین، ایران
فریبرز محمودی
استادیار، گروه مهندسی کامپیوتر، دانشگاه آزاد اسلامی واحد قزوین، قزوین، ایران
مراجع و منابع این مقاله:
لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :