خوشه بندی توزیع شده فازی متون مبتنی بر آنتولوژی

سال انتشار: 1393
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 349

فایل این مقاله در 11 صفحه با فرمت PDF قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

SASTECH09_041

تاریخ نمایه سازی: 11 اردیبهشت 1398

چکیده مقاله:

سراسر وب از انواع تعداد زیادی اسناد متنی تشکیل یافته است قالب عمومی نگهداری داده ها در بانک های اطلاعاتی بصورت متن است. خوشه بندی اسناد تکنولوژی قدرتمندی است که به طور گسترده میتواند در ساماندهی داده ها در هسته های کوچکتر مدیریت پذیر استفاده گردد. برای حل مساله روشهای متعدد پیشنهادی از مشکلات متعددی چون ابعاد بالا، مترادف بودن، ابهام فقدان محتوای توصیفی رنج میبرند. با استفاده از یک دانش پس زمینه مانند شبکه معنایی کلمات فارسی(فارس نت) میتواند استاندارد الگوریتمهای خوشه بندی را افزایش داد. در این مقاله تلفیقی از فارس نت الگوریتم خوشه بندی کلمات تکرار شونده با نام PFMDC ارایه گردیده که به صورت رویکردی فازی موازی پیاده سازی شده است. نتایج بدست آمده نشان میدهد که این رویکرد بهبود قابل توجهی در کیفیت خوشه بندی متون بهبود حدود پنجاه درصدی در زمان اجرا داشته است.

کلیدواژه ها:

خوشه بندی فازی متون ، خوشه بندی کلمات تکرار شونده ، فارس نت ، آنتولوژی

نویسندگان

سیدمحمدجعفر راشدی

دانشجوی کارشناسی ارشد نرم افزار، دانشگاه آزاد اسلامی واحد علوم و تحقیقات قزوین

حسن رشیدی

هیات علمی گروه رایانه دانشگاه علامه طباطبایی

امید سجودی

مدیر گروه مهندسی نرم افزار دانشگاه آزاد اسلامی واحد علوم و تحقیقات قزوین