تقویت معیار شباهت معنایی بین صفحات وب بر اساس درجه معناداری ارتباط کلمات
سال انتشار: 1395
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 767
فایل این مقاله در 7 صفحه با فرمت PDF قابل دریافت می باشد
- صدور گواهی نمایه سازی
- من نویسنده این مقاله هستم
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
KBEI03_093
تاریخ نمایه سازی: 11 مرداد 1396
چکیده مقاله:
سنجش تشابه معنایی صفحات وب، از اقدامات مهمی است که کاربردهای قابل ملاحظه ای خصوصا در حوزه ی موتورهای جستجو به منظور استخراج صفحات هم معنا دارد. در این پژوهش، با مطالعه روش های موجود اندازه گیری شباهت بین صفحات بر اساس معیار رخداد کلمات با استفاده از محیط نرمافزار رپیدماینر، جفت کلمات از صفحات استخراج و با استفاده از موتور جستجوی گوگل مورد جستجو قرار گرفت. تعداد صفحات با استفاده از روشهای ضریب همپوشانی، ضریب شباهت کسینوسی، ضریب سیمپسون و ضریب PMI مقایسه گردید. در روش پیشنهادی این پژوهش با تکیه بر روش PMI به تقویت پاسخ نهایی با در نظر گرفتن ارتباط معنایی جفت کلمات اولیه بر اساس درجه شباهت استخراج شده از WordNet و داتره المعارف های تخصصی با اعمال ضرایب پرداخته شد و معیار شباهت نهایی PMIS نامیده شد. نتایج بدست آمده، بیانگر میزان شباهت معنایی بهتر و با معناتر بین صفحات در صورت ارتباط معنایی معنی دار در کلمات رخداده شده میباشند
کلیدواژه ها:
نویسندگان
سامان صلواتی
دانشجوی کارشناسی ارشد مهندسی کامپیوتر، نرمافزارموسسه آموزش عالی دیلمان لاهیجان
فاطمه احمدی آبکناری
استادیار، گروه مهندسی کامپیوتر و فناوری اطلاعات،دانشگاه پیام نور رشت، ایران
راهبه مجتهدی صفاری
مربی، گروه مهندسی کامپیوتر و فناوری اطلاعات، ۳دانشگاه آزاد اسلامی لاهیجان