تقویت معیار شباهت معنایی بین صفحات وب بر اساس درجه معناداری ارتباط کلمات

سال انتشار: 1395
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 767

فایل این مقاله در 7 صفحه با فرمت PDF قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

KBEI03_093

تاریخ نمایه سازی: 11 مرداد 1396

چکیده مقاله:

سنجش تشابه معنایی صفحات وب، از اقدامات مهمی است که کاربردهای قابل ملاحظه ای خصوصا در حوزه ی موتورهای جستجو به منظور استخراج صفحات هم معنا دارد. در این پژوهش، با مطالعه روش های موجود اندازه گیری شباهت بین صفحات بر اساس معیار رخداد کلمات با استفاده از محیط نرمافزار رپیدماینر، جفت کلمات از صفحات استخراج و با استفاده از موتور جستجوی گوگل مورد جستجو قرار گرفت. تعداد صفحات با استفاده از روشهای ضریب همپوشانی، ضریب شباهت کسینوسی، ضریب سیمپسون و ضریب PMI مقایسه گردید. در روش پیشنهادی این پژوهش با تکیه بر روش PMI به تقویت پاسخ نهایی با در نظر گرفتن ارتباط معنایی جفت کلمات اولیه بر اساس درجه شباهت استخراج شده از WordNet و داتره المعارف های تخصصی با اعمال ضرایب پرداخته شد و معیار شباهت نهایی PMIS نامیده شد. نتایج بدست آمده، بیانگر میزان شباهت معنایی بهتر و با معناتر بین صفحات در صورت ارتباط معنایی معنی دار در کلمات رخداده شده میباشند

کلیدواژه ها:

تشابه معنایی صفحات وب ، رخداد کلمات مشابه درصفحات وب ، کلمات مترادف ، معیارهای شباهت صفحات وب

نویسندگان

سامان صلواتی

دانشجوی کارشناسی ارشد مهندسی کامپیوتر، نرمافزارموسسه آموزش عالی دیلمان لاهیجان

فاطمه احمدی آبکناری

استادیار، گروه مهندسی کامپیوتر و فناوری اطلاعات،دانشگاه پیام نور رشت، ایران

راهبه مجتهدی صفاری

مربی، گروه مهندسی کامپیوتر و فناوری اطلاعات، ۳دانشگاه آزاد اسلامی لاهیجان