بیهنه سازی صفحات منتج از موتورهای جستجو با استفاده از نظریه گراف والگوریتم های فراابتکاری

سال انتشار: 1397
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 228

فایل این مقاله در 12 صفحه با فرمت PDF قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

KAUCEE02_163

تاریخ نمایه سازی: 18 اردیبهشت 1400

چکیده مقاله:

با توجه به رشد روزافزون اطلاعات در دنیای وب، نیاز به یافتن سریع و مناسب اطلاعـات مـورد نیـاز بـه مساله ای چالش برانگیز تبدیل شده است. برای حل این مشکل ابزارهایی به نام موتورهای جستجو تهیـه شده اند. اما موتورهای جستجو صفحات حاوی اطلاعات را به صورت تک تک مورد بررسی قرار میدهند، در صورتی که صفحات موجود در وب صفحاتی مجزا نیستند بلکه با ارتباط بین یکدیگر یک گراف عظـیم را تشکیل می دهند. بنابراین می توان به جای مجزا در نظر گرفتن ایـن صـفحات، آنهـا را بـه صـورت بـه هم پیوسته و در قالب گراف هایی بررسی و مقایسه کنیم. دراین تحقیق سعی شده است با ارائه یک روش سیستماتیک، یک زیرگراف متصل از یک گراف بزرگ که مجموعه ای به همپیوسته از صـفحات اسـت بـه نحوی انتخاب شود که شامل باارزشترین صفحات از لحاظ مشابهت با کلمات مورد جستجوی کاربر باشد. برای این کار از روش tf-idf برای تعیین ارزش صفحات استفاده شده است. در این تحقیق روشـی بـرای وزن دهی به یال های گراف پیشنهاد شده است که در نهایت با یافتن گره هایی با کوتاه ترین فاصله با گـره ریشه به مجموعه ای از گره های با ارزش میرسیم که توسط گره هایی با ارزش کمتر به یکـدیگر متصـل شده اند. روش پیشنهادی در این تحقیق موفق به یافتن زیرگرافهایی شامل بـاارزش تـرین صـفحات در مدت زمانی قابل قبول شده است که در مقایسه با برخی روشهای پیشین از سرعت بیشـتر و پیچیـدگی کمتری برخوردار است.

نویسندگان

مهدی باباگلی موزیرجی

کارشناسی ارشد دانشگاه صنعتی ارومیه