CIVILICA We Respect the Science
(ناشر تخصصی کنفرانسهای کشور / شماره مجوز انتشارات از وزارت فرهنگ و ارشاد اسلامی: ۸۹۷۱)

دسته بندی پرس و جوهای وب با استفاده از بهبودی روی الگوریتم احتمال ملاقات

عنوان مقاله: دسته بندی پرس و جوهای وب با استفاده از بهبودی روی الگوریتم احتمال ملاقات
شناسه ملی مقاله: IPRIA02_028
منتشر شده در دومین کنفرانس بین المللی بازشناسی الگو و تحلیل تصویر در سال 1393
مشخصات نویسندگان مقاله:

هانیه رشید قلم - دانشجوی کارشناسی ارشد، گروه مهندسی کامپیوتر، دانشگاه آزاد اسلامی قزوین
فریبرز محمودی - استادیار، گروه مهندسی کامپیوتر، دانشگاه آزاد اسلامی قزوین

خلاصه مقاله:
در این مقاله روشی بدون ناظر و بدون استفاده از فایل سوابق کاربران، جهت حل مسئله دسته بندی پرس و جو ارائه می گردد. هدف روش پیشنهادی، نگاشت تمامی اجزای مسئله به مفاهیم بابل نت و حل مسئله بر مبنای این مفاهیم است. بدین منظور سه فاز برون از خط، بر خط و دسته بندی در نظر گرفته شده است. فاز برون از خط، فاز نگاشت دسته ها به مفاهیمی در بابل نت است در این فاز با استفاده از یک سیستم رفع ابهام، دسته ها به مفاهیمی در بابل نت نگاشت می شوند. در فاز برخط، بعد ازغنی سازی پرس و جو، پیش پردازشی روی پرس و جوی غنی شده انجام می شود و سپس با استفاده از یک سیستم رفع ابهام، به مفاهیمی در بابل نت نگاشت می شود. در فاز نهایی، با استفاده از بهبودهایی روی الگوریتم احتمال ملاقات ، دسته بندی انجام می شود. جهت ارزیابی از مجموعه آزمون KDD2005 که معتبرترین مجموعه ی موجود می باشد استفاده گردیده است. نتایج حاکی از آن است که روش پیشنهادی نسبت به بهترین روش بدون ناظری که از فایل سوابق کاربران استفاده نمی کند، در میزان امتیاز (F(1 بهبود 2% داشته و نسبت به بهترین روش بدون ناظری که از فایل سوابق کاربران استفاده می کند در میزان امتیاز (F(1؛ 11% کاهش داشته است.

کلمات کلیدی:
احتمال ملاقات، بابل نت، دسته بندی پرس و جو، قدم های تصادفی، یادگیری بدون ناظر

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/373452/