مقایسه یک سیستم پیشنهاد دهنده متنی با سه معیار اندازه گیری شباهت کسینوسی، فاصله اقلیدسی و فاصله منهتن

سال انتشار: 1397
محل انتشار: ششمین کنگره بین المللی توسعه و ترویج علوم و فنون بنیادین در جامعه
کد COI اختصاصی: DPFSTS06_015
زبان مقاله: فارسی
تعداد مشاهده: 1468

دانلود فایل این مقاله

نویسندگان

محمدحسین هاشمی نژاد

دانشکده فنی مهندسی - گروه کامپیوتر- دانشگاه الزهرا (س)، تهران

زهرا مطیعیان نجار

دانشجوی روزانه الزهرا دوره کارشناسی ارشد ، تهران

جلال الدین نصیری

عضو هیات علمی گروه زبانشناسی رایانشی پژوهشگاه علوم و فناوری اطلاعات ایران (ایرانداک)، ایران

چکیده

سیستم های پیشنهاد کننده برای کمک به کاربران در پیدا کردن آیتم ها یا خدمات جدیدی مانند کتاب ، موسیقی، حمل و نقل و یا حتی افراد به کارمی روند و مبتنی بر اطلاعات مربوط به کاربر یا مورد پیشنهاد شده است. همچنین این سیستمها نقش مهمی در تصمیم گیری دارند و به کاربران در به حداکثر رساندن سود یا به حداقل رساندن ریسک کمک می کنند.تعداد مقالات علمی به سرعت در حال رشد هستند. از آنجایی که به طور روز افزون مقالات بیشتری در پایگاه های داده وارد می شوند، دسترسی به مقالات کاملا مرتبط با نیاز جستجوکننده سخت تر از پیش شده و ضروری است تا خواسته کاربر را به دست بیاوریم. دستیابی به مقالات مورد نظر در میان حجم انبوهی از مقالات، موجب اتلاف وقت زیادی از کاربران می شود و در نهایت ممکن است کاربران موفق به دستیابی به مقالات مورد نظرشان نشوند. همچنین گسترش بسیار زیاد مقالات و تنوع موجود نیز موجب بروز مشکل مشابهی شدهاست. از این رو یک پیشنهاد مفید مطابق با معیارهای کاربران، آنها را از سردرگمی و اتلاف وقت بیهوده باز می دارد. به این منظور سیستم پیشنهاد دهنده یا توصیه گر با ارائه پیشنهادات مناسب به کاربران سعی در برطرفکردن این مشکل دارند , در این پژوهش سعی کردیم تا با توجه به دیتاست انتخاب شده که عمومی و دردسترس است، یک سیستم پیشنهاد دهنده مقالات علمی را پیاده سازی و ارزیابی نماییم. برای این کار با توجه به دروس مطرح در هوش مصنوعی مثل پردازش زبان طبیعی، داده کاوی و یادگیری ماشین این سیستم به روش های مختلف پیاده سازی و ارزیابی شد. نتایج نشان داد که محاسبه شباهت زاویه ای یا کوساین و محاسبه شباهت منهتن برای این دیتاست نتایج بهتری را ارائه می دهند. برای ارزیابی سیستم پیشنهادی از دو معیار سود تجمعی تخفیفی و میانگین رتبه متقابل که معیارهایی آماری درسیستم های بازیابی اطلاعات است، استفاده شد. سپس با توجه به تعریف دو معیار پرسیژن و ریکال نیز محاسبه و مقایسه شد.

کلیدواژه ها

شباهت زاویه ای، فاصله اقلیدسی، سیستم پیشنهاد دهنده، متن کاوی، فاصله منهتن

مقالات مرتبط جدید

اطلاعات بیشتر در مورد COI

COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.

کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.