روش های ساخت مجموعه داده بین زبانی برای یادگیری رتبه بندی

سال انتشار: 1398
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 528

فایل این مقاله در 8 صفحه با فرمت PDF قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

CECCONF07_011

تاریخ نمایه سازی: 24 مرداد 1398

چکیده مقاله:

پیشرفت علم داده کاوی باعث بهبود موتورهای جستجوی وب و پاسخگویی مناسب به کاربران وب شده است . بهبود کیفیت رتبه بندی اسناد، سرعت رتبه بندی اسناد، باعث جهش بزرگی در مباحث داده کاوی می شود. امروزه میلیو ن ها صفحه وب در موتورهای جستجو و میلیون ها مخازن اطلاعاتی که در شرکت های تجاری و مراکز دانشگاهی و علمی که هر روزه بر میزان آن ها افزوده می شود بازیابی سند و رتبه دهی را لازمه زندگی امروزه کرده است. هر چند الگوریتم هایی ارائه شده است ولی در زمینه ساخت مجموعه های مناسب آموزشی هم از نظر کمیت و هم کیفیت هنوز سوالات بسیاری باقی است . تولید و ایجاد مجموعه آموزشی مناسب، یک قدم پیش از استفاده از الگوریتم های رتبه بندی مورد استفاده قرار می گیرد که باعث تاثیر شگرفی بر الگوریتم های رتبه دهی می شود تا بتوانند اسناد با کیفیت را بازیابی کنند. این مقاله تلاشی برای ایجاد یک مجموعه داده آموزشی بهینه و با کیفیت است تا الگوریتم های رتبه بندی بهترین عملکرد را داشته باشند و بتوانند حداکثر رضایت کاربر را تامین نمایند. ایده اصلی کار از روش های جبر مجموعه ها تبعیت می کند که در این روش های بهینه بودن را با استفاده از روش های ارزیابی اندازه گیری کند. برای ارزیابی روش پیشنهادی مبتنی بر روش های جبر مجموعه از مجموعه داده استاندارد همشهری استفاده شده که نتایج ارزیابی نشان داد، روش پیشنهادی باعث می شود رتبه بندی با دقت بیشتری انجام و اسناد با اطمینان بیشتری از مجموعه داده آموزشی انتخاب شود.

کلیدواژه ها:

بازیابی اطلاعات ، یادگیری رتب هبندی ، ساخت مجموعه داده ی آموزشی

نویسندگان

سمیه عبادی

گروه کامپیوتر،واحد یادگار امام خمینی (ره)شهرری، دانشگاه آزاد اسلامی، تهران، ایران

الهام قنبری

گروه کامپیوتر،واحد یادگار امام خمینی (ره)شهرری، دانشگاه آزاد اسلامی، تهران، ایران