بررسی وکشف رونوشت های نزدیک انجمن های وب
محل انتشار: همایش ملی مهندسی کامپیوتر و فناوری اطلاعات
سال انتشار: 1392
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 779
فایل این مقاله در 8 صفحه با فرمت PDF قابل دریافت می باشد
- صدور گواهی نمایه سازی
- من نویسنده این مقاله هستم
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
NCCEB01_038
تاریخ نمایه سازی: 18 خرداد 1393
چکیده مقاله:
فن آوری های انجمن جستجوی فعلی قادر به شناسایی دنباله ها در مندرجات نزدیک به رونوشت (تکرار) و گروه بندی این دنباه ها در نتایج جستجو نمیباشند. در نتیجه کاربران انجمن با نتایج جستجوی رونوشت شده بار زیادی بر دوش دارند که ترجیح می دهند دنباله های جدید بدون سعی در یافتن آنچه موجود است، ایجاد کنند. بنابراین در این مقاله ما دلایل معمول را که منجر به رونوشت و ایجاد الگوریتم کشف رونوشت جدید برای دنباله های انجمن میشود را شناسایی می کنیم. این الگوریتم با استفاده از یک پژوهش بزرگ از انجمن در دنیای واقعی که بیش از یک میلیون کاربر را به خدمت گرفته است،کامل می شود. ما این کار را با الگوریتم های فعلی مشابه برای کشف رونوشت ها در صفحات وب مورد مقلیسه قرار می دهیم. نتایج اولیه ی ما نشان میدهد که ما به طور چشمگیری این الگوریتم ها را به کار گرفته ایم و ما موفق به گروه بندی دنباله های انجمن با دقت 74 درصد شده ایم.
کلیدواژه ها:
نویسندگان
حسن نادری
استادیار دانشگاه علم وصنعت
مراجع و منابع این مقاله:
لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :