بررسی وکشف رونوشت های نزدیک انجمن های وب

حسن نادری; فریبا سلیمانی

بررسی وکشف رونوشت های نزدیک انجمن های وب

محل انتشار: همایش ملی مهندسی کامپیوتر و فناوری اطلاعات

سال انتشار: 1392

نوع سند: مقاله کنفرانسی

زبان: فارسی

مشاهده: 879

فایل این مقاله در 8 صفحه با فرمت PDF قابل دریافت می باشد

دریافت فایل کامل مقاله

صدور گواهی نمایه سازی
من نویسنده این مقاله هستم

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

https://civilica.com/doc/254202

شناسه ملی سند علمی:

NCCEB01_038

تاریخ نمایه سازی: 18 خرداد 1393

چکیده مقاله:

فن آوری های انجمن جستجوی فعلی قادر به شناسایی دنباله ها در مندرجات نزدیک به رونوشت (تکرار) و گروه بندی این دنباه ها در نتایج جستجو نمیباشند. در نتیجه کاربران انجمن با نتایج جستجوی رونوشت شده بار زیادی بر دوش دارند که ترجیح می دهند دنباله های جدید بدون سعی در یافتن آنچه موجود است، ایجاد کنند. بنابراین در این مقاله ما دلایل معمول را که منجر به رونوشت و ایجاد الگوریتم کشف رونوشت جدید برای دنباله های انجمن میشود را شناسایی می کنیم. این الگوریتم با استفاده از یک پژوهش بزرگ از انجمن در دنیای واقعی که بیش از یک میلیون کاربر را به خدمت گرفته است،کامل می شود. ما این کار را با الگوریتم های فعلی مشابه برای کشف رونوشت ها در صفحات وب مورد مقلیسه قرار می دهیم. نتایج اولیه ی ما نشان میدهد که ما به طور چشمگیری این الگوریتم ها را به کار گرفته ایم و ما موفق به گروه بندی دنباله های انجمن با دقت 74 درصد شده ایم.

کلیدواژه ها:

کشف رونوشت نزدیک ، انگشت نگاری ، گروه بندی دنباله

نویسندگان

حسن نادری

استادیار دانشگاه علم وصنعت

فریبا سلیمانی

مراجع و منابع این مقاله:

لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :

. Alexander Loser K. Muthmann, W. M. Barczy nski. Nearduplicate ...
. R. Kern M. Strohmaier, C. Korner. Understanding why ...
from an empirical study. pages 1-11, 2012. ...
M. Potthast and B. Stein. :New issues in near- duplicate ...
G. S. Manku, A.J. A. D. Sarma: TDetecting NearDuplicates for ...
Pamulaparty, _ Rao, D.M.S., and Rao, D.C.V.G.: :A Survey on ...

نمایش کامل مراجع