بهبود خوشه بندی و رتبه بندی صفحات متنی اخبار در گروه های خبری

عبدالکریم الهی

بهبود خوشه بندی و رتبه بندی صفحات متنی اخبار در گروه های خبری

محل انتشار: اولین کنفرانس ملی محاسبات نرم و فن آوری اطلاعات

سال انتشار: 1389

نوع سند: مقاله کنفرانسی

زبان: فارسی

مشاهده: 1,599

فایل این مقاله در 8 صفحه با فرمت PDF قابل دریافت می باشد

دریافت فایل کامل مقاله

صدور گواهی نمایه سازی
من نویسنده این مقاله هستم

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

https://civilica.com/doc/132757

شناسه ملی سند علمی:

NCSCIT01_052

تاریخ نمایه سازی: 19 بهمن 1390

چکیده مقاله:

در حال حاضر سایتهای خبری زیادی در حال فعالیت می باشند و اطلاعات خود را در وب سایت هایی به صورت اسناد الکترونیکی یا صفحات متنی در اختیار کاربران قرار می دهند بر همین اساس تکنولوزیها , ابزارها و موتورهای جستجوی خاصی برای این منظور بکارگیری شدند. خوشه بندی یکی از تکنیکهای بسیار قدرتمند داده کاوی برای کشف موضوع در صفحات متنی می باشد. در ابتدا خوشه بندی در سیستم های بازیابی اطلاعات و برای افزایش یادآوری و دقت بکار می رفت بعدها برای جستجوی مجموعه ای از سندها بطور اتوماتیک بکار گیری شد.یکی از بهترین روشهای خوشه بندی اسناد , روش bi_secting K_means می باشد و معمولاٌ تابع کسینوسی برای اندازه گیری مشابهت بین دو سند در تابع معیار استفاده می شود اما وقتی خوشه ها به خوبی از هم جدا نباشد این تابع به خوبی کار نخواهد کرد. برای حل این مشکل یک اندازه گیری مشابهت از مفاهیم هماسیه ها و ارتباط ها (links) استفاده می شود و به جای اینکه تنها شباهت جفتی در نظر گرفته شود بوسیله هماسیه ها و ارتباط ها ، اطلاعات عمومی اندازه گیری نزدیکی دو سند در نظر گرفته می شود و با وزن دهی دقیق تر می توانیم بهبود قابل ملاحظه ای در کارایی خوشه بندی اسناد الکترونیکی ایجاد کنیم.

کلیدواژه ها:

خوشه بندی ، رتبه بندی ، صفحات متنی اخبار ، همسایه ها ، وزن دهی

نویسندگان

عبدالکریم الهی

گروه کامپیوتر - دانشگاه آزاد اسلامی واحد بهشهر

مراجع و منابع این مقاله:

لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :

_ _ Clustering Data, ...
C. Buckley, A.F. Lewitt, Optimization of inverted vector searches, in: ...
Y. Li, S.M. Chung, J.D. Holt, Text document clustering based ...
Y. Li, C. Luo, S.M. Chung, Text clustering with feature ...
S. Guha, R. Rastogi, K. Shim, ROCK: a robust clustering ...
J.A. Hartigan, Clustering Algorithms, John Wiley and Sons, 1975. ...
Y. Li, S.M. Chung, Parallel bisecting k-means with prediction clustering ...
M. Steinbach, G. Karypis, v. Kumar, A comparison _ document ...
D.R. Cutting, D.R. Karger, J.O. Pedersen, J.W. Tukey, Scatter/gather: a ...
SIGIR Conf. On Research and Development in Information _ _ ...
J.D. Holt, S.M. Chung, Y. Li, Usage of mined word ...

نمایش کامل مراجع