CIVILICA We Respect the Science
(ناشر تخصصی کنفرانسهای کشور / شماره مجوز انتشارات از وزارت فرهنگ و ارشاد اسلامی: ۸۹۷۱)

تشخیص موضوع و ردیابی آن

عنوان مقاله: تشخیص موضوع و ردیابی آن
شناسه ملی مقاله: BPJ02_234
منتشر شده در دومین کنفرانس ملی رویکردهای نوین در مهندسی کامپیوتر و برق در سال 1395
مشخصات نویسندگان مقاله:

عالیه السادات بشارت گیلانی - کارشناس ارشد مهندسی کامپیوتر - نرم افزار

خلاصه مقاله:
تشخیص موضوع و ردیابی آن یک حوزه از تحقیقات بازیابی اطلاعات است، که بر اخبار و رویدادهای خبری تمرکز دارد. هدف از تشخیص موضوع و ردیابی آن «شکستن متن به داستان های خبری منحصر به فرد، به منظور نظارت بر داستان ها برای رویدادهایی که قبلاً دیده نشده اند، و برای جمع آوری داستان ها به گروه هایی که هر کدام در مورد یک موضوع خبری منفرد بحث می کنند» است. معیارهای ارزیابی مورد استفاده در تشخیص و ردیابی موضوع و پنج وظیفه پژوهشی آن عبارتند از : ردیابی موضوع، تشخیص لینک، تشخیص موضوع، تشخیص اولین داستان و تقسیم بندی داستان. یکی از بهرین روش ها برای تشخیص و ردیابی موضوع، اجرای الگوریتم خوشه بندی K-Means بر روی داده های مورد نظر است. در این تحقیق نیز آزمایشاتی با استفاده از الگوریتم K-Means روی داده های روزنامه همشهری صورت گرفته، و نتایج حاصل از این آزمایشات نشان می دهند که داده ها با درصد خطای پایینی خوشه بندی شده و موضوعات با درصد بالایی در خوشه مناسب قرار داده می شوند.

کلمات کلیدی:
تشخیص و ردیابی موضوع، بازیابی اطلاعات، خوشه بندی و الگوریتم K-Means

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/522728/