تشخیص موضوع و ردیابی آن
عنوان مقاله: تشخیص موضوع و ردیابی آن
شناسه ملی مقاله: BPJ02_234
منتشر شده در دومین کنفرانس ملی رویکردهای نوین در مهندسی کامپیوتر و برق در سال 1395
شناسه ملی مقاله: BPJ02_234
منتشر شده در دومین کنفرانس ملی رویکردهای نوین در مهندسی کامپیوتر و برق در سال 1395
مشخصات نویسندگان مقاله:
عالیه السادات بشارت گیلانی - کارشناس ارشد مهندسی کامپیوتر - نرم افزار
خلاصه مقاله:
عالیه السادات بشارت گیلانی - کارشناس ارشد مهندسی کامپیوتر - نرم افزار
تشخیص موضوع و ردیابی آن یک حوزه از تحقیقات بازیابی اطلاعات است، که بر اخبار و رویدادهای خبری تمرکز دارد. هدف از تشخیص موضوع و ردیابی آن «شکستن متن به داستان های خبری منحصر به فرد، به منظور نظارت بر داستان ها برای رویدادهایی که قبلاً دیده نشده اند، و برای جمع آوری داستان ها به گروه هایی که هر کدام در مورد یک موضوع خبری منفرد بحث می کنند» است. معیارهای ارزیابی مورد استفاده در تشخیص و ردیابی موضوع و پنج وظیفه پژوهشی آن عبارتند از : ردیابی موضوع، تشخیص لینک، تشخیص موضوع، تشخیص اولین داستان و تقسیم بندی داستان. یکی از بهرین روش ها برای تشخیص و ردیابی موضوع، اجرای الگوریتم خوشه بندی K-Means بر روی داده های مورد نظر است. در این تحقیق نیز آزمایشاتی با استفاده از الگوریتم K-Means روی داده های روزنامه همشهری صورت گرفته، و نتایج حاصل از این آزمایشات نشان می دهند که داده ها با درصد خطای پایینی خوشه بندی شده و موضوعات با درصد بالایی در خوشه مناسب قرار داده می شوند.
کلمات کلیدی: تشخیص و ردیابی موضوع، بازیابی اطلاعات، خوشه بندی و الگوریتم K-Means
صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/522728/