ارائه روشی جهت تشخیص ارتباط پنهان ماجراهای خبری فارسی

  • سال انتشار: 1398
  • محل انتشار: پنجمین همایش ملی علوم و مهندسی دفاعی
  • کد COI اختصاصی: ECDS05_137
  • زبان مقاله: فارسی
  • تعداد مشاهده: 432
دانلود فایل این مقاله

نویسندگان

احمدرضا طاهری کیا

مرکز علم و فناوری رایانه و نرم افزار مبین، دانشکده ی فناوری اطلاعات و ارتباطات، دانشگاه جامع امام حسین (ع)، تهران، ایران

علیرضا حبیبی

مرکز علم و فناوری رایانه و نرم افزار مبین، دانشکده ی فناوری اطلاعات و ارتباطات، دانشگاه جامع امام حسین (ع)، تهران، ایران

مهدی نقوی

مرکز علم و فناوری رایانه و نرم افزار مبین، دانشکده ی فناوری اطلاعات و ارتباطات، دانشگاه جامع امام حسین (ع)، تهران، ایران

چکیده

یکی از روشهای استخراج دانش مورد علاقه کاربران از حجم زیادی از اخبار در یک بازه زمانی، تشخیص و ردیابی موضوعات است. تشخیص پیوند ماجرا یکی از مهمترین بخشهای تشخیص و ردیابی موضوعات است که قصد دارد مشخص کند که آیا دو ماجرای رخ داده در روزهای مختلف، درباره یک موضوع مشابه بحث میکنند یا خیر. بر این اساس اگر یک ماجرای جدید با یک یا چند ماجرای به وجود آمده در قبل از لحاظ معنایی ارتباط داشته باشد، یک پیوند بین این ماجراها برقرار میگردد. یکی از چالش های اصلی در رصد جریان موضوعی اخبار، عدم تشخیص ارتباط بین ماجراهایی است که دارای پیوند پنهان هستند. لازمه یک تشخیص درست برای پیوند دادن ماجراها به یکدیگر، مشخص شدن تمامی زوایای پنهان موجود در موضوعات خبری است. این مقاله، برای مقابله با چالش های موجود در تشخیص و ردیابی موضوع، روش جدیدی را درتشخیص پیوند ماجراهای خبری فارسی ارائه میدهد. رویکرد پیشنهادی برای رفع چالش یافتن وابستگی پنهان ماجراهای جدید خبری به ماجراهای قبلی با بهره گیری از روشهای یادگیری ماشین، وابستگی معنایی بین موضوعات را تشخیص میدهد. نتایج حاصل از ارزیابی، نشان دهنده عملکردمناسب رویکرد پیشنهادی در جهت تشخیص پیوند بین ماجراها و تشخیص رویداد جدید است. در رویکرد پیشنهادی تعداد تشخیص های اشتباه، کاهش یافته است. همچنین با کاهش تعداد داده های مفقود شده، روابط پنهان استخراج شده %15 بیشتر از روش پایه بوده است.

کلیدواژه ها

تشخیص و ردیابی موضوع، رصد جریان موضوعی اخبار، تشخیص پیوند ماجراها، ارتباط موضوعی اخبار

مقالات مرتبط جدید

اطلاعات بیشتر در مورد COI

COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.

کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.