تشخیص عنوان پاراگراف در متون فارسی
سال انتشار: 1394
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 1,791
فایل این مقاله در 12 صفحه با فرمت PDF قابل دریافت می باشد
- صدور گواهی نمایه سازی
- من نویسنده این مقاله هستم
این مقاله در بخشهای موضوعی زیر دسته بندی شده است:
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
ITCC01_520
تاریخ نمایه سازی: 9 فروردین 1395
چکیده مقاله:
امروزه منابع خبری مختلف و شبکه های اجتماعی متنوع حاوی اطلاعات مفید زیادی هستند.تشخیص عنوان یکی از شاخه های متن کاوی است که به تکنیک های خودکار جهت پیداکردنمفاهیم به هم وابسته و یافتن ارتباط موضوعی در جریانی از داده ها اشاره دارد. به بیان دیگر،تشخیص عنوان یکی از موارد کاربرد سیستم طبقه بندی خودکار متون می باشد که به تکنیک هایخودکار جهت پیدا کردن مفاهیم به هم وابسته و یافتن ارتباط موضوعی در جریانی از داده ها اشارهدارد. در این پژوهش هدف تشخیص عنوان در یک پاراگراف در متون فارسی است. جهت انجام اینکار در مرحله نخست پیش پردازش بر روی مجموعه داده ها صورت می پذیرد. پاراگراف ها مشخص،اسناد یکسان سازی، کلمات از هم جدا می شوند. سپس با استفاده از یک دیکشنری، کلمات عمومیاز اسناد حذف می شوند. با استفاده از وزن دهی کلمات کلیدی مشخص می شوند. در این مرحله، متنبه صورت برداری از ویژگی های مهم درآمده است که به عنوان ورودی به دسته بندها داده می شود.هر کدام از دسته ها معرف عناوین سندها می باشند. روش پیشنهادی با استفاده از دسته بندی با ناظراست و بر روی داده های حقیقی آزمایش شده است. نتایج حاکی از کارایی مناسب الگوریتمپیشنهادی می باشد.
کلیدواژه ها:
نویسندگان
مریم رفیعی پور
گروه کامپیوتر، واحد اهواز، دانشگاه آزاد اسلامی اهواز، ایران
محمدحسین یکتایی
گروه کامپیوتر، واحد آبادان، دانشگاه آزاد اسلامی آبادان، ایران
مراجع و منابع این مقاله:
لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :