شناسایی ماکزیمم کلمات پرتکرار برای زبان های گوناگون
سال انتشار: 1396
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 477
فایل این مقاله در 11 صفحه با فرمت PDF قابل دریافت می باشد
- صدور گواهی نمایه سازی
- من نویسنده این مقاله هستم
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
ITCT04_301
تاریخ نمایه سازی: 17 آبان 1396
چکیده مقاله:
یکی از چالشهای موجود بر سر راه شناسایی کلمات پرتکرار، وجود زبانهای بسیار متنوع برای اطلاعات متنی و وابستگی روش های موجود شناسایی کلمات پرتکرار به نوع زبان و ساختار کلامی آن زبان خاص می باشد. لذا هدف این پژوهش، طراحی الگوریتمی مستقل از زبان بهمنظور شناسایی کلمات پرتکرار میباشد. از این رو با تمرکز روی خاصیت تکرار کلمات در هر متن و نسبت تکرار آن در سایر متون این امر انجام شده ا ست و در نهایت ماکزیمم بیشترین تکرار به عنوان کلمه پرتکرار انتخاب میگردد. عملکرد الگوریتم پیشنهادی نیز تو سط معیار نرخ دقت ت ش خیص مورد ارزیابی قرار گرفته ا ست . لازم به ذکر ا ست که این الگوریتم با الگوریتم مبتنی بر گراف مقایسه گردیده ا ست، که نرخ دقت کلی الگوریتم پیشنهادی 82.2 %درصد بوده است
کلیدواژه ها:
نویسندگان
بهاره هاشم زاده
گروه کامپیوتر، دانشکده فنی و مهندسی، دانشگاه تربت حیدریه
مجید عبدالرزاق نژاد
گروه کامپیوتردانشکده فنی و مهندسی دانشگاه بزرگمهرقاینات
سیدمحمد جوادی مقدم
گروه کامپیوتر، دانشکده فنی و مهندسی، دانشگاه بزرگمهر قاینات