بررسی و مقایسه بازیابی تحمل پذیر با استفاده از تکنیک N-Gram و فاصله لون شتاین در زبان عربی

سال انتشار: 1394
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 1,328

فایل این مقاله در 11 صفحه با فرمت PDF قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

NCCOS03_168

تاریخ نمایه سازی: 9 مرداد 1395

چکیده مقاله:

یکی ازمسائل مهم دربازیابی اطلاعات قابلیت بازیابی تحمل پذیرمی باشد بازیابی تحمل پذیربه این معنی است که اگرکاربر به دلایلی ازجمله غلط املایی، عدم بیان نیازاطلاعاتی و عدم اشنایی با چگونگی اطلاعات موجود درپایگاه داده ما نتواند درخواست خود را بصورت صحیح وکامل بیان کند سیستم بازیابی اطلاعات با استفاده ازقابلیت تحمل پذیراین خطاها را ت احدممکن کاهش داده و بتواند نتایج موردپسند کاربر را بازیابی و به آن ارایه کند دراین مقاله سعی شده است برای افزایش قابلیت تحمل پذیری درزبان عربی ازدوتکنیک N-Gram و فاصله لون شتاین برای تصحیح خطا و ارایه کلمات مشابه درپرسو جو کاربر استفاده شود همچنین باپیاده سازی منبع عظیمی ازاطلاعات به زبان عربی سعی شده است بهترین حالت ازبین زیرمجموعه های یک گرام دوگرام سه گرام و چهارگرام و لون شتاین را که باعث افزایش کارایی و قابلیت تحمل پذیری دربازیابی اطلاعات می شود را انتخاب کنیم

نویسندگان

جلال رضایی نور

استادیار گروه مهندسی صنایع دانشکده فنی ومهندسی دانشگاه قم قم

یوسف زارعی طاهر

گروه مهندسی فناوری اطلاعات دانشکده فنی ومهندسی دانشگاه قم ،قم

محمد رضا زوین

گروه مهندسی فناوری اطلاعات دانشکده فنی ومهندسی دانشگاه قم ،قم

سید مساعد موسوی نصر

گروه مهندسی فناوری اطلاعات دانشکده فنی ومهندسی دانشگاه قم ،قم

مراجع و منابع این مقاله:

لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :
  • شیروانی پ، وطن خواه م، یغمایی خ، 1393، «بازشناسی متون ...
  • آرمین ن، شمس فرد م، «تبدیل متن محاوره‌ای فارسی به ...
  • بهی ع، خامه یار الف، سرایی م، « آشکارسازی زبان ...
  • شیخائی م، شیری قیداری س، 5 جستجو چینش بهینه حروف ...
  • Jesus Vilares, Juan Otero(2011) .Managing misspelled queries in IR applications. ...
  • .Kukich, K. (1992). Techniques for automatically correcting words in text. ...
  • Grigori Sidorov, Francisco Velasquez(20 14). Syntactic N-grams as machine learning ...
  • Ethan Miller, Dan Shen, Junli Liu, and Charles Nicholas(2000) _ ...
  • Grigori Sidorov, Francisco Velasquez(20 14). Syntactic N-grams as machine learning ...
  • نمایش کامل مراجع