رویکردی نوین در تشخیص نویسنده متون با الگوریتم ترکیبی ماشین بردار پشتیبان و K نزدیکترین همسایه

  • سال انتشار: 1396
  • محل انتشار: دومین کنفرانس ملی ریاضی:مهندسی پیشرفته با تکنیک های ریاضی
  • کد COI اختصاصی: MAEMT02_117
  • زبان مقاله: فارسی
  • تعداد مشاهده: 743
دانلود فایل این مقاله

نویسندگان

زهرا حسنلو

گروه مهندسی کامپیوتر، دانشگاه آزاد اسلامی واحد ارومیه، ارومیه، ایران

فرهاد سلیمانیان قره چپق

گروه مهندسی کامپیوتر، دانشگاه آزاد اسلامی واحد ارومیه، ارومیه ایران

چکیده

شناسایی نویسنده متون به عنوان یکی از پر اهمیت ترین مباحث در حوزه پردازش زبان طبیعی می باشد که سعی می شود تا با استفاده از تحلیل واژگان و عقاید دستوری زبانی، مقهوم جمله برای سیستم کامپیوتری قابل درک باشد تا براساس این مفاهیم، متون مربوط به هر نویسنده از یکدیگر تفکیک گردند. بر این اساس در این مقاله روشی نوین برای حل این مسیله با ترکیب الگوریتم ماشین بردار پشتیبان و الگوریتم K نزدیکترین همسایه (KNN) ارایه شده است در روش پیشنهادی پارامتر گامای الگوریتم ماشین بردار پشتیبان توسط الگوریتم KNN مقدار دهی می گردد همچنین در روش پیشنهادی از مجموعه داده Reuter_50_50 به عنوان مجموعه داده تست و آموزش و از ویژگی های لغوی و ساختاری به عنوان ویژگی های موثر استفاده شده است. نتایج حاصله از روش پیشنهادی و دو الگوریتم دیگر براساس چهار معیار ارزیابی تعداد داده های نادرست طبقه بندی شده، تعداد داده های درست طبقه بندی شده، درصد دقت و درصد دوباره فراخوانی مورد ارزیابی قرار گرفته است. براساس نتایج حاصله الگوریتم پیشنهادی دارای درصد دقت 0.991 و درصد دوباره فراخوانی 0.99 می باشد در حالی که درصد دقت و درصد دوباره فراخوانی برای الگوریتم ماشین بردار پشتیبان برابر با 0.962 و 0.961 و برای الگوریتم K نزدیکترین همسایه برابر با 0.94 و 0.93 می باشد براساس این نتایج می توان گفت که روش پیشنهادی بهنیه تر از دو الگوریتم ماشین بردار پشیتبان و الگوریتم K نزدیکترین همسایه می باشد.

کلیدواژه ها

تشخیص نویسنده متون، الگوریتم ماشین بردار پشتیبان، الگوریتم K نزدیکترین همسایه، پردازش زبان طبیعی، بهینه سازی

مقالات مرتبط جدید

اطلاعات بیشتر در مورد COI

COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.

کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.