رویکردی نوین در تشخیص نویسنده متون با الگوریتم ترکیبی ماشین بردار پشتیبان و K نزدیکترین همسایه

سال انتشار: 1396
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 726

فایل این مقاله در 8 صفحه با فرمت PDF قابل دریافت می باشد

این مقاله در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

MAEMT02_117

تاریخ نمایه سازی: 11 مرداد 1396

چکیده مقاله:

شناسایی نویسنده متون به عنوان یکی از پر اهمیت ترین مباحث در حوزه پردازش زبان طبیعی می باشد که سعی می شود تا با استفاده از تحلیل واژگان و عقاید دستوری زبانی، مقهوم جمله برای سیستم کامپیوتری قابل درک باشد تا براساس این مفاهیم، متون مربوط به هر نویسنده از یکدیگر تفکیک گردند. بر این اساس در این مقاله روشی نوین برای حل این مسیله با ترکیب الگوریتم ماشین بردار پشتیبان و الگوریتم K نزدیکترین همسایه (KNN) ارایه شده است در روش پیشنهادی پارامتر گامای الگوریتم ماشین بردار پشتیبان توسط الگوریتم KNN مقدار دهی می گردد همچنین در روش پیشنهادی از مجموعه داده Reuter_50_50 به عنوان مجموعه داده تست و آموزش و از ویژگی های لغوی و ساختاری به عنوان ویژگی های موثر استفاده شده است. نتایج حاصله از روش پیشنهادی و دو الگوریتم دیگر براساس چهار معیار ارزیابی تعداد داده های نادرست طبقه بندی شده، تعداد داده های درست طبقه بندی شده، درصد دقت و درصد دوباره فراخوانی مورد ارزیابی قرار گرفته است. براساس نتایج حاصله الگوریتم پیشنهادی دارای درصد دقت 0.991 و درصد دوباره فراخوانی 0.99 می باشد در حالی که درصد دقت و درصد دوباره فراخوانی برای الگوریتم ماشین بردار پشتیبان برابر با 0.962 و 0.961 و برای الگوریتم K نزدیکترین همسایه برابر با 0.94 و 0.93 می باشد براساس این نتایج می توان گفت که روش پیشنهادی بهنیه تر از دو الگوریتم ماشین بردار پشیتبان و الگوریتم K نزدیکترین همسایه می باشد.

کلیدواژه ها:

تشخیص نویسنده متون ، الگوریتم ماشین بردار پشتیبان ، الگوریتم K نزدیکترین همسایه ، پردازش زبان طبیعی ، بهینه سازی

نویسندگان

زهرا حسنلو

گروه مهندسی کامپیوتر، دانشگاه آزاد اسلامی واحد ارومیه، ارومیه، ایران

فرهاد سلیمانیان قره چپق

گروه مهندسی کامپیوتر، دانشگاه آزاد اسلامی واحد ارومیه، ارومیه ایران