بهبود الگوریتم ژنتیک با الگوریتم شبیه سازی تبرید برای انتخاب ویژگی ها در تشخیص نویسنده اسناد متنی
- سال انتشار: 1397
- محل انتشار: چهارمین کنفرانس ملی محاسبات توزیعی و پردازش داده های بزرگ
- کد COI اختصاصی: DCBDP04_085
- زبان مقاله: فارسی
- تعداد مشاهده: 665
نویسندگان
گروه مهندسی کامپیوتر، واحد ارومیه، دانشگاه آزاد اسلامی، ارومیه، ایران
گروه مهندسی کامپیوتر، واحد ارومیه، دانشگاه آزاد اسلامی، ارومیه، ایران
چکیده
عصر ارتباطات و گسترش استفاده از نامه های الکترونیکی، پیام های فوری، اسناد، وبلاگ ها، مقالات خبری، صفحات خانگی، تالارهای گفتگو و اسناد چاپی، متن را به اصلی ترین وسیله ی ارایه و انتقال اطلاعات تبدیل کرده است. بطور کلی تشخیص نویسنده متون تلاشی برای نشان دادن خصوصیات تولید کننده یا نویسنده یک تکه از اطلاعات زبانی تعریف می شود، به طوری که بتوان بین متون مختلف که نوشته ی افراد مختلف اند، تمایز قایل شویم. شناسایی نویسنده متن از روی نثر سبک و شیوه نوشتاری، یا به عبارت دیگر ویژگی های نهفته در متون نوشته شده توسط وی Writeprint می باشد. ترکیب خصوصیات نوشتاری مانند طول کلمات، چینش پاراگراف ها، پرمایگی واژگان، استفاده از کلمات تابعی و غیره writeprint را تشکیل می دهند. از طریق این خصیصه های سبک شناختی، که معمولا در طول نوشتار یک فرد ثابت هستند شناسایی هویت نویسنده متون انجام می گیرد. در ارایه روش های تشخیص نویسنده متون نکته حایز اهمیت، انتخاب ویژگی های کلیدی و حذف ویژگی های اضافی و غیرمرتبط در تشخیص نویسنده متون می باشد. لذا از این رو ما در این مقاله روشی براساس بهبود الگوریتم ژنتیک با الگوریتم شبیه سازی تبرید برای انتخاب ویژگی ها در تشخیص نویسنده اسناد متنی ارایه دادیم. که در روش پیشنهادی از الگوریتم شبیه سازی تبرید برای انتخاب ویژگی های کلیدی و از الگوریتم ژنتیک، نویسنده متون را براساس ویژگی های کلیدی تشخیص دادیم. ارزیابی نتایج حاصله بیانگر دقت بالا و نتایج بهینه روش پیشنهادی در مقایسه با روش های استخراج ویژگی های متون در تشخیص هویت نویسنده اسناد متنی می باشد.کلیدواژه ها
الگوریتم شبیه سازی تبرید، الگوریتم ژنتیک، بهینه سازی، سبک نوشتاری، تشخیص نویسنده متونمقالات مرتبط جدید
- مرور سیستماتیک کاربرد هوش مصنوعی در موسیقی
- In-silico Analyses for Finding Potential Key Genes and Pathways Associated with Guillain-Barré Syndrome Using Computational Tools
- OCD Severity Based on EEG Signals
- Investigating the (non) -Impact of Customizing Knowledge Bases of Artificial Intelligence -Driven Robot on Language for Specific Purposes Learning
- The Need for Telehealth and Tele-Educationon in Optimizing Measles Surveillance and Reducing Healthcare Costs
اطلاعات بیشتر در مورد COI
COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.
کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.