بررسی روش ها و مدل های شناسایی نویسنده

  • سال انتشار: 1394
  • محل انتشار: کنفرانس ملی دستاورهای نوین در برق وکامپیوتر
  • کد COI اختصاصی: NCAEC01_011
  • زبان مقاله: فارسی
  • تعداد مشاهده: 679
دانلود فایل این مقاله

نویسندگان

رضا یوسفی

دانشکده فنی و مهندسی دانشگاه آزاد اسلامی واحد دامغان

چکیده

پیشرفت سریع ارتباطات اینترنتی و ناشناسبودن هویت ابزارهای اینترنتی مانند ایمیل، وبلاگ ها و سایت ها از یک طرف و اختلافات قانونی و حقوقی بهوجود آمده، باعث توجه بیشتر به موضوع شناسایی نویسنده شده است. شناسایی نویسنده تلاشی است برای بهدست آوردن خصوصیات نویسنده یکمتن و مقایسه آنها با ویژگیهای متون مختلفی که توسط چندین فرد نوشته شده اند؛ به طوری که بتوان بین متون تمایز معنی داری قائل شد. شناسایی نویسنده علمی است که به صورت تلفیقی از زبان شناسی و داده کاوی می باشد. علم زبان شناسی به منظور شناسایی و به دست آوردن ویژگی های متن و علم داده کاوی جهت انجام پردازش های محاسباتی و آماری با هدف شناسایی نویسنده مورد استفاده قرار می گیرند. در این مقاله پس از آشنایی با ویژگی های متن و روش هایی که می توان از آنها در شناسا یی نویسنده استفاده کرد، مدل ها و الگوریتم هایی که بر اساس خصوصیات متون روی آنها پردازشی انجام میدهند، مرور خواهد شد.

کلیدواژه ها

آنالیز متن، استخراج ویژگی، شناسایی نویسنده، طبقه بندی متن

مقالات مرتبط جدید

اطلاعات بیشتر در مورد COI

COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.

کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.