Authorship Attribution In Historical And Literary Texts By A Deep Learning Classifier

  • سال انتشار: 1399
  • محل انتشار: نشریه سیستمهای هوشمند کاربردی و علوم اطلاعات، دوره: 1، شماره: 2
  • کد COI اختصاصی: JR_JAISIS-1-2_006
  • زبان مقاله: انگلیسی
  • تعداد مشاهده: 215
دانلود فایل این مقاله

نویسندگان

Ehsan Reisi

Persian Language and Literature, Faculty of Literature and Humanities, university of Isfahan, isfahan

Hassan Mahboob Farimani

Center of Fundamental and Applied Studies of Mystical Literature, University of Isfahan, Azadi square, Isfahan, Iran

چکیده

One of the important problems that language and literature scholars face is the difficulty of determining the author of the historical and literary texts. Deep learning, the latest available approaches for solving such problems, provides high accuracy results. In this paper, we show how to overcome ownership claims in historical texts by deep learning methods that are designed for text classification. In this regard, we propose a convolution neural network with a four-part architecture and self-attention mechanism to classify texts. In addition, the proposed method increases the accuracy of Author determination up to 2% in comparison with existing methods. Moreover, in our case study, Khān al-Ikhwān, written by Nāsir-i Khusraw, the author determination accuracy was 86%. Although our focus is on Persian historical textbooks through this article, our method can be applied to other languages effectively.

کلیدواژه ها

Text Mining, Deep Learning, authorship attribution, Text Classification, Convolutional Neural Networks

اطلاعات بیشتر در مورد COI

COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.

کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.