مدل سازی موضوعی متنی بر روی ریز نوشته های رسانه های اجتماعی فارسی

سال انتشار: 1403
نوع سند: مقاله ژورنالی
زبان: فارسی
مشاهده: 32

فایل این مقاله در 17 صفحه با فرمت PDF قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

JR_ABMIR-2-2_012

تاریخ نمایه سازی: 13 خرداد 1404

چکیده مقاله:

ظهور رسانه های اجتماعی فرصت های فزاینده ای برای اشتراک افکار کاربران فراهم می کنند. روزانه میلیاردها ریزنوشته در رسانه های اجتماعی تولید می شود که تحلیل آن ها در حوزه متن کاوی و تحلیل محتوا امری ضروری است. استخراج موضوعات دقیق از ریزنوشته ها در مقیاس بزرگ کاری مهم و چالش برانگیز است. مطالعات اندکی در زمینه تشخیص موضوع در ریزنوشته های فارسی انجام شده است و الگوریتم های موجود قابل توجه نیستند. ازاین رو بر آن شدیم در حوزه تشخیص موضوع در زبان فارسی به مطالعه بپردازیم. مدل سازی موضوعی از روش های تشخیص موضوع است که گروه هایی از کلمات را به عنوان موضوع از اسناد استخراج می کنند. اخیرا مدل های موضوع عصبی بهبودهایی برای افزایش انسجام مدل سازی موضوعی نشان داده است. همچنین، تعبیه های متنی مدل های عصبی را ارتقا داده اند. بدین سبب، در این تحقیق دو مدل موضوعی متنی ترکیبی و مدل موضوعی متنی ZeroShot برای استخراج موضوع در ریزنوشته های شبکه های اجتماعی فارسی ارائه شده است. این دو مدل بازنمایی متنی از پیش آموزش دیده شده BERT فارسی را در مدل های موضوع عصبی گنجانده اند. نتایج آزمایش ها نشان می دهد که این دو روش نسبت به روش های مورد مقایسه با بالاترین مقدار F۱-Measure ، تنوع موضوع و امتیاز انسجام بالا بهترین عملکرد را از خود نشان می دهند. همچنین مدل موضوعی متنی ZeroShot نسبت به مدل موضوعی متنی ترکیبی نتایج بهتری از لحاظ معیارهای ارزیابی داشته است.

نویسندگان

زینب متقی نیا

دانشجوی دکتری، آزمایشگاه سیستم های پردازش هوشمند رایانه ای، گروه مهندسی کامپیوتر، دانشکده مهندسی برق و کامپیوتر، دانشگاه تبریز، تبریز، ایران

محمدرضا فیضی درخشی

استاد، آزمایشگاه سیستم های پردازش هوشمند رایانه ای، گروه مهندسی کامپیوتر، دانشکده مهندسی برق و کامپیوتر، دانشگاه تبریز، تبریز، ایران

مراجع و منابع این مقاله:

لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :
  • H. Kwak, C. Lee, H. Park, and S. Moon, “What ...
  • H.-T. Liao, K. Fu, and S. A. Hale, “How much ...
  • T. Lin, W. Tian, Q. Mei, and H. Cheng, “The ...
  • J. Qiang, P. Chen, W. Ding, T. Wang, F. Xie, ...
  • T. Shi, K. Kang, J. Choo, and C. K. Reddy, ...
  • T. Ramamoorthy, V. Kulothungan, and B. Mappillairaju, “Topic modeling and ...
  • F. Zhang, W. Gao, Y. Fang, and B. Zhang, “Enhancing ...
  • M. Asgari-Chenaghlu, M.-R. Feizi-Derakhshi, L. Farzinvash, M.-A. Balafar, and C. ...
  • M. R. Khadivi, S. Akbarpour, M.-R. Feizi-Derakhshi, and B. Anari, ...
  • P. Kherwa and P. Bansal, “Topic modeling: a comprehensive review,” ...
  • I. Vayansky and S. A. P. Kumar, “A review of ...
  • A. Abdelrazek, Y. Eid, E. Gawish, W. Medhat, and A. ...
  • R. Churchill and L. Singh, “The evolution of topic modeling,” ...
  • J. Boyd-Graber, Y. Hu, and D. Mimno, “Applications of topic ...
  • X. Wu, T. Nguyen, and A. T. Luu, “A survey ...
  • C. Jacobi, W. Van Atteveldt, and K. Welbers, “Quantitative analysis ...
  • A. T. Han, L. Laurian, and J. Dewald, “Plans versus ...
  • N. N. Haghighi, X. C. Liu, R. Wei, W. Li, ...
  • C. A. Bail et al., “Exposure to opposing views on ...
  • H. Pousti, C. Urquhart, and H. Linger, “Researching the virtual: ...
  • E. Schubert, M. Weiler, and H.-P. Kriegel, “Signitrend: scalable detection ...
  • C. K. Vaca, A. Mantrach, A. Jaimes, and M. Saerens, ...
  • C.-H. Lee, T.-F. Chien, and H.-C. Yang, “An automatic topic ...
  • Y. Du, Y. Yi, X. Li, X. Chen, Y. Fan, ...
  • X. Liu, Y. Gao, Z. Cao, and G. Sun, “LDA-based ...
  • M. Sadeghi and J. Vegas, “How well does Google work ...
  • Z. Mottaghinia, M.-R. Feizi-Derakhshi, L. Farzinvash, and P. Salehpour, “A ...
  • H. Becker, M. Naaman, and L. Gravano, “Beyond trending topics: ...
  • X. Zhou and L. Chen, “Event detection over twitter social ...
  • B. O’Connor, M. Krieger, and D. Ahn, “TweetMotif: Exploratory Search ...
  • S. Phuvipadawat and T. Murata, “Breaking news detection and tracking ...
  • J. Sankaranarayanan, H. Samet, B. E. Teitler, M. D. Lieberman, ...
  • S. Petrović, M. Osborne, and V. Lavrenko, “Streaming first story ...
  • M.-R. Feizi-Derakhshi, Z. Mottaghinia, and M. Asgari-Chenaghlu, “Persian Text Classification ...
  • L. M. Aiello et al., “Sensing trending topics in Twitter,” ...
  • S. Gaglio, G. Lo Re, and M. Morana, “Real-time detection ...
  • J. Huang, M. Peng, and H. Wang, “Topic detection from ...
  • C. Li, A. Sun, and A. Datta, “Twevent: segment-based event ...
  • J. Weng and B.-S. Lee, “Event detection in twitter,” in ...
  • W. Zhang, T. Yoshida, X. Tang, and Q. Wang, “Text ...
  • D. M. Blei, A. Y. Ng, and M. I. Jordan, ...
  • T. Hofmann, “Probabilistic latent semantic indexing,” in Proceedings of the ...
  • H. D. Kim, D. H. Park, Y. Lu, and C. ...
  • D. Quercia, H. Askham, and J. Crowcroft, “Tweetlda: supervised topic ...
  • C. Li et al., “Twiner: named entity recognition in targeted ...
  • A. Benny and M. Philip, “Keyword Based Tweet Extraction and ...
  • M. Ranjbar-Khadivi, S. Akbarpour, M.-R. Feizi-Derakhshi, and B. Anari, “Persian ...
  • B. Perozzi, R. Al-Rfou, and S. Skiena, “Deepwalk: Online learning ...
  • A. Grover and J. Leskovec, “node۲vec: Scalable feature learning for ...
  • L. McInnes, J. Healy, and J. Melville, “Umap: Uniform manifold ...
  • R. J. G. B. Campello, D. Moulavi, and J. Sander, ...
  • Y.-W. Seo and K. Sycara, Text clustering for topic detection. ...
  • M. Liu and J. Qu, “Mining high utility itemsets without ...
  • H.-J. Choi and C. H. Park, “Emerging topic detection in ...
  • Z. Chen and B. Liu, “Topic modeling using topics from ...
  • Z. Chen and B. Liu, “Mining topics in documents: standing ...
  • D. Lee and H. S. Seung, “Algorithms for non-negative matrix ...
  • C. Févotte and J. Idier, “Algorithms for nonnegative matrix factorization ...
  • Z. Cao, S. Li, Y. Liu, W. Li, and H. ...
  • S. Terragni, E. Fersini, B. G. Galuzzi, P. Tropeano, and ...
  • H. Larochelle and S. Lauly, “A neural autoregressive topic model,” ...
  • H. Zhao, D. Phung, V. Huynh, Y. Jin, L. Du, ...
  • M. Grootendorst, “BERTopic: Neural topic modeling with a class-based TF-IDF ...
  • D. Angelov, “Top۲vec: Distributed representations of topics,” arXiv Prepr. arXiv۲۰۰۸.۰۹۴۷۰, ...
  • H. Rahimi, H. Naacke, C. Constantin, and B. Amann, “ANTM: ...
  • D. Q. Nguyen, R. Billingsley, L. Du, and M. Johnson, ...
  • Y. Liu, Z. Liu, T.-S. Chua, and M. Sun, “Topical ...
  • J. Qiang, P. Chen, T. Wang, and X. Wu, “Topic ...
  • M. Shi, J. Liu, D. Zhou, M. Tang, and B. ...
  • T. Mikolov, K. Chen, G. Corrado, and J. Dean, “Efficient ...
  • R. Das, M. Zaheer, and C. Dyer, “Gaussian LDA for ...
  • W. Gao, M. Peng, H. Wang, Y. Zhang, Q. Xie, ...
  • C. Li, H. Wang, Z. Zhang, A. Sun, and Z. ...
  • L. McInnes and J. Healy, “Accelerated hierarchical density based clustering,” ...
  • T. Joachims, “A probabilistic analysis of the Rocchio algorithm with ...
  • F. Bianchi, S. Terragni, and D. Hovy, “Pre-training is a ...
  • N. Reimers and I. Gurevych, “Sentence-bert: Sentence embeddings using siamese ...
  • A. Srivastava and C. Sutton, “Autoencoding variational inference for topic ...
  • N. Reimers and I. Gurevych, “Making monolingual sentence embeddings multilingual ...
  • N. Thakur, N. Reimers, J. Daxenberger, and I. Gurevych, “Augmented ...
  • M. Farahani, M. Gharachorloo, M. Farahani, and M. Manthouri, “Parsbert: ...
  • J. Devlin, M.-W. Chang, K. Lee, and K. Toutanova, “Bert: ...
  • T. Pires, “How multilingual is multilingual BERT,” arXiv Prepr. arXiv۱۹۰۶.۰۱۵۰۲, ...
  • D. P. Kingma, “Auto-encoding variational bayes,” arXiv Prepr. arXiv۱۳۱۲.۶۱۱۴, ۲۰۱۳ ...
  • Y. Zhang, R. Jin, and Z.-H. Zhou, “Understanding bag-of-words model: ...
  • Y. Miao, L. Yu, and P. Blunsom, “Neural variational inference ...
  • G. E. Hinton, “Training products of experts by minimizing contrastive ...
  • F. Bianchi, S. Terragni, D. Hovy, D. Nozza, and E. ...
  • M. Ranjbar-Khadivi, M.-R. Feizi-Derakhshi, A. Forouzandeh, P. Gholami, A.-R. Feizi-Derakhshi, ...
  • F. Nan, R. Ding, R. Nallapati, and B. Xiang, “Topic ...
  • D. Newman, J. H. Lau, K. Grieser, and T. Baldwin, ...
  • N. Aletras and M. Stevenson, “Evaluating topic coherence using distributional ...
  • G. Carbone and G. Sarti, “ETC-NLG: End-to-end topic-conditioned natural language ...
  • W. Webber, A. Moffat, and J. Zobel, “A similarity measure ...
  • S. Terragni, D. Nozza, E. Fersini, and M. Enza, “Which ...
  • K. Murakami, N. Itsubo, and K. Kuriyama, “Explaining the diverse ...
  • J. H. Lau, D. Newman, and T. Baldwin, “Machine reading ...
  • نمایش کامل مراجع