طراحی سیستم توصیه گر مقالات فارسی و انگلیسی به کمک مدل زبانی BERT با تمرکز بر چکیده مقاله، عنوان و کلمات کلیدی

  • سال انتشار: 1401
  • محل انتشار: فصلنامه دستاوردهای نوین در برق،کامپیوتر و فناوری، دوره: 2، شماره: 4
  • کد COI اختصاصی: JR_JNAECT-2-4_006
  • زبان مقاله: فارسی
  • تعداد مشاهده: 470
دانلود فایل این مقاله

نویسندگان

احسان ابراهیمی

دانشجوی کارشناسی ارشد هوش مصنوعی دانشگاه جامع امام حسین(ع)، تهران، ایران

محمدعلی جوادزاده

استادیار دانشگاه جامع امام حسین(ع)، تهران، ایران

علی امیری

پژوهشگر دانشگاه جامع امام حسین(ع)، تهران، ایران

چکیده

رشد سریع علوم مختلف در سال های اخیر، و رشد و فراگیر شدن شبکه جهانی اینترنت دو عاملی است که باعث شده تا روزانه در فضای اینترنت چندین هزار مقاله در رشته های مختلف انتشار یابد، و در دسترس همگان قرار گیرد. این مسئله چالش سربار اطلاعات را برای محققین به هنگام یافتن مقاله متناسب هدفشان به وجود آورده است. متخصصین علم هوش مصنوعی با توسعه سیستم های توصیه گر تا حد خوبی مشکل سربار اطلاعات را رفع کرده اند. اکثر پژوهش های ارائه شده در این حوزه برای زبان انگلیسی توسعه یافته، و تا کنون در زبان فارسی پژوهشی به منظور گسترش سامانه توصیه گر با هدف توصیه مقالات فارسی ارائه نشده است. هدف از این پژوهش ارائه تحقیقات پایه و توسعه سامانه توصیه گر مقالات فارسی است، تا نقطه شروعی برای سایر محققین و توسعه دهندگان باشد. در این پژوهش، پیشنهاد مقالات بر اساس شباهت معنایی عنوان، چکیده و کلمات کلیدی مقاله (با وزن دهی مناسب) با سوابق مطالعاتی کاربر است. پس از پیاده سازی و قرار گرفتن مدل به صورت آزمایشگاهی بر روی سرور داخلی دانشگاه بزرگمهر قاین، مدل توسط جمعی از دانشجویان کارشناسی نرم افزار کامپیوتر این دانشگاه مورد ارزیابی قرار گرفت، که در مجموع دقت سامانه ۷۹% ارزیابی شد.

کلیدواژه ها

سیستم های توصیه گر، مدل زبانی، BERT ، پردازش زبان طبیعی

اطلاعات بیشتر در مورد COI

COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.

کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.