بهبود پیش بینی علاقه کاربران در کلان داده توییتر با استفاده از طبقه بند تجمعی

  • سال انتشار: 1403
  • محل انتشار: فصلنامه رسانه، دوره: 35، شماره: 2
  • کد COI اختصاصی: JR_RSNE-35-2_005
  • زبان مقاله: فارسی
  • تعداد مشاهده: 124
دانلود فایل این مقاله

نویسندگان

محمد چاکرالحسینی فیروزآباد

دانشجوی دکتری مهندسی کامپیوتر، دانشکده فنی و مهندسی، دانشگاه آزاد اسلامی، واحد نیشابور، نیشابور، ایران

رضا قائمی

استادیار گروه مهندسی کامپیوتر، دانشکده فنی و مهندسی، دانشگاه آزاد اسلامی(نویسنده مسئول)، واحد قوچان، قوچان، ایران

چکیده

در دنیای امروزی، شبکه های اجتماعی که بخشی از زندگی روزمره انسان ها شده اند، از جمله توییتر، تلگرام، اینستاگرام و غیره، روز به روز در حال افزایش و گسترش هستند. لذا تعداد کاربران آن ها نیز در حال افزایش است و در نتیجه، حجم داده زیادی در این شبکه ها در حال تبادل و ذخیره سازی است که این حجم عظیم داده، شبکه های اجتماعی به خصوص توییتر را تبدیل به کلان داده کرده است. مدیریت، سامان دهی و هرس کردن این کلان داده ها و همچنین، پیش بینی رفتار کاربران شبکه های اجتماعی امری بسیار مهم است. یکی از روش های مهم و تاثیرگذار برای پیش بینی علاقه کاربر در شبکه های اجتماعی، تکنیک های طبقه بندی است که در اغلب کاربردها و پژوهش های موجود در پیشینه تحقیق، هنوز در معیارهایی مانند دقت و صحت پیش بینی ضعف دارند. در این مقاله، به منظور پیش بینی علاقه کاربر در شبکه های اجتماعی توییتر، از روش طبقه بندی تجمعی مبتنی بر رای گیری که دارای دو گام اساسی است، استفاده شده است. در گام نخست، با بهره گیری از الگوریتم های طبقه بندی پایه ای شامل نزدیک ترین همسایه، درخت تصمیم، جنگل تصادفی و بیزین ساده، خروجی های هر طبقه بندی حاصل می شوند. در گام دوم، خروجی نهایی طبقه بندی تجمعی با استفاده از روش رای گیری محاسبه می شود. نتایج آزمایش ها بر روی مجموعه کلان داده های شبکه اجتماعی توییتر و براساس معیارهای دقت، صحت و پوشش، استدلال بر این دارد که روش پیشنهادی طبقه بندی تجمعی مبتنی بر رای گیری، نتایج مطلوب تری را نسبت به الگوریتم های دیگر داشته است.

کلیدواژه ها

کلان داده, شبکه اجتماعی, پیش بینی علاقه کاربر, طبقه بندی تجمعی, توییتر

اطلاعات بیشتر در مورد COI

COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.

کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.