تشخیص شایعه در شبکه های اجتماعی با استفاده از حداکثر آنتروپی و یادگیری عمیق

سال انتشار: 1398
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 2,482

فایل این مقاله در 16 صفحه با فرمت PDF قابل دریافت می باشد

این مقاله در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

CEPS06_125

تاریخ نمایه سازی: 9 اردیبهشت 1399

چکیده مقاله:

امروزه اینترنت جدایی ناپذیر از زندگی بشر بودهاست. اگرچه از طریق اینترنت میتوان اطلاعات مفیدی بدستآورد، اما در دنیایی که جدا کردن حقیقت از باطل دشوار است، شایعه به آسانی گسترش مییابد. شایعات بیشتر در شبکه های اجتماعی مورد مطالعه قرار میگیرند؛ این امر به این دلیل است که اغلب شبکه های اجتماعی برای به اشتراک گذاشتن اطلاعات بین کاربران استفاده میشود و این اطلاعات میتواند نادرست یا نامعتبر باشد. بر این اساس تشخیص زودهنگام شایعه لازم و ضروری است. با توجه به عدم اطمینان به اطلاعات موجود در شبکه های اجتماعی، در سالهای اخیر متخصصین تصمیم به استفاده از تکنیک های هوشمند جهت تشخیص شایعات در این شبکه ها نموده اند. سیستم های هوشمند احتمال وقوع خطاها وهزینه ها را کاهش میدهند. به کارگیری دانش داده کاوی(متن کاوی) و الگوریتم های یادگیری ماشین در حوزه تشخیص شایعه از جمله شیوه های هوشمندی است که میتواند با تحلیل ویژگی های موثر، شایعات را زودتر و دقیق تر تشخیص دهد. یکی دیگر از روش های هوشمند استفاده از الگوریتمهای فراابتکاری برگرفته از طبیعت میباشد؛ این الگوریتم ها میتوانند در بهبود نتایج و پیشبینی دقیق تر موثر باشند. در مقایسه با الگوریتم های سنتی داده کاوی و روشهای دقیق، الگوریتم های فراابتکاری یک راه حل تقریبی را سریع تر پیدا میکنند و در مقایسه با الگوریتم های قطعی معمولا نتایج بهتری را ارائه میدهند. در این پژوهش روش ترکیبی مبتنی بر یادگیری عمیق و حداکثر انتروپی و دارای دو مرحله یادگیری می باشد. مرحله اول یادگیری در فاز انتخاب ویژگی با استفاده از PSO-SVM و مرحله دوم یادگیری در فاز مدلسازی انجام میگیرد. و همچنین برای انتخاب داده های نامتعادل شبکه های اجتماعی از روش Bootstrap استفاده شد. اجرای PSO بسیار ساده و آسان میباشد، با اینحال این الگوریتم مانند دیگر الگوریتم های فراابتکاری زمانی که ابعاد داده بزرگ میباشد، کارایی محاسباتی پایینی دارد. برای حل این مشکل از روش ماشین بردار پشتیبان استفاده شده است. ماشین بردار پشتیبان یکی از الگوریتم های طبقه بندی متعلق به سیستمهای یادگیری ماشین میباشد که از دقت بسیار بالایی برخوردار است. در این پژوهش، در فاز ارزیابی با استفاده از روش اعتبارسنجی متقابل K-fold، عملکرد روش پیشنهادی بر روی مجموعه داده PHEME با چهار معیار، Accuracy،Precision، Recall و F1، سنجیده میشود. Accuracy روش پیشنهادی 88/33%، Precision روش پیشنهادی 84/62% ، Recall روش پیشنهادی 94/08% وF1 روش پیشنهادی 89/1%، که نشان میدهد روش پیشنهادی نسبت به روشهای موجود دارای عملکرد بهتری است.

نویسندگان

صفورا سلیمانی

گروه مهندسی فناوری اطلاعات، موسسه آموزش عالی عقیق

محمد نادری دهکردی

گروه مهندسی کامپیوتر، استادیار دانشگاه آزاد اسلامی واحد نجف آباد

اکرم صدری کرمی

گروه مهندسی کامپیوتر، موسسه آموزش عالی عقیق