CIVILICA We Respect the Science
(ناشر تخصصی کنفرانسهای کشور / شماره مجوز انتشارات از وزارت فرهنگ و ارشاد اسلامی: ۸۹۷۱)

تشخیص شایعه در شبکه های اجتماعی با استفاده از حداکثر آنتروپی و یادگیری عمیق

عنوان مقاله: تشخیص شایعه در شبکه های اجتماعی با استفاده از حداکثر آنتروپی و یادگیری عمیق
شناسه ملی مقاله: CEPS06_125
منتشر شده در ششمین کنفرانس ملی پژوهش های کاربردی در مهندسی کامپیوتر و فناوری اطلاعات در سال 1398
مشخصات نویسندگان مقاله:

صفورا سلیمانی - گروه مهندسی فناوری اطلاعات، موسسه آموزش عالی عقیق
محمد نادری دهکردی - گروه مهندسی کامپیوتر، استادیار دانشگاه آزاد اسلامی واحد نجف آباد
اکرم صدری کرمی - گروه مهندسی کامپیوتر، موسسه آموزش عالی عقیق

خلاصه مقاله:
امروزه اینترنت جدایی ناپذیر از زندگی بشر بودهاست. اگرچه از طریق اینترنت میتوان اطلاعات مفیدی بدستآورد، اما در دنیایی که جدا کردن حقیقت از باطل دشوار است، شایعه به آسانی گسترش مییابد. شایعات بیشتر در شبکه های اجتماعی مورد مطالعه قرار میگیرند؛ این امر به این دلیل است که اغلب شبکه های اجتماعی برای به اشتراک گذاشتن اطلاعات بین کاربران استفاده میشود و این اطلاعات میتواند نادرست یا نامعتبر باشد. بر این اساس تشخیص زودهنگام شایعه لازم و ضروری است. با توجه به عدم اطمینان به اطلاعات موجود در شبکه های اجتماعی، در سالهای اخیر متخصصین تصمیم به استفاده از تکنیک های هوشمند جهت تشخیص شایعات در این شبکه ها نموده اند. سیستم های هوشمند احتمال وقوع خطاها وهزینه ها را کاهش میدهند. به کارگیری دانش داده کاوی(متن کاوی) و الگوریتم های یادگیری ماشین در حوزه تشخیص شایعه از جمله شیوه های هوشمندی است که میتواند با تحلیل ویژگی های موثر، شایعات را زودتر و دقیق تر تشخیص دهد. یکی دیگر از روش های هوشمند استفاده از الگوریتمهای فراابتکاری برگرفته از طبیعت میباشد؛ این الگوریتم ها میتوانند در بهبود نتایج و پیشبینی دقیق تر موثر باشند. در مقایسه با الگوریتم های سنتی داده کاوی و روشهای دقیق، الگوریتم های فراابتکاری یک راه حل تقریبی را سریع تر پیدا میکنند و در مقایسه با الگوریتم های قطعی معمولا نتایج بهتری را ارائه میدهند. در این پژوهش روش ترکیبی مبتنی بر یادگیری عمیق و حداکثر انتروپی و دارای دو مرحله یادگیری می باشد. مرحله اول یادگیری در فاز انتخاب ویژگی با استفاده از PSO-SVM و مرحله دوم یادگیری در فاز مدلسازی انجام میگیرد. و همچنین برای انتخاب داده های نامتعادل شبکه های اجتماعی از روش Bootstrap استفاده شد. اجرای PSO بسیار ساده و آسان میباشد، با اینحال این الگوریتم مانند دیگر الگوریتم های فراابتکاری زمانی که ابعاد داده بزرگ میباشد، کارایی محاسباتی پایینی دارد. برای حل این مشکل از روش ماشین بردار پشتیبان استفاده شده است. ماشین بردار پشتیبان یکی از الگوریتم های طبقه بندی متعلق به سیستمهای یادگیری ماشین میباشد که از دقت بسیار بالایی برخوردار است. در این پژوهش، در فاز ارزیابی با استفاده از روش اعتبارسنجی متقابل K-fold، عملکرد روش پیشنهادی بر روی مجموعه داده PHEME با چهار معیار، Accuracy،Precision، Recall و F1، سنجیده میشود. Accuracy روش پیشنهادی 88/33%، Precision روش پیشنهادی 84/62% ، Recall روش پیشنهادی 94/08% وF1 روش پیشنهادی 89/1%، که نشان میدهد روش پیشنهادی نسبت به روشهای موجود دارای عملکرد بهتری است.

کلمات کلیدی:
شایعه، تشخیص شایعه، شبکه های اجتماعی،PSO-SVM،یادگیری عمیق، حداکثرانتروپی، متن کاوی،Bootstrap

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/1011680/