تشخیص موضوع داده های شبکه اجتماعی توییتر با استفاده از گراف دوبخشی ناهمگن و آنتروپی

سال انتشار: 1399
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 662

فایل این مقاله در 10 صفحه با فرمت PDF قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

CEITCONF04_010

تاریخ نمایه سازی: 13 تیر 1400

چکیده مقاله:

امروزه، با توسعه روز افزون فناوری اطلاعات و استفاده گسترده از آن، اینترنت به عنوان یک حامل اطلاعات، به تدریج جایگزین رسانه های سنتی مانند روزنامه و تلویزیون شده است. توییتر به عنوان یک شبکه ی اجتماعی سهم فراوانی از داده های تولید شده در اینترنت را دارد. به طور متوسط در هر روز ۵۰۰ میلیون پیام (توییت) توسط مردم ارسال میشود. توییت ها شامل گزارشاتی از داستان های روزمره زندگی گرفته تا آخرین اخبار و رویدادهای جهان به ما می دهد. شناسایی موضوعات مورد بحث کاربران در زمینه های بسیاری مانند هشدار بلایای طبیعی، ارزیابی افکار کاربران و پیش بینی ترافیک داده ای می تواند مورد استفاده قرار بگیرد. در این مقاله، ما برای تشخیص موضوع هر توییت، یک روش بر پایه ی گراف دوبخشی ناهمگن ارائه می کنیم. در این روش پس از خوشه بندی استاد با روش انتشار بر چسب در گراف با استفاده از معیار معرفی شده بر پایه آنتروپی، سعی می کنیم کلیدواژه هایی را به عنوان نماینده هر موضوع برگزینیم که تمایز بین خوشه ها را نیز به خوبی نشان دهد. ما عملکرد روش ارائه شده را در سه مجموعه داده متفاوت با روش های پیشین مقایسه می کنیم. با مقایسه عملکرد روش ارائه شده در این مقاله پی می بریم که در استاد با طول کوتاه روش ما می تواند دقتی بهتر از روش های شناخته شده ی اLS و LDA ارائه کند.

نویسندگان

محمد نظری

دانشجوی کارشناسی ارشد نرم افزاردانشگاه علم و صنعت ایران،

محمد آقاجانی

دانشجوی کارشناسی ارشد نرم افزار دانشگاه علم و صنعت ایران،

عین اله خنجری میانه

دکترای تخصصی نرم افزار و عضو هیات علمی دانشگاه علم و صنعت ایران،