استخراج عملکرد محل از محتواهای متنی کاربرتولید با استفاده از روش های یادگیری ماشین
عنوان مقاله: استخراج عملکرد محل از محتواهای متنی کاربرتولید با استفاده از روش های یادگیری ماشین
شناسه ملی مقاله: JR_SEPEHR-31-124_001
منتشر شده در در سال 1401
شناسه ملی مقاله: JR_SEPEHR-31-124_001
منتشر شده در در سال 1401
مشخصات نویسندگان مقاله:
مینا کریمی - دانشجوی دکتری، گروه مهندسی سیستم اطلاعات مکانی، دانشکده مهندسی نقشه برداری، دانشگاه صنعتی خواجه نصیرالدین طوسی، تهران، ایران.
محمدسعدی مسگری - استادیار، گروه مهندسی سیستم اطلاعات مکانی،دانشکده مهندسی نقشه برداری - دانشگاه صنعتی خواجه نصیرالدین طوسی، تهران، ایران.
خلاصه مقاله:
مینا کریمی - دانشجوی دکتری، گروه مهندسی سیستم اطلاعات مکانی، دانشکده مهندسی نقشه برداری، دانشگاه صنعتی خواجه نصیرالدین طوسی، تهران، ایران.
محمدسعدی مسگری - استادیار، گروه مهندسی سیستم اطلاعات مکانی،دانشکده مهندسی نقشه برداری - دانشگاه صنعتی خواجه نصیرالدین طوسی، تهران، ایران.
امروزه با افزایش روز افزون استفاده کاربران از شبکه های اجتماعی، اطلاعات مکانی مردم گستر رشد چشمگیری داشته است. از میان انواع اطلاعات، محتواهای متنی کاربرتولید غالبا در ساختار مشخصی به اشتراک گذاشته نمی شوند. یکی از ویژگی های عمده این نوع اطلاعات محل مبنا بودن آنها است.محل های مورد گفتگوی بشر معمولا همراه با ابهام و وابسته به بافت است. عملکرد محل یا به عبارتی عمده فعالیت هایی که افراد در یک محل انجام می دهند، به عنوان یک بافت در توصیفات محل، ازجمله ویژگی های عمده و متمایزکننده محل است. هدف این تحقیق استخراج عملکرد محل با استفاده از تحلیل محتواهای متنی کاربرتولید به اشتراک گذاشته شده توسط کاربران است. به این منظور ابتدا محل ها و نظرات کاربران در مورد محل ها در وبگاه TripAdvisorبه عنوان محتواهای متنی، جمع آوری شده، سپس از روش های مختلف پردازش زبان طبیعی به منظور آماده سازی و پیش پردازش داده ها استفاده می شود. در ادامه برای هر دیدگاه کاربر یک مجموعه واژگان با استفاده از مقادیر TF-IDFبه عنوان مقادیر بردار ویژگی ساخته می شود. سپس در یک روش نظارت شده این مقادیر به همراه عملکرد محل هابه عنوان ورودی به یک طبقه بندی کننده لجستیک رگرسیون به منظور آموزش مدل داده شده و با استفاده از آن عملکرد محل بر روی داده های آزمایشی پیش بینی شده است. نتایج ارزیابی روش از طریق محاسبه ماتریس درهم ریختگی نشان می دهد، صحت کلی روش پیشنهادی در حدود ۹۶درصد است که رقم قابل توجهی است. همچنین بیشترین دقت و امتیاز F۱ برای محل های سرو خوراکی است، درحالی که اقامتگاه ها به دلیل شباهت عملکردی به هتل ها کمترین دقت و امتیاز F۱را دارند ولی با این وجود نتایج آنها نیز قابل اطمینان و رضایت بخش است.
کلمات کلیدی: محل, عملکرد محل, محتواهای کاربرتولید, پردازش زبان طبیعی, یادگیری ماشین, متن
صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/1634008/