نقش الگوریتم سنجش شباهت های معنایی کلمه در وب برای بهبود کارآیی و سرعت بخشیدن به عملکرد موتور جستجو
- سال انتشار: 1392
- محل انتشار: اولین کنفرانس ملی نوآوری در مهندسی کامپیوتر و فنآوری اطلاعات
- کد COI اختصاصی: CEIT01_426
- زبان مقاله: فارسی
- تعداد مشاهده: 1016
نویسندگان
دانشجوی کارشناسی ارد نرم افزار، علوم و تحقیقات گیلان
چکیده
سنجش تشابه معنایی کلمات در وب، از اقدامات مهمی است که امروزه برای سرعت بخشیدن به فعالیت های کاربران از سوی محقق ها مورد بررسی قرار می گیرند. با وجود فواید زیادی که این فعالیت به همراه دارد، اما دقت در سنجش تشابه معنایی کلمه ها همچنان اقدامی چالش انگیز است. اخیراً الگوریتم ها ی گوناگونی در این زمینه در نظر گرفته شده که در این مقاله الگوریتم های برآورد تشابه معنایی، براساس دو شیوه شمارش صفحه و قطعه بندی متن، محاسبه شده و کلمه های مختلف به طور خاص با استفاده از معیار رخداد مشترک شمارش صفحه، تعریف می شوند، سپس الگوهای واژگانی قطعه بندی متن استخراج شده یکپارچه سازی می شود، سپس برای شناسایی روابط متعدد معنایی بین دو کلمه با توجه به الگوریتم استخراج الگوی متن و الگوی الگوریتم بهینه خوشه بندی ترکیبی براساس شمارش صفحه مبتنی بر رخداد مشترک ظاهر می شود و الگوی خوشه بندی واژگان حاصل شده توسط ماشین های بردار پشتیبانی حمایت می شود. نتایج مختلف و روش های مبتنی بر معیارهای شباهت معنایی وب در گذشته، در سه مجموعه داده معیار با همبستگی بالا، براساس امتیازهای کاربران نشان داده شده است، بطور قابل توجهی دقت و صحت در جستجو را بهبود می دهد.کلیدواژه ها
سنجش تشابه معنایی، وب کاوی، استخراج اطلاعات، تحلیل وب متنیمقالات مرتبط جدید
اطلاعات بیشتر در مورد COI
COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.
کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.