دسته بندی پرسمان ها در موتورهای جستجوی بزرگ برای ایجاد سیستم پیشنهاد دهنده اسناد

سال انتشار: 1391
محل انتشار: یازدهمین کنفرانس سراسری سیستم های هوشمند
کد COI اختصاصی: ICS11_034
زبان مقاله: فارسی
تعداد مشاهده: 814

نویسندگان

عضو هیات علمی دانشگاه آزاد اسلامی واحد سنندج

عضو هیات علمی دانشگاه خوارزمی

چکیده

انفجار اطلاعات در عصر ارتباطات مقوله بازیابی اطلاعات را به امری حیاتی تبدیل نموده است. جستجوها در داده ها روز به روز وسیع تر و گسترده تر می شود و بر پایه آن تعداد کاربران با نیازهای اطلاعاتی متنوع گسترش می یابد. چالش پیش روی سیستم های بازیابی اطلاعات در عصر حاضر مواجه شدن با این حجم از داده ها و ارضا کردن نیازهای اطلاعاتی کاربران با ارائه اطلاعاتی است که به بهترین نحو نیازهای آنان را براورده کند. موتورهای جستجوی کنونی امروزه بیشتر متکی به کلمات کلیدی وارد شده توسط کاربر هستند و تحلیلی مطابق با شناخت فضای کاربر و اطلاعات دیگر به دست آمده از کاربر را انجام نمی دهند. مجموعه ای از تکنیک ها و معیارها وجود دارد تا بتوان تحلیلی بر روی آرشیوهای پرسمان ها داشت و سپس تمایل به تغییرات و همچنین الگوهای موجود در سیلان پرسمان ها را شناسایی کرد که اینها اطلاعات ارزشمندی برای سرویس های جستجو فراهم می کنند تا بتوان یک دسته بندی موضوعی بر روی پرسمان ها ایجاد کرد. روش هایی برای دسته بندی دستی و همچنین دسته بندی اتوماتیک پرسمان ها معرفی می شوند. در ادامه برای استفاده از این گروه بندی برای دو گروه از کاربران(کاربران عام و کاربران ثبت نام شده) تحلیلی بر الگوهای رفتاری و اطلاعات زمینه آنها در محاوره با سرویس جستجو انجام می شود. بر پایه اطلاعاتی که از این دو گروه کاربران به دست می آید میزان تعلق پرسمان های آنها به هر کدامم از دسته بندی های موضوعی سنجیده شده و سپس یک مدل دسته بندی با استفاده از تحلیل ممیزی فازی که میزان تاثیر اطلاعات به دست آمده از تحلیل کاربران و تحلیل پرسمان ها بر تعلق آنها به گروه های موضوعی را مدل می کند، معرفی می کنیم تا بتوان میزان تعلق هر پرسمان را با توجه به ویژگی های پرسمان ها و همچنین کاربرانی که آن پرسمان ها را ارائه داده اند، محاسبه کنیم. در پایان سیستمی برای پیشنهاد اسناد و منابع اطلاعاتی به کاربران معرفی می شود که آنها را برای رسیدن سریع و صحیح به اطلاعات مورد نیازشان هدایت می کند. نتایج ارائه شده نشان می دهد که روش ارائه شده به طور موثری می تواند کاربران را مطابق با نیازهای اطلاعاتی او راهنمایی نماید و از این طریق کارایی و راندمان سرویس های جستجو بهبود می یابد

کلیدواژه ها

سیستم پیشنهاد دهنده اسناد، تحلیل موضوعی ارشیو وب، تحلیل ممیزی با رویکرد فازی، دسته بندی اتوماتیک پرسمان ها

مقالات مرتبط جدید

اطلاعات بیشتر در مورد COI

COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.

کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.