کشف زیرگرافهای متصل وب با استفاده از اتوماتای یادگیر توزیع شده

  • سال انتشار: 1388
  • محل انتشار: سومین کنفرانس داده کاوی
  • کد COI اختصاصی: IDMC03_122
  • زبان مقاله: فارسی
  • تعداد مشاهده: 2841
دانلود فایل این مقاله

نویسندگان

راهبه مجتهدی صفار

عضو هیئت علمی دانشگاه آزاد اسلامی واحدلاهیجان دانشکده برق و کامپیوت

محمدرضا میبدی

عضو هیئت علمی دانشگاه صنعتی امیرکبیر

چکیده

استفاده از تکنیکهای داده کاوی به منظور استخراج اتوماتیک اطلاعات از اسناد وب را کاوش وب می گویند یک مساله بنیادین در زمینه کاوش وب کشف زیرگرافهای متصل اطلاعاتی وب براساس درخواست کاربر می باشد مساله کشف زیر گرافهای متصل وب خصوصا در مواردی که کاربر الگوریتم های کاوش وب را برروی تنها بخشی از گراف وب اجرا می کند موثر است و منجر به هدایت بهتر کاربر در امر جستجو پیشنهاد اسناد مشابه با یک سند براساس علاقه کاربر می گردد دراین مقاله از اتوماتای یادگیر توزیع شده برای حل مساله کشف زیرگرافهای متصل وب استفاده می شود برای این منظور در ابتدا یک الگوریتم مبتنی بر اتوماتای یادگیر توزیع شده برای تعیین ساختار ارتباطی بین اسناد وب پیشنهاد می گردد الگوریتم پیشنهادی کشف ساختار در مقایسه با روشهای موجود دارای کارایی بالاتر می باشد در مرحله بعد با استفاده از ساختار ارتباطی حاصل و روش خوشه بندی kmeans یک الگوریتم جدید برای کشف زیر گرافهای متصل وب ارائه می گردد الگوریتم پیشنهادی کشف زیر گراف متصل تنها برروی خوشه هایی که اسناد مورد درخواست کاربر را شامل می شوند اجرا می گردد بنابراین در مقایسه با روشهای موجود دارا ی سرعت بالاتر می باشد.

کلیدواژه ها

کشف زیرگراف متصل، اتوماتای یادگیر، اتوماتای یادگیر توزیع شده، خوشه بندی kmeans، درجه ارزش

اطلاعات بیشتر در مورد COI

COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.

کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.