بررسی روش های کشف و مقایسه الگوهای پرس و جو های مکرر در اسناد XML

فاطمه دورانی; محمدجواد کارگر

بررسی روش های کشف و مقایسه الگوهای پرس و جو های مکرر در اسناد XML

محل انتشار: اولین همایش چشم انداز تکنولوژی کامپیوتر و شبکه در ۲۰۳۰

سال انتشار: 1394

نوع سند: مقاله کنفرانسی

زبان: فارسی

مشاهده: 564

فایل این مقاله در 15 صفحه با فرمت PDF قابل دریافت می باشد

دریافت فایل کامل مقاله

صدور گواهی نمایه سازی
من نویسنده این مقاله هستم

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

https://civilica.com/doc/554275

شناسه ملی سند علمی:

MAYCOMP01_063

تاریخ نمایه سازی: 5 بهمن 1395

چکیده مقاله:

کشف الگوهای پنهان و ارزشمند از درون حجم وسیعی از داده های خام، اخیراً توجه بسیاری از محققان را به خود جلب کرده است. اغلب روش های کاوش قوانین انجمنی در مرحله اول کار خود کلیه اقلام پرتکرار را از بین تمام اقلام موجود در داده ها جستجو می کنند که این امر نیازمند خواندن مکرر کل داده ها از حافظه است. بنیان اصلی پردازش و بهینه سازی الگوهای مکرر پرس و جوهای XML بر مبنای ساختار درختی آن بنا شده است و این بدان معنی است که ساختار و محتوا در این سندها در کنار یکدیگر هستند. با افزایش چشمگیر اسناد XML اهمیت پردازش بهبود پرس و جوهای XML بیشتر به چشم می خورد. الگوریتم های زیادی برای کشف قوانین انجمنی تاکنون ارائه شده اند. بخش عمده و نسبتا زمانگیر در اکثر الگوریتم های موجود از جمله سه روش مد نظر در این پروژه (TOP-K , FP-Growth , Apriori)، جستجوی اقلام پر تکرار است. برای بهینه سازی این فرایند الگوریتم های پیشنهاد شده رویکردهای متفاوتی دارند. تلاش بسیاری از روشها بر کاهش تعداد دفعات مراجعه به حافظه جهت خواندن داده ها است .برای این منظور، بعضی روش ها با یافتن راه های مستقیم جهت به دست آوردن پشتیبانی بعضی از اقلام، از مراجعات بیهوده به حافظه خودداری می کنند. از کاراترین روشهای موجود، روش های Apriori و FP-Growth و TOP-K می باشد. در این مقاله سعی بر این شده تا با بررسی سه روش کشف الگوهای پرسوجوی مکرر، آنها را از لحاظ سه معیار اصلی سرعت، حافظه و زمان اجرا بررسی نماییم و یک مقایسه کلی درباره الگوهای پرسوجوی مکرر مطرح شده در اسناد XML داشته باشیم. نتایج حاصل از تحقیق نشان می دهد که الگوریتم Top-k در اکثر موارد بسته به پیمایش نسبت به دو الگوریتم دیگر از لحاظ معیارهای ذکر شده عملکرد بهتری دارد.

کلیدواژه ها:

اسناد XML ، قواعد انجمنی ، الگوهای پرتکرار

نویسندگان

فاطمه دورانی

دانشجوی کارشناسی ارشد گروه کامپیوتر، واحد میبد، دانشگاه های آزاد اسلامی، میبد ، ایران

محمدجواد کارگر

عضو هیأت علمی گروه کامپیوتر، واحد میبد، دانشگاه های آزاد اسلامی ، میبد، ایران

مراجع و منابع این مقاله:

لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :

Chang, Tsui-Ping, Chen, Shih-Ying, 2012, ...
Information Technology, 452-458. ...
Deshpande, Leena A, Prasad, R.S, 2013. Efficient Frequent Patter Mining ...
Li, Guoliang, Feng, Jianhua, Wang, 2009 ...
Ley. C. DBLP Computer Science Biblography, ...
mohammad, 2013, An analytical review of XML association rule mining ...
_ Mohammed mohsin, ali, 2013, mining frequent structural pattern from ...
ping Chang, shih, 2010, ...
Pyun , Gwang bum, Yun, Unil, 2014, Mining top-k frequent ...
sug gu, mi, Hee hwang .geon, Ho ryo, keun, 2007, ...
wei Li, Chao, Fang Jea, Kuen, Ping Lin, Ru, Fan, ...
Yang, L. H., M. L. Lee, et a, .2003 , ...
Yun, Unil, Shin, Hyeonil, Ho Ryu, , Keun, 2012, An ...
Yun, Unil, Ryu, Keun Ho, 2011, weighted ...

نمایش کامل مراجع