الگوریتمی برای داده کاوی سریع و کارآمد متن به منظور ایجاد اتوماتیک پایگاه داده حاوی اطلاعات سینتیک آنزیم ها

سال انتشار: 1400
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 171

فایل این مقاله در 17 صفحه با فرمت PDF قابل دریافت می باشد

این مقاله در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

CECCONF14_042

تاریخ نمایه سازی: 27 بهمن 1400

چکیده مقاله:

پیش زمینه: مقدار اطلاعات بیولوژیکی در دسترس به سرعت رو به افزایش بوده و تمرکز تحقیقات بیولوژیکی از بخش های مجزا به سمت شبکه ها و حتی پروژه های بزرگتر کشانده شده که هدف آن ها تجزیه و تحلیل، مدلسازی و شبیه سازی شبکه های بیولوژیکی و همچنین مقایسه در سطح بالای ویژگی های سلولی می باشد. بنابراین ضروری است تا اطلاعات بیولوژیکی به آسانی در دسترس باشد. به هر حال، بیشتر اطلاعات در تحقیقات انجام شده به صورت غیرساختاری بوده و به این خاطر روش هایی برای استخراج نظامند اطلاعات، مستقیما از تحقیقات اولیه می بایست توسعه یابد. شرح مطلب: در اینجا ما الگوریتم داده کاوی را برای استخراج اطلاعات سینتیک همانند و غیره و همچنین اطلاعات مربوطه همانند نام آنزیم ها، تعداد EC، لیگاندها، ارگانیسم ها، مناطق، PH و دما نشان می دهیم. با استفاده از این قوانین و رویکرد بر پایه واژه نامه، این امکان وجود دارد تا به اندازه ۵۱۴۳۹۴ پارامتر سینتیک ۱۳ دسته ( فعالیت های خاص، ) از حدود ۱۷ میلیون مطالب نتتشر شده، استخراج کرده و آن ها را با داده های دیگر خلاصه مطالب دیگر ترکیب کنیم. تایید دستی تقریبا ۱۰۰۰ نتایج انتخاب شده تصادفی، موارد فراخوانی شده بین ۵۱% و ۸۴% و محدوده دقیق ۵۵% تا ۹۶% را نشان داده که بستگی به فهرست های جستجو شده دارد. نتایج در پایگاه داده ذخیره شده و توسط KID" یا پایگاه داده سینتیک" از طریق اینترنت در دسترس می باشد. نتیجه گیری: الگوریتم نشان داده شده، اطلاعات مهمی را ارائه می دهد و کمکی به شتاب بخشیدن تحقیقات و تجزیه و تحلیل مورد نیاز برای روش های بیولوژی سیستم های امروزی می باشد. پایگاه های داده حاصل شده از تجزیه و تحلیل چکیده مقاله های منتشر شده می تواند کمک ارزشمندی در حوزه جنبش های بیولوژیکی و شیمیایی باشد. این فرایند کاملا بر مبنای داده کاوی و همچنین تکمیل پایگاه داده ایجاد شده می باشد. این پایگاه داده از سایت http://kid.tu-bs.de در دسترس است. کد مبدا الگوریتم تحت مجوز مجوز دولتی GNU ایجاد شده و بنا به درخواست محققان در دسترس قرار می گیرد.

کلیدواژه ها:

الگوریتم ، داده کاوی ، پایگاه داده ، اطلاعات سینتیک آنزیم ها

نویسندگان

اسماعیل جهانگشته

استاد دانشگاه آزاد اسلامی واحد ایرانشهر

اصغر قادری

استاد دانشگاه آزاد اسلامی واحد ایرانشهر

آسیه جمشیدزهی

دانشجوی رشته نرم افزار کامپیوتر، دانشگاه آزاد اسلامی واحد ایرانشهر