پیش بینی و اعتبارسنجی تعامل های پروتئین پروتئین در گلبول های قرمز خون براساس زنجیره های جانبی آمینو اسیدی در ساختار اولیه پروتئین

سال انتشار: 1391
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 804

نسخه کامل این مقاله ارائه نشده است و در دسترس نمی باشد

این مقاله در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

IBIS04_035

تاریخ نمایه سازی: 14 شهریور 1393

چکیده مقاله:

با پیشرفت علم و شناخت ژنوم کامل انسان، توجه محققان به بررسی بافت های مختلف انسانی و بیماری های وابسته به آن معطوف شده است. در این راستا اطلاعات تعامل های پروتئین پروتئین به عنوان فاکتور اصلی در شناخت بیماری ها می باشد که لازم است این اطلاعات دقیق و قابل اعتماد باشند. مهم ترین مرحله در شناخت بیماری ها براساس اطلاعات تعامل های پروتئین پروتئین، داشتن روش مطمئن برای پیش بینی این تعامل ها و اعتبار سنجی آنها است. روش های یادگیری ماشین با انتخاب ویژگی های مناسب مربوط به پروتئین ها بدین منظور کارامد می باشند.در این مطالعه به بررسی روش های یادگیری ماشین با استفاده از مدل ویژگی کلمات سه جزئی متحد که بر پایه اطلاعات زنجیره های جانبی آمینو اسید ها می باشد می پردازیم و بدین ترتیب تعاملهای پروتئین پروتئین را به دو کلاس مثبت و منفی کلاس بندی می کنیم. چهار روش مورد استفاده برای کلاس بندی تعامل های پروتئین پروتئین شامل: ماشین بردار پشتیبان، جنگل های تصادفی، شبکه های بیزی و شبکه عصبی مصنوعی می باشند .20 آمینو اسید موجود بر اساس ویژگی های آلی زنجیرههای جانبی آنها به 7 گروه تقسیم می شوند. مجموعه ی داده های محک (مثبت و منفی)، تعامل های بافت گلبول های قرمز خون در نظر گرفته شده است که مجموعه ی مثبت از دیتابیس های MIPS، HPRD ... و مجموعه ی منفی به صورت تصادفی از تعامل های ممکن انتخاب شده است.نتایج نشان می دهدکه عملکرد جنگل های تصادفی از سایر روش های مورد استفاده با ویژگی ذکر شده بهتر بوده است و میانگین دقت این روش برای 100 مجموعه داده که به صورت تصادفی از میان مجموعه های منفی انتخاب شده است %80 می باشد. دقت روش های دیگر به طور میانگین %77 است.دقت پیش بینی مستقل ازاندازه ی مجموعه داده های مثبت و منفی است. اگر چه استفاده از دیتابیس های معتبر با چندین مرجع مختلف مانند HPRD وMIPS نقش مهمی در بالابردن دقت روش بر عهده دارند، اما ویژگی های مورد استفاده نیز تعیین کننده می باشند که باید این ویژگی ها معرف تعامل های بین پروتئین های درگیرباشند. در نتیجه در مسأله کلاس بندی، انتخاب ویژگی مورد استفاده و روش یادگیری بسیار مهم است.روش جنگل های تصادفی با استفاده از ویژگی های مربوط به خواص آلی زنجیره های جانبی آمینو اسیدی انتخاب مناسبی بوده است.

کلیدواژه ها:

تعامل های پروتئین پروتئین ، روش های یادگیری ماشین ، زنجیره های جانبی آمینو اسید

نویسندگان

افسانه معالی

دانشگاه فردوسی مشهد- دانشکده مهندسی- گروه مهندسی شیمی