چگونه یادگیری ماشینی می‌تواند راه‌حل‌های چالش‌های طراحی پروتئین را تسریع کند — ScienceDaily

داپاراس توضیح داد: «نرم‌افزاری برای پیش‌بینی ساختارهای پروتئینی بخشی از راه‌حل است، اما نمی‌تواند به تنهایی چیز جدیدی ارائه دهد.

بودجه توسط پروژه جسورانه در موسسه طراحی پروتئین تامین شد. مایکروسافت؛ اریک و وندی اشمیت به توصیه شرکت های آتی اشمیت. پروژه کشف و طراحی هم افزایی دارپا (قرارداد HR001117S0003 FA8750-17-C-0219)؛ پروژه مهار فعالیت آنزیمی دارپا برای نجات جان (قرارداد HR001120S0052 HR0011-21-2-0012)؛ بنیاد تحقیقات واشنگتن؛ پروژه باز بشردوستانه بهبود صندوق طراحی پروتئین؛ Amgen; کمک مالی برنامه بنیاد آلفرد پی اسلون (G-2021-16899)؛ موقوفه دونالد و جو آن پترسن برای تسریع پیشرفت در تحقیقات بیماری آلزایمر. کمک هزینه تحصیلی بین رشته‌ای برنامه علوم مرزی انسانی (LT000395/2020-C)؛ سازمان زیست شناسی مولکولی اروپا (ALTF 139-2018)، از جمله بورسیه تحصیلی EMBO Non-Stipendiary (ALTF 1047-2019) و بورسیه بلند مدت EMBO (ALTF 191-2021). بنیاد “لا کایکسا”؛ موسسه پزشکی هوارد هیوز، از جمله کمک هزینه تحصیلی هانا گری (GT11817)؛ بنیاد ملی علوم (MCB 2032259، CHE-1629214، DBI 1937533، DGE-2140004)؛ مؤسسه ملی بهداشت (DP5OD026389)؛ موسسه ملی آلرژی و بیماری های عفونی (HHSN272201700059C)؛ موسسه ملی پیری (5U19AG065156)؛ موسسه ملی علوم پزشکی عمومی (P30 GM124169-01، P41 GM 103533-24)؛ موسسه ملی سرطان (R01CA240339)؛ بنیاد ملی علوم سوئیس؛ مرکز ملی صلاحیت مهندسی سیستم های مولکولی سوئیس. مرکز ملی صلاحیت در زیست شناسی شیمیایی سوئیس. و شورای تحقیقات اروپا (716058).



منبع

سوم، تیم از AlphaFold، ابزاری که توسط DeepMind Alphabet توسعه داده شده است، استفاده کرد تا به طور مستقل ارزیابی کند که آیا توالی‌های اسید آمینه‌ای که به دست آورده‌اند احتمالاً به شکل‌های مورد نظر تا می‌شوند یا خیر.

منابع کامپیوتری برای این کار توسط مایکروسافت و خدمات وب آمازون اهدا شد.

در مقاله‌های جدید، زیست‌شناسان دانشکده پزشکی دانشگاه واشنگتن نشان می‌دهند که یادگیری ماشینی می‌تواند برای ایجاد مولکول‌های پروتئین بسیار دقیق‌تر و سریع‌تر از آنچه قبلا ممکن بود استفاده شود. دانشمندان امیدوارند این پیشرفت به بسیاری از واکسن‌ها، درمان‌ها، ابزارهای جذب کربن و مواد زیستی پایدار منجر شود.

“پروتئین ها در سراسر زیست شناسی اساسی هستند، اما ما می دانیم که تمام پروتئین های موجود در هر گیاه، حیوان و میکروب بسیار کمتر از یک درصد از آنچه ممکن است را تشکیل می دهند. با این ابزارهای نرم افزاری جدید، محققان باید بتوانند راه حل هایی برای مدت طولانی پیدا کنند. دیوید بیکر، نویسنده ارشد، استاد بیوشیمی در دانشکده پزشکی دانشگاه واشنگتن و دریافت کننده جایزه پیشرفت در علوم زیستی در سال 2021، گفت: چالش های پایدار در پزشکی، انرژی و فناوری.

در مقاله دیگری که در علوم پایه در 15 سپتامبر، تیمی از آزمایشگاه بیکر تأیید کردند که ترکیب ابزارهای یادگیری ماشینی جدید می تواند به طور قابل اعتمادی پروتئین های جدیدی تولید کند که در آزمایشگاه کار می کنند.

بیکر گفت: “این همان آغاز یادگیری ماشینی در طراحی پروتئین است. در ماه های آینده، ما برای بهبود این ابزارها برای ایجاد پروتئین های پویاتر و کاربردی تر کار خواهیم کرد.”

بیکر افزود: «ProteinMPNN طراحی پروتئین همان چیزی است که AlphaFold برای پیش‌بینی ساختار پروتئین بود».

دوم، برای سرعت بخشیدن به این فرآیند، تیم یک الگوریتم جدید برای تولید توالی اسید آمینه ابداع کرد. شرح داده شده در شماره 15 سپتامبر علوم پایه، این ابزار نرم افزاری به نام ProteinMPNN در حدود یک ثانیه اجرا می شود. این بیش از 200 برابر سریعتر از بهترین نرم افزار قبلی است. نتایج آن نسبت به ابزارهای قبلی برتری دارد و نرم افزار برای اجرا نیازی به سفارشی سازی متخصص ندارد.

برای فراتر رفتن از پروتئین های موجود در طبیعت، اعضای تیم بیکر چالش طراحی پروتئین را به سه بخش تقسیم کردند و برای هر کدام از راه حل های نرم افزاری جدید استفاده کردند.

Basile Wicky، دانشمند پروژه، محقق فوق دکترا در موسسه طراحی پروتئین، گفت: “ما دریافتیم که پروتئین های ساخته شده با استفاده از ProteinMPNN بسیار بیشتر احتمال دارد که مطابق با هدف جمع شوند، و ما می توانیم مجموعه های پروتئینی بسیار پیچیده ای را با استفاده از این روش ها ایجاد کنیم.”

طی دو سال گذشته، یادگیری ماشینی پیش بینی ساختار پروتئین را متحول کرده است. اکنون، سه مقاله وارد شده است علوم پایه انقلاب مشابهی را در طراحی پروتئین توصیف کنید.

در میان پروتئین‌های جدید ساخته شده، حلقه‌هایی در مقیاس نانو وجود داشت که محققان معتقدند می‌توانند به قطعاتی برای نانوماشین‌های سفارشی تبدیل شوند. برای مشاهده این حلقه‌ها از میکروسکوپ‌های الکترونی استفاده شد که قطری تقریباً یک میلیارد برابر کوچک‌تر از یک دانه خشخاش دارند.

پروتئین ها اغلب به عنوان “بلوک های سازنده زندگی” شناخته می شوند زیرا برای ساختار و عملکرد همه موجودات زنده ضروری هستند. آنها تقریباً در هر فرآیندی که در داخل سلول اتفاق می افتد، از جمله رشد، تقسیم و ترمیم نقش دارند. پروتئین ها از زنجیره های بلندی از مواد شیمیایی به نام اسیدهای آمینه تشکیل شده اند. توالی اسیدهای آمینه در یک پروتئین شکل سه بعدی آن را تعیین می کند. این شکل پیچیده برای عملکرد پروتئین بسیار مهم است.

اخیراً الگوریتم‌های قدرتمند یادگیری ماشینی از جمله AlphaFold و RoseTTAFold برای پیش‌بینی اشکال دقیق پروتئین‌های طبیعی تنها بر اساس توالی‌های اسید آمینه آن‌ها آموزش دیده‌اند. یادگیری ماشینی نوعی هوش مصنوعی است که به رایانه‌ها اجازه می‌دهد بدون برنامه‌ریزی صریح از داده‌ها یاد بگیرند. یادگیری ماشینی می‌تواند برای مدل‌سازی مسائل علمی پیچیده که درک آن برای انسان بسیار دشوار است، استفاده شود.

شبکه‌های عصبی به راحتی آموزش داده می‌شوند، اما در مورد پروتئین‌ها، آن‌قدر که می‌خواهیم نمونه‌هایی نداریم. باید وارد می‌شدیم و مشخص می‌کردیم که کدام ویژگی‌ها در این مولکول‌ها مهم‌ترین هستند. جاستاس داپاراس، دانشمند پروژه، محقق فوق دکترا در موسسه طراحی پروتئین، گفت: کمی آزمون و خطا بود.

ابتدا باید یک شکل پروتئین جدید تولید شود. در مقاله ای که در 21 جولای در مجله منتشر شد علوم پایهاین تیم نشان داد که هوش مصنوعی می تواند اشکال پروتئینی جدیدی را به دو روش تولید کند. اولین مورد، که “توهم” نامیده می شود، شبیه به DALL-E یا سایر ابزارهای مولد هوش مصنوعی است که بر اساس اعلان های ساده خروجی تولید می کنند. دومی که “inpainting” نام دارد، مشابه ویژگی تکمیل خودکار موجود در نوارهای جستجوی مدرن است.

Matthew Newman

Matthew Newman Matthew has over 15 years of experience in database management and software development, with a strong focus on full-stack web applications. He specializes in Django and Vue.js with expertise deploying to both server and serverless environments on AWS. He also works with relational databases and large datasets
[ Back To Top ]