داپاراس توضیح داد: «نرمافزاری برای پیشبینی ساختارهای پروتئینی بخشی از راهحل است، اما نمیتواند به تنهایی چیز جدیدی ارائه دهد.
بودجه توسط پروژه جسورانه در موسسه طراحی پروتئین تامین شد. مایکروسافت؛ اریک و وندی اشمیت به توصیه شرکت های آتی اشمیت. پروژه کشف و طراحی هم افزایی دارپا (قرارداد HR001117S0003 FA8750-17-C-0219)؛ پروژه مهار فعالیت آنزیمی دارپا برای نجات جان (قرارداد HR001120S0052 HR0011-21-2-0012)؛ بنیاد تحقیقات واشنگتن؛ پروژه باز بشردوستانه بهبود صندوق طراحی پروتئین؛ Amgen; کمک مالی برنامه بنیاد آلفرد پی اسلون (G-2021-16899)؛ موقوفه دونالد و جو آن پترسن برای تسریع پیشرفت در تحقیقات بیماری آلزایمر. کمک هزینه تحصیلی بین رشتهای برنامه علوم مرزی انسانی (LT000395/2020-C)؛ سازمان زیست شناسی مولکولی اروپا (ALTF 139-2018)، از جمله بورسیه تحصیلی EMBO Non-Stipendiary (ALTF 1047-2019) و بورسیه بلند مدت EMBO (ALTF 191-2021). بنیاد “لا کایکسا”؛ موسسه پزشکی هوارد هیوز، از جمله کمک هزینه تحصیلی هانا گری (GT11817)؛ بنیاد ملی علوم (MCB 2032259، CHE-1629214، DBI 1937533، DGE-2140004)؛ مؤسسه ملی بهداشت (DP5OD026389)؛ موسسه ملی آلرژی و بیماری های عفونی (HHSN272201700059C)؛ موسسه ملی پیری (5U19AG065156)؛ موسسه ملی علوم پزشکی عمومی (P30 GM124169-01، P41 GM 103533-24)؛ موسسه ملی سرطان (R01CA240339)؛ بنیاد ملی علوم سوئیس؛ مرکز ملی صلاحیت مهندسی سیستم های مولکولی سوئیس. مرکز ملی صلاحیت در زیست شناسی شیمیایی سوئیس. و شورای تحقیقات اروپا (716058).
منبع
سوم، تیم از AlphaFold، ابزاری که توسط DeepMind Alphabet توسعه داده شده است، استفاده کرد تا به طور مستقل ارزیابی کند که آیا توالیهای اسید آمینهای که به دست آوردهاند احتمالاً به شکلهای مورد نظر تا میشوند یا خیر.
منابع کامپیوتری برای این کار توسط مایکروسافت و خدمات وب آمازون اهدا شد.
در مقالههای جدید، زیستشناسان دانشکده پزشکی دانشگاه واشنگتن نشان میدهند که یادگیری ماشینی میتواند برای ایجاد مولکولهای پروتئین بسیار دقیقتر و سریعتر از آنچه قبلا ممکن بود استفاده شود. دانشمندان امیدوارند این پیشرفت به بسیاری از واکسنها، درمانها، ابزارهای جذب کربن و مواد زیستی پایدار منجر شود.
“پروتئین ها در سراسر زیست شناسی اساسی هستند، اما ما می دانیم که تمام پروتئین های موجود در هر گیاه، حیوان و میکروب بسیار کمتر از یک درصد از آنچه ممکن است را تشکیل می دهند. با این ابزارهای نرم افزاری جدید، محققان باید بتوانند راه حل هایی برای مدت طولانی پیدا کنند. دیوید بیکر، نویسنده ارشد، استاد بیوشیمی در دانشکده پزشکی دانشگاه واشنگتن و دریافت کننده جایزه پیشرفت در علوم زیستی در سال 2021، گفت: چالش های پایدار در پزشکی، انرژی و فناوری.
در مقاله دیگری که در علوم پایه در 15 سپتامبر، تیمی از آزمایشگاه بیکر تأیید کردند که ترکیب ابزارهای یادگیری ماشینی جدید می تواند به طور قابل اعتمادی پروتئین های جدیدی تولید کند که در آزمایشگاه کار می کنند.
بیکر گفت: “این همان آغاز یادگیری ماشینی در طراحی پروتئین است. در ماه های آینده، ما برای بهبود این ابزارها برای ایجاد پروتئین های پویاتر و کاربردی تر کار خواهیم کرد.”
بیکر افزود: «ProteinMPNN طراحی پروتئین همان چیزی است که AlphaFold برای پیشبینی ساختار پروتئین بود».
دوم، برای سرعت بخشیدن به این فرآیند، تیم یک الگوریتم جدید برای تولید توالی اسید آمینه ابداع کرد. شرح داده شده در شماره 15 سپتامبر علوم پایه، این ابزار نرم افزاری به نام ProteinMPNN در حدود یک ثانیه اجرا می شود. این بیش از 200 برابر سریعتر از بهترین نرم افزار قبلی است. نتایج آن نسبت به ابزارهای قبلی برتری دارد و نرم افزار برای اجرا نیازی به سفارشی سازی متخصص ندارد.
برای فراتر رفتن از پروتئین های موجود در طبیعت، اعضای تیم بیکر چالش طراحی پروتئین را به سه بخش تقسیم کردند و برای هر کدام از راه حل های نرم افزاری جدید استفاده کردند.
Basile Wicky، دانشمند پروژه، محقق فوق دکترا در موسسه طراحی پروتئین، گفت: “ما دریافتیم که پروتئین های ساخته شده با استفاده از ProteinMPNN بسیار بیشتر احتمال دارد که مطابق با هدف جمع شوند، و ما می توانیم مجموعه های پروتئینی بسیار پیچیده ای را با استفاده از این روش ها ایجاد کنیم.”
طی دو سال گذشته، یادگیری ماشینی پیش بینی ساختار پروتئین را متحول کرده است. اکنون، سه مقاله وارد شده است علوم پایه انقلاب مشابهی را در طراحی پروتئین توصیف کنید.
در میان پروتئینهای جدید ساخته شده، حلقههایی در مقیاس نانو وجود داشت که محققان معتقدند میتوانند به قطعاتی برای نانوماشینهای سفارشی تبدیل شوند. برای مشاهده این حلقهها از میکروسکوپهای الکترونی استفاده شد که قطری تقریباً یک میلیارد برابر کوچکتر از یک دانه خشخاش دارند.
پروتئین ها اغلب به عنوان “بلوک های سازنده زندگی” شناخته می شوند زیرا برای ساختار و عملکرد همه موجودات زنده ضروری هستند. آنها تقریباً در هر فرآیندی که در داخل سلول اتفاق می افتد، از جمله رشد، تقسیم و ترمیم نقش دارند. پروتئین ها از زنجیره های بلندی از مواد شیمیایی به نام اسیدهای آمینه تشکیل شده اند. توالی اسیدهای آمینه در یک پروتئین شکل سه بعدی آن را تعیین می کند. این شکل پیچیده برای عملکرد پروتئین بسیار مهم است.
اخیراً الگوریتمهای قدرتمند یادگیری ماشینی از جمله AlphaFold و RoseTTAFold برای پیشبینی اشکال دقیق پروتئینهای طبیعی تنها بر اساس توالیهای اسید آمینه آنها آموزش دیدهاند. یادگیری ماشینی نوعی هوش مصنوعی است که به رایانهها اجازه میدهد بدون برنامهریزی صریح از دادهها یاد بگیرند. یادگیری ماشینی میتواند برای مدلسازی مسائل علمی پیچیده که درک آن برای انسان بسیار دشوار است، استفاده شود.
شبکههای عصبی به راحتی آموزش داده میشوند، اما در مورد پروتئینها، آنقدر که میخواهیم نمونههایی نداریم. باید وارد میشدیم و مشخص میکردیم که کدام ویژگیها در این مولکولها مهمترین هستند. جاستاس داپاراس، دانشمند پروژه، محقق فوق دکترا در موسسه طراحی پروتئین، گفت: کمی آزمون و خطا بود.
ابتدا باید یک شکل پروتئین جدید تولید شود. در مقاله ای که در 21 جولای در مجله منتشر شد علوم پایهاین تیم نشان داد که هوش مصنوعی می تواند اشکال پروتئینی جدیدی را به دو روش تولید کند. اولین مورد، که “توهم” نامیده می شود، شبیه به DALL-E یا سایر ابزارهای مولد هوش مصنوعی است که بر اساس اعلان های ساده خروجی تولید می کنند. دومی که “inpainting” نام دارد، مشابه ویژگی تکمیل خودکار موجود در نوارهای جستجوی مدرن است.
Matthew Newman
Matthew Newman
Matthew has over 15 years of experience in database management and software development, with a strong focus on full-stack web applications. He specializes in Django and Vue.js with expertise deploying to both server and serverless environments on AWS. He also works with relational databases and large datasetsView all posts by Matthew Newman →