یک ابزار هوش مصنوعی جدید میتواند عملکرد آنزیمها را بر اساس توالی اسید آمینهشان پیشبینی کند، حتی زمانی که آنزیمها مطالعهنشده یا ناشناخته باشند. محققان گفتند که ابزار هوش مصنوعی که CLEAN نام دارد از ابزارهای پیشرفته در دقت، قابلیت اطمینان و حساسیت برتری دارد. درک بهتر آنزیمها و عملکرد آنها برای تحقیقات در زمینه ژنومیک، شیمی، مواد صنعتی، پزشکی، داروسازی و غیره مفید خواهد بود.
بنیاد ملی علوم این کار را از طریق مؤسسه Molecule Maker Lab، موسسه تحقیقاتی هوش مصنوعی که ژائو رهبری میکند، پشتیبانی کرد.
ژائو گفت که این گروه قصد دارد هوش مصنوعی پشت CLEAN را برای مشخص کردن سایر پروتئینها، مانند پروتئینهای اتصال، گسترش دهد. این تیم همچنین امیدوار است که الگوریتمهای یادگیری ماشینی را بیشتر توسعه دهد تا کاربر بتواند واکنش دلخواه را جستجو کند و هوش مصنوعی به یک آنزیم مناسب برای این کار اشاره کند.
Huimin Zhao، سرپرست این مطالعه، استاد مهندسی شیمی و بیومولکولی دانشگاه ایلینویز Urbana-Champaign، گفت: درست مانند ChatGPT از دادههای زبان نوشتاری برای ایجاد متن پیشبینیکننده استفاده میکند، ما نیز از زبان پروتئینها برای پیشبینی فعالیت آنها استفاده میکنیم. تقریباً هر محققی، هنگام کار با یک توالی پروتئین جدید، میخواهد فوراً بداند پروتئین چه کار میکند. آنزیم های مورد نیاز برای سنتز مواد شیمیایی و مواد.”
ژائو گفت: “ما امیدواریم که این ابزار به طور گسترده توسط جامعه تحقیقاتی گسترده مورد استفاده قرار گیرد.” با رابط وب، محققان میتوانند مانند یک موتور جستجو توالی را در یک جعبه جستجو وارد کنند و نتایج را ببینند.
گروه ژائو CLEAN را به صورت آنلاین برای سایر محققانی که به دنبال توصیف یک آنزیم یا تعیین اینکه آیا یک آنزیم میتواند واکنش مورد نظر را کاتالیز کند، در دسترس قرار میدهد.
ما اولین کسی نیستیم که از ابزارهای هوش مصنوعی برای پیشبینی اعداد کمیسیون آنزیم استفاده میکنیم، اما اولین کسی هستیم که از این الگوریتم یادگیری عمیق جدید به نام یادگیری متضاد برای پیشبینی عملکرد آنزیم استفاده میکنیم. متوجه شدیم که این الگوریتم بسیار بهتر از هوش مصنوعی کار میکند. ژائو گفت: ابزارهایی که توسط دیگران استفاده می شود. ما نمی توانیم تضمین کنیم که محصول همه به درستی پیش بینی می شود، اما می توانیم دقت بالاتری نسبت به دو یا سه روش دیگر داشته باشیم.
سایر ابزارهای محاسباتی سعی در پیش بینی عملکرد آنزیم دارند. به طور معمول، آنها تلاش می کنند تا با مقایسه یک توالی مورد بررسی با کاتالوگ آنزیم های شناخته شده و یافتن توالی های مشابه، یک شماره کمیسیون آنزیمی را اختصاص دهند – یک کد شناسه که نشان می دهد آنزیم چه نوع واکنشی را کاتالیز می کند. به گفته ژائو، با این حال، این ابزارها با آنزیم های کمتر مطالعه شده یا مشخص نشده، یا با آنزیم هایی که چندین کار را انجام می دهند، به خوبی کار نمی کنند.
محققان ابزار خود را به صورت تجربی با آزمایشهای محاسباتی و آزمایشگاهی تأیید کردند. آنها دریافتند که این ابزار نه تنها میتواند عملکرد آنزیمهایی را که قبلا مشخص نشده بودند، پیشبینی کند، بلکه آنزیمهایی را که توسط نرمافزارهای پیشرو برچسبگذاری نشده بودند، تصحیح کرد و آنزیمهایی را با دو یا چند عملکرد به درستی شناسایی کرد.
ژائو گفت: «پروتئینهای اتصال نامشخص زیادی مانند گیرندهها و فاکتورهای رونویسی وجود دارد. ما همچنین میخواهیم عملکرد آنها را نیز پیشبینی کنیم.» ما میخواهیم عملکرد همه پروتئینها را پیشبینی کنیم تا بتوانیم تمام پروتئینهای یک سلول را بشناسیم و کل سلول را برای کاربردهای بیوتکنولوژی یا بیوپزشکی بهتر مطالعه یا مهندسی کنیم.»
محققان یافته های خود را در مجله منتشر خواهند کرد علوم پایه و CLEAN را به صورت آنلاین در 31 مارس در دسترس قرار دهید.
ژائو، یکی از اعضای مؤسسه زیست شناسی ژنومیک کارل آر ووز در ایلینویز، گفت: با پیشرفت در ژنومیکس، آنزیم های زیادی شناسایی و توالی یابی شده اند، اما دانشمندان اطلاعات کمی در مورد آنچه آنزیم ها انجام می دهند یا ندارند.