DeepMind AI Breakthrough позволяет прогнозировать более 200 миллионов белковых структур

DeepMind AI Breakthrough позволяет прогнозировать более 200 миллионов белковых структур

Дивизион Google DeepMind выпустил несколько увлекательных и впечатляющих моделей ИИ, в том числе одна, которая может играть в StarCraft II лучше вас (и почти кого -либо еще). DeepMind не только заинтересован в ИИ, чтобы играть в игры. В прошлом году компания представила Alphafold, модель машинного обучения, которая может предсказать форму белков. Теперь DeepMind объявил, что создал структуры для всех 200 миллионов белков в централизованной базе данных Uniprot. Это большое значение для основных биологических исследований, а также для усилий по борьбе с некоторыми из наиболее важных научных загадков нашего времени.

Белки являются основой всей биологической жизни на Земле, но даже если вы знаете аминокислотную последовательность белка, это не значит, что вы знаете, что он делает или как он работает. Последовательность белка дает ему паттерны положительных и отрицательных зарядов, гидрофильных и гидрофобных областей и сшитых сегментов. Это то, что определяет активную форму белка или «конформацию», как она известна в лаборатории, и конформация белка - это то, что дает ему функцию. Даже несколько ошибок в структурном прогнозировании могут быть разницей между ферментом, который правильно катализирует реакцию, и тот, который буквально ничего не делает.

Определение конформации может быть кропотливым процессом, часто полагаясь на передовые методы, такие как рентгеновская кристаллография. Alphafold помогает поместить эти данные в контексте с высокими точными прогнозами конформации. На видео ниже вы можете увидеть команду из Университета Колорадо, в которой Боулдер рассказывает о проблемах изучения белков, участвующих в устойчивости к бактерий к антибиотикам. Команда провела десять лет, озадачивая форму белка, который Альфафолд смог предсказать всего за несколько минут. Это возможно, потому что Alphafold был обучен более 170 000 известных белковых структур, что дает ему возможность предсказать, как будут выглядеть новые последовательности в 3D.

Когда DeepMind анонсировал AlphaFold в прошлом году, он решил сделать базу данных Alphafold свободно доступной. В то время было доступно только один миллион структур, что увеличилось в 200 раз за последние 12 месяцев довольно впечатляющим. DeepMind говорит, что с момента своего дебюта AlphaFold цитируется в более чем 4000 научных работ, и это может помочь ученым понять насущные проблемы, такие как устойчивость к антибиотикам, продовольственная безопасность и последствия пластического загрязнения.

С учетом всей базы данных Uniprot, DeepMind предоставит прогнозируемую последовательность прямо на веб -странице. Полная база данных всех 200 миллионов структур также будет доступна в качестве объемной загрузки из общедоступной базы данных Google.