Deepmind AI прорив дозволяє прогнозувати понад 200 мільйонів білкових структур

Deepmind AI прорив дозволяє прогнозувати понад 200 мільйонів білкових структур

Відділ Deepmind Google розробив кілька захоплюючих та вражаючих моделей AI, включаючи ті, які можуть грати Starcraft II краще, ніж ви (і майже будь -хто інший). Deepmind не зацікавлений лише в AI, хоча грати в ігри. Минулого року компанія представила Alphafold, модель машинного навчання, яка може передбачити форму білків. Тепер DeepMind оголосив, що створює структури для всіх 200 мільйонів білків у централізованій базі даних UNIPROT. Це велика справа для основних біологічних досліджень, а також зусиль для вирішення деяких найважливіших наукових загадок сучасності.

Білки є основою всього біологічного життя на Землі, але навіть якщо ви знаєте амінокислотну послідовність білка, це не означає, що ви знаєте, що він робить або як це працює. Послідовність білка дає йому закономірності позитивних та негативних зарядів, гідрофільних та гідрофобних областей та зшитого сегментів. Це те, що визначає активну форму білка або "конформацію", як відомо в лабораторії, а конформація білка - це те, що надає йому його функції. Навіть кілька помилок у структурному прогнозуванні можуть бути різницею між ферментом, який правильно каталізує реакцію, і такою, яка буквально нічого не робить.

Визначення конформації може бути кропітким процесом, часто покладаючись на передові методи, такі як рентгенівська кристалографія. Alphafold допомагає поставити ці дані в контексті з високоточними прогнозами конформації. У відео нижче ви можете побачити команду з Університету Колорадо, Боулдер розповідає про проблеми вивчення білків, що беруть участь у бактеріальній стійкості до антибіотиків. Команда провела десять років, спантеличуючи форму білка, яку Альфафольд зміг передбачити всього за кілька хвилин. Це можливо, оскільки Альфафольд пройшов навчання понад 170 000 відомих білкових структур, що дає йому можливість передбачити, як виглядатимуть нові послідовності в 3D.

Коли минулого року Deepmind оголосив про Альфафольда, він вирішив зробити базу даних Alphafold вільно доступною. У той час було доступно лише мільйон структур, що робить збільшення в 200 разів за останні 12 місяців досить вражаючим. Deepmind каже, що Альфафольд цитується в більш ніж 4000 наукових працях з моменту дебюту, і це може допомогти вченим зрозуміти нагальні проблеми, такі як стійкість до антибіотиків, продовольча безпека та наслідки забруднення пластиком.

З усією базою даних UniProt, що зараз виконано, DeepMind надасть передбачувану послідовність прямо на веб -сторінці. Повна база даних з усіх 200 мільйонів структур також буде доступна як масове завантаження з загальнодоступної бази даних Google Cloud.