500 milionów lat ewolucji w laboratorium
Od ponad 3 miliardów lat ewolucja na Ziemi kształtuje organizmy, wprowadzając zmiany w strukturach białek, które wpływają na ich funkcje i właściwości. Dzięki przełomowym osiągnięciom w dziedzinie sztucznej inteligencji naukowcy coraz lepiej rozumieją ten swoisty język życia i zaczynają go modyfikować według własnych potrzeb. Badacze zaprezentowali właśnie model ESM3 – nowoczesny model językowy oparty na głębokim uczeniu, który umożliwia programowalne projektowanie białek o nowych właściwościach. To przełom, który może zrewolucjonizować biotechnologię, medycynę i wiele innych dziedzin.
Białka są podstawowymi cegiełkami życia na Ziemi. Każde białko to sekwencja aminokwasów połączonych ze sobą wiązaniami peptydowymi. W organizmach pełnią rolę enzymów przyspieszających reakcje chemiczne, budulców tkanek, przekaźników sygnałów oraz regulatorów procesów biologicznych. Ich niezwykła różnorodność wynika z niemal nieskończonej liczby możliwych kombinacji aminokwasów, co sprawia, że każde białko może mieć unikatowe właściwości. Działanie białek zależy nie tylko od sekwencji aminokwasów, ale także od struktury przestrzennej, która może być niezwykle złożona. Naukowcy od lat starają się rozszyfrować ten kod, jednak przypomina to próby odczytania tekstu napisanego w obcym języku bez znajomości reguł gramatycznych. Na szczęście rozwój sztucznej inteligencji i dostęp do ogromnych baz danych białkowych pozwalają coraz lepiej rozumieć ten biologiczny alfabet.
Model ESM3 opracowany przez zespół Thomasa Hayesa jest zaawansowanym modelem językowym, który uczy się na podstawie ogromnych zbiorów sekwencji, struktur i funkcji białek. Jest on w stanie generować białka na podstawie podanych wskazówek – podobnie jak modele językowe typu ChatGPT generują teksty w odpowiedzi na zapytania użytkowników. Dzięki temu naukowcy mogą projektować nowe białka o określonych właściwościach, co otwiera niespotykane dotąd możliwości w biologii syntetycznej.
Aby przetestować potencjał ESM3, badacze polecili mu wygenerować nowe warianty białka zielonej fluorescencji (ang. green fluorescent protein, GFP), które naturalnie występuje u meduzy Aequorea victoria i wykazuje jaskrawo zieloną fluorescencję przy ekspozycji na światło z zakresu niebieskiego do ultrafioletu. Udało się stworzyć białko, które mimo znacznych różnic w sekwencji aminokwasów (aż 58% odmienności) nadal zachowało swoją funkcję. W praktyce oznacza to symulację 500 milionów lat ewolucji w skali laboratoryjnej.
Dzięki ESM3 naukowcy mogą nie tylko przewidywać struktury nowych białek, ale także projektować je zgodnie z określonymi wymaganiami. Możliwe zastosowania obejmują m.in.: projektowanie enzymów do celów przemysłowych i medycznych, tworzenie nowych leków opartych na białkach, rozwój biosensorów do wykrywania chorób czy tworzenie syntetycznych organizmów o unikalnych funkcjach.
Wygląda na to, że sztuczna inteligencja może nie tylko przyspieszyć odkrycia naukowe, ale także umożliwić eksplorację nowych, nieznanych dotąd ścieżek ewolucji. Biologia wkracza w nową erę, w której być może stanie się możliwe projektowanie życia.
Opracowano na podstawie:
Simulating 500 million years of evolution with a language model