Predikce proteinové struktury z prvních principů: Cesta k "Terra Incognita" jejich konformačních prostorů
Popis projektu
Je rozsáhlý konformační prostor oligopeptidů a proteinů vhodný pro ab initio strukturní předpovědi?
Námětem disertační práce bude multidisciplinární výzkum, který kombinuje nejmodernější metody výpočetní chemie a strojově učení pro získání potenciálů oligopeptidů s možnými aplikacemi ve strukturní a evoluční biologii. Nejprve vyvineme nový výpočetní nástroj, označený jako QMLFold. Ten by nám umožnil vstoupit do „terra incognita“ předpovědí struktury proteinů, dosud nepřístupných pro AlphaFold2/3 a jemu podobné programy. Toto neprobádané území zahrnuje oligopeptidy, vnitřně neuspořádané proteiny, proteiny sestávající z neproteinogenních (nekódovaných, xeno) aminokyselin nebo menší de novo (metalo)-proteiny. Všechny tyto biomolekuly mají velký biologický a průmyslový potenciál.
QMLFold bude na skládání proteinů nahlížet z koncepčně odlišné perspektivy, jako na „univerzální solvatační problém“ (tj. jako na kovalentně propojený soubor postranních řetězců aminokyselin, které jsou solvatovány samy v sobě). To je rozdílné od standardních atomistických přístupů, které se používají při simulacích tradiční silová pole. Budeme formulovat nové a netriviální rozšíření solvatačního modelu COSMO-RS na tři rozměry (3D-COSMO-RS) a spojíme jej se strojově naučenými (ML) oligopeptidovými potenciály. Ukázalo se, že tyto potenciály poskytují konformační volné energie delších peptidů s „QM-přesností“, a to za zlomky sekundy procesorového času (CPU).
Experimentální kalibrace a validace QMLFoldu bude zahrnovat syntézu a strukturní charakterizaci (NMR, VCD, ECD) vybraných oligopeptidů s předem navrženou sekundární strukturou.
Poté budou prozkoumány dvě oblasti potenciálních aplikací:
- Biokatalýza: pro de novo návrh katalytických metalopeptidů nebo metaloproteinů jiných než známých peptidových skeletů.
- Xeno-biologie: k pochopení, zda rozdíly v konformační složitosti kódovaných a nekódovaných aminokyselin hrály roli v evoluci proteinů, jak je známe dnes.
Obor: Modelování chemických vlastností nano- a biostruktur
Reference:
- Unke, O. T.; Chmiela, S.; Sauceda, H. E.; Gastegger, M.; Poltavsky, I.; Schütt, K. T.; Tkatchenko, A.; Müller, K. Machine Learning Force Fields. Chem. Rev. 2021, 121, 10142-10186. doi:10.1021/acs.chemrev.0c01111
- Wang, Y.; Wang, T.; Li, S.; He, X.; Li, M.; Wang, Z.; Zheng, N.; Shao, B.; Liu, T. Enhancing geometric representations for molecules with equivariant vector-scalar interactive message passing. Nat. Commun. 2024, 15, 313. doi:10.1038/s41467-023-43720-2
- Frank, J. T.; Unke, O. T.; Müller, K.; Chmiela, S. A Euclidean transformer for fast and stable machine learned force fields. Nat. Commun. 2024, 15, 6539. doi:10.1038/s41467-024-50620-6
- Anstine, D.; Zubatyuk, R.; Isayev, O. AIMNet2: A Neural Network Potential to Meet your Neutral, Charged, Organic, and Elemental-Organic Needs. ChemRxiv 2024. doi:10.26434/chemrxiv-2023-296ch-v3
- Zhang, S.; Makoś, M. Z.; Jadrich, R. B.; Kraka, E.; Barros, K.; Nebgen, B. T.; Tretiak, S.; Isayev, O.; Lubbers, N.; Messerly, R. A.; Smith, J. S. Exploring the frontiers of condensed-phase chemistry with a general reactive machine learning potential. Nat. Chem. 2024, 16, 727-734. doi:10.1038/s41557-023-01427-3
Vysoké školy
Studenti doktorského studia musí být zapsáni na partnerské univerzitě a zároveň budou zaměstnáni na ÚOCHB na částečný nebo plný úvazek, což zajistí zajímavé finanční ohodnocení (univerzitní stipendium + plat na ÚOCHB). Každá univerzita má svůj vlastní přijímací proces, včetně termínů pro přihlášky, který je oddělený od přijímacího řízení na ÚOCHB. Podrobnosti můžete projednat s příslušným tutorem.
Partnerské školy
Jak se přihlásit
Kontakt: lubomir.rulisek @ uochb.cas.cz