Průlom ve zpracování velkých dat. Hledat chemické látky ve složitých směsích je mnohem jednodušší
Mezinárodní tým vědců vedený Tomášem Pluskalem z Ústavu organické chemie a biochemie AV ČR (ÚOCHB) představil novou generaci softwaru umožňujícího vědcům analyzovat rozsáhlá kvanta dat získaná při zkoumání složení látek. Článek o nové verzi softwaru MZmine 3 vyšel nyní v jednom z nejcitovanějších světových vědeckých časopisů Nature Biotechnology.
Výzvy biochemické analýzy
Analytičtí chemici všech zemí, spojte se! Tak by bylo možné charakterizovat kolektivní snahu vědců z celého světa, kteří se pomocí metod hmotnostní spektrometrie snaží rozluštit a analyzovat chemické složení různých, zejména biologických vzorků. Jednotlivé vzorky mohou obsahovat statisíce různých chemických sloučenin, které vědci potřebují identifikovat a kvantifikovat, aby porozuměli jejich dopadu na lidské zdraví či jejich ekologické úloze.
Výsledkem jsou i v případě poměrně malých vzorků gigabajty „surových“ dat. Právě zpracování, analyzování a porovnání různých dat o měřených molekulách představuje přitom jeden z nejnáročnějších úkonů v biochemických analýzách současnosti. Odstranění téhle překážky by vědcům umožnilo dramaticky rozšířit potenciál pro nové objevy a taky rychleji posunovat hranice poznání.
Komunitní vývoj
Proto již od roku 2005 vědci vyvíjejí otevřený software MZmine, který jim s analýzou dat z hmotnostní spektrometrie pomáhá. Tuto komunitu pomohl založit také český vědec Tomáš Pluskal, který projekt koordinuje téměř od jeho počátku a dnes vede vlastní výzkumnou skupinu v ÚOCHB.
„Největší síla projektu MZmine je v mezinárodní komunitě expertů, která se kolem něj vytvořila. Na vědeckých konferencích mají prezentace o MZmine vždy ohromný ohlas,“ říká o projektu Tomáš Pluskal z ÚOCHB.
Jeden z prvních autorů práce Robin Schmid z ÚOCHB a Kalifornské univerzity v San Diegu (USA) k tomu dodává: „Je skvělé, když se poprvé setkáme se zahraničními výzkumníky a oni nám řeknou, že MZmine a naše podpora zachránila jejich dizertaci či projekt. To je to nejlepší ocenění, v jaké můžete doufat.“
První verze MZmine umožnila vědcům do té doby nevídanou automatizaci zpracování datových souborů generovaných analytickými přístroji. V roce 2010 následovala druhá generace softwaru, která projekt dostala do širšího povědomí a vedla k vytvoření celosvětové komunity vědců, kteří software využívají a nadále rozšiřují o další moduly a aplikace. Publikace informující o druhé generaci MZmine nasbírala od té doby přes 2 200 citací ve vědeckých článcích a samotný nástroj byl využit ke zpracování milionů různých měření.
Třetí generace
Nejnovější MZmine 3 přináší několik zásadních zlepšení. Tam, kde předchozí verze umožňovala vědcům analyzovat stovky vzorků v řádu několika dní, umožňuje nová generace zpracovat tisíce vzorků za hodinu. Kromě významného urychlení zpracování dat umožňuje nová verze softwaru také propojení různých typů dat, například kombinaci dat z analytických a zobrazovacích metod, což dosud nebylo možné v žádném akademickém ani komerčním softwaru.
Vědcům se tak otevírají možnosti pro snazší analýzu a interpretaci komplexních biologických vzorků, zkoumání příčin a mechanismů různých nemocí, detekování klinických biomarkerů pro diagnostiku, anebo identifikaci chemických látek v životním prostředí, včetně dosud nepopsaných chemických struktur využitelných např. pro vývoj nových léčiv.
Na třetí generaci softwaru se kromě Tomáše Pluskala jako hlavního autora právě publikovaného článku podíleli také první autoři článku, už citovaný Robin Schmid, Steffen Heuckeroth a Ansgar Korf z Münsterské univerzity a několik desítek dalších vědců z celého světa.
„MZmine se za posledních deset let etabloval jako důvěryhodný nástroj pro výzkumníky v oblasti hmotnostní spektrometrie. Jeho modulární rámec vytvořil prostor pro zapojení celé komunity do vývoje kódu, což vedlo k významným pokrokům v nově vydaném MZmine 3,“ říká Ansgar Korf.
Vývoj projektu MZmine podpořila Grantová agentura ČR (č. 21-11563M).
Původní článek
- Schmid, R., Heuckeroth, S., Korf, A. et al. Integrative analysis of multimodal mass spectrometry data in MZmine 3. Nature Biotechnology (2023). https://doi.org/10.1038/s41587-023-01690-2