W świecie nauki coraz więcej mówi się o tym, że aby zrozumieć życie, trzeba obserwować je w rozdzielczości pojedynczej komórki. Teraz, dzięki nowemu narzędziu opracowanemu przez naukowców ICTER, możliwe jest nie tylko śledzenie zmian w ekspresji genów, ale także zrozumienie, jak różne mechanizmy ich regulacji współdziałają w czasie. Ocelli to nowe oprogramowanie, które zmienia sposób, w jaki analizujemy i wizualizujemy wielowymiarowe dane jednokomórkowe.
Nowe narzędzie, nazwane Ocelli, zostało opracowane przez doktoranta Piotra Rutkowskiego i dr. Marcina Tabakę z Międzynarodowego Centrum Badań Oka (ICTER). Ocelli, którego mechanizm działania i zastosowanie opublikowano na łamach NAR Genomics and Bioinformatics, jest odpowiedzią na rosnące zapotrzebowanie na skuteczne narzędzia do analizy danych multimodalnych uzyskiwanych z pojedynczych komórek.

Współczesne technologie sekwencjonowania pozwalają na równoczesne pomiary transkryptomu, dostępności chromatyny, poziomów białek i modyfikacji histonów w pojedynczych komórkach. Każda z tych „modalności” reprezentuje inny etap regulacji ekspresji genów – od epigenetycznych mechanizmów kontroli po końcowe produkty w postaci białek. Zrozumienie tych procesów w ich dynamicznym przebiegu wymaga jednak narzędzi, które potrafią je analizować jednocześnie bez utraty rozdzielczości biologicznej i czasowej. Ocelli właśnie to oferuje.
Biologiczna mapa czasu
W odróżnieniu od dotychczasowych metod opartych głównie na sieciach neuronowych lub metodach probabilistycznych, Ocelli wykorzystuje unikalną kombinację modelowania tematów (topic modeling) oraz multimodalnych map dyfuzyjnych (MDM). Te ostatnie pozwalają traktować przejścia między stanami komórkowymi jako procesy dyfuzji w przestrzeni wielowymiarowych cech komórek, tworząc złożoną sieć zależności, która oddaje zarówno globalną strukturę różnicowania, jak i lokalne niuanse przejść pomiędzy stanami komórek.
Dzięki temu możliwe jest odwzorowanie trajektorii różnicowania się komórek w sposób ciągły, z zachowaniem nieliniowości charakterystycznej dla procesów biologicznych. Co więcej, Ocelli przydziela każdej komórce indywidualne wagi określające, która modalność – RNA, chromatyna, białka – najlepiej oddaje jej aktualny stan rozwojowy. To szczególnie ważne, ponieważ w różnych etapach rozwoju znaczenie poszczególnych mechanizmów regulacji ekspresji genów ulega zmianie, np. w komórkach progenitorowych dominują sygnały epigenetyczne, natomiast w komórkach zróżnicowanych bardziej istotne są poziomy białek do określenia stanów komórek.

Mgr Piotr Rutkowski z ICTER, współautor narzędzia Ocelli, mówi:
W biologii rozwojowej liczy się nie tylko to, jakie cechy komórki mierzymy, ale jak one zmieniają się w czasie. Ocelli pozwala uchwycić te zmiany w sposób ciągły, nieliniowy i biologicznie sensowny, łącząc różne warstwy informacji w jedną spójną reprezentację.
Autorzy pracy przeprowadzili szereg analiz na danych symulowanych i rzeczywistych, w tym na danych SHARE-seq z mieszków włosowych myszy, a także na danych z ludzkiego szpiku kostnego (ASAP-seq, NTT-seq, SHARE-seq) i krwi (Dogma-seq). W przypadku danych syntetycznych, Ocelli z powodzeniem odtworzyło zarówno symulowane drzewa rozwojowe z wieloma liniami komórkowymi, jak i bardziej złożone struktury z rzadkimi przejściami komórkowymi. W obydwu przypadkach narzędzie przewyższyło inne metody pod względem dokładności rekonstrukcji ścieżek rozwojowych, ciągłości trajektorii i identyfikacji punktów rozwidleń.
W analizie danych rzeczywistych, Ocelli wykazało wyjątkową precyzję w odwzorowaniu procesu różnicowania komórek w regeneracyjnej części mieszka włosowego. Poprzez jednoczesną analizę danych z dostępności chromatyny i ekspresji genów, narzędzie poprawnie odwzorowało podział komórek progenitorowych (TACs) na linie różnicujące się w kierunku różnych warstw mieszka włosowego: rdzeniowej łodygi włosa (HS-Me), korowej łodygi włosa (HS-Co) oraz komórek wewnętrznej osłonki korzenia (IRS): warstwy Henle’a (IRS-He) i Huxley’a (IRS-Hu). Dodatkowo, użycie narzędzia CellRank potwierdziło, że końcowe stany różnicowania zidentyfikowane przez Ocelli pokrywają się z najbardziej prawdopodobnymi trajektoriami bazującymi na algorytmach prędkości RNA.
Przełom w analizie danych jednokomórkowych
Jednym z głównych wyzwań w analizie danych jednokomórkowych jest ich olbrzymia wymiarowość i zaszumienie. Dane z pojedynczych komórek są z natury bardzo rzadkie – w przypadku RNA-seq wykrywa się tylko 10-45% transkryptów, a w przypadku ATAC-seq wykrywalność spada do 1-10% miejsc dostępnych na chromatynie. Ocelli oferuje wydajną i matematycznie ugruntowaną metodę rekonstrukcji tych braków – poprzez efektywne wykorzystanie rozkładu własnego multimodalnej macierzy Markowa, z zachowaniem informacji o strukturze danych. Pozwala to nie tylko uzupełnić brakujące dane, ale również zachować istotne biologicznie korelacje między genami i elementami regulatorowymi.

Pod względem wydajności obliczeniowej, Ocelli deklasuje konkurencję – analizę 100 tysięcy komórek przeprowadza w mniej niż 3 minuty, co czyni je jednym z najszybszych dostępnych narzędzi tej klasy. Co więcej, umożliwia eksplorację podtrajektorii rozwojowych, np. różnicowania komórek macierzystych szpiku w kierunku limfocytów B, monocytów czy komórek dendrytycznych – bez konieczności ręcznego grupowania komórek i selekcji klastrów.
Dr Marcin Tabaka, Lider Grupy CGG w ICTER, współautor narzędzia Ocelli, tłumaczy:
Chcieliśmy stworzyć narzędzie, które w sposób dokładny będzie odtwarzać procesy biologiczne ukryte w wielowymiarowych danych pochodzących z profilowania multimodalnego pojedynczych komórek. Ocelli potrafi wyodrębnić i pokazać złożone ścieżki rozwoju komórek – także te rzadkie, przejściowe czy ukryte w szumie danych. To nowy krok do przodu dla analiz danych multimodalnych.
Nowe możliwości, nie tylko dla okulistyki
Ocelli otwiera nowe możliwości dla biologii rozwojowej, immunologii, onkologii czy medycyny regeneracyjnej. Dzięki precyzyjnemu odwzorowaniu dynamiki stanów komórkowych w czasie, narzędzie może być stosowane do analizy procesów takich jak różnicowanie komórek macierzystych, progresja nowotworów, odpowiedzi immunologiczne czy działanie terapii eksperymentalnych. W odróżnieniu od sieci neuronowych, Ocelli pozwala spojrzeć i zrozumieć dane jako proces – dynamiczny, ciągły, kierunkowy.
Jak podkreślają autorzy, jedną z głównych zalet narzędzia jest jego pełna transparentność, elastyczność i dostępność – kod źródłowy Ocelli jest publicznie dostępny wraz z dokumentacją i przykładami zastosowań. Pozwala to każdemu zespołowi badawczemu na dostosowanie algorytmu do własnych potrzeb, niezależnie od rodzaju analizowanej tkanki.
Źródło: Piotr Rutkowski, Marcin Tabaka (2025). Ocelli: an open-source tool for the analysis and visualization of developmental multimodal single-cell data. NAR Genomics and Bioinformatics.
DOI: https://doi.org/10.1093/nargab/lqaf040
Autor: Redaktor Naukowy Marcin Powęska