Analiza slik z umetno inteligenco za nadzor kakovosti celičnih kultur

V podjetju Cytion se zavedamo, da je vizualno ocenjevanje zdravja celičnih kultur temeljnega pomena za proizvodnjo visokokakovostnih celic in celičnih linij. Tradicionalni nadzor kakovosti, ki temelji na mikroskopiji, se v veliki meri zanaša na človeško strokovno znanje in subjektivno razlago, ki se lahko med izvajalci in skozi čas razlikuje. Analiza slik, ki jo poganja umetna inteligenca, ta subjektivni postopek spremeni v objektiven, kvantitativen in razširljiv sistem nadzora kakovosti, ki zagotavlja dosledno kakovost izdelkov v vseh naših ponudbah celičnih linij. Z uporabo algoritmov globokega učenja, vključno z arhitekturami U-Net za segmentacijo, modeli ResNet-50 in EfficientNet za klasifikacijo ter naprednimi tehnikami računalniškega vida, kot so transferno učenje in metode ansambla, lahko zaznamo subtilne spremembe v morfologiji celic, prej ugotovimo kontaminacijo in sprejmemo podatkovno podprte odločitve o zdravju kulture in pripravljenosti za nadaljnje aplikacije. Naši sistemi umetne inteligence mesečno obdelajo več kot 50.000 slik iz naše proizvodnje celic HeLa, HEK293 in drugih kritičnih celičnih linij ter zagotavljajo dosledno oceno kakovosti z natančnostjo, ki presega 95 % pri več parametrih.

Sposobnost analize z umetno inteligenco	Uporaba za nadzor kakovosti	Prednost pred ročnim ocenjevanjem
Avtomatizirano merjenje konfluence	Določanje optimalnega časa prehoda	±2 % natančnost v primerjavi z ±15-20 % ročnih odstopanj
Klasifikacija morfologije	Odkrivanje fenotipskih sprememb in diferenciacije	Prepozna subtilne spremembe, ki jih človeško oko ne vidi
Odkrivanje kontaminacije	Zgodnje prepoznavanje bakterij, glivic in mikoplazme	Odkrivanje 24-48 ur prej kot vizualni pregled
Ocena vitalnosti	Neinvazivno spremljanje zdravja celic	Neprekinjeno spremljanje brez testov na osnovi barvil
Fenotipizacija po več parametrih	Celovita karakterizacija celičnih linij	Hkratna analiza več kot 50 lastnosti v primerjavi s 3-5 ročnimi

Revolucija globokega učenja v analizi celičnih slik

Uporaba globokega učenja pri slikovni analizi celičnih kultur predstavlja temeljni premik v načinu pristopa k nadzoru kakovosti. Za razliko od tradicionalnih algoritmov za analizo slik, ki zahtevajo eksplicitno programiranje funkcij za zaznavanje, se lahko modeli globokega učenja samodejno naučijo ustreznih funkcij iz več tisoč učnih slik. V podjetju Cytion smo razvili lastne arhitekture konvolucijskih nevronskih mrež (CNN), ki temeljijo na preverjenih modelih, kot so U-Net za semantično segmentacijo (prepoznavanje meja celic z natančnostjo na ravni pikslov), ResNet-50 za ekstrakcijo značilnosti (učenje hierarhičnih predstavitev iz surovih pikslov) in EfficientNetB4 za naloge klasifikacije (razlikovanje zdravih celic od obremenjenih). Naši modeli so usposobljeni na obsežnih podatkovnih bazah slik - trenutno > 150 000 anotiranih slik, ki zajemajo več kot 200 vrst celic, več številk prehodov (P2-P30), različne pogoje gojenja (standardni, stresni, onesnaženi) in različne načine slikanja (fazni kontrast, svetlo polje, fluorescenca). Ti modeli dosegajo > 95-odstotno natančnost pri ocenjevanju konfluence, > 92-odstotno občutljivost pri odkrivanju kontaminacije in > 88-odstotno natančnost pri razvrščanju morfologije. V postopku usposabljanja se uporabljajo tehnike povečanja podatkov (vrtenje, obračanje, prilagajanje svetlosti, elastična deformacija) za izboljšanje robustnosti modela in prenos učenja iz predhodno usposobljenih uteži omrežja ImageNet za pospešitev konvergence. Usposabljanje modela se izvaja na gručah grafičnih procesorjev NVIDIA A100 z velikostjo serije 32-64 slik in časom usposabljanja 12-48 ur, odvisno od kompleksnosti modela, z uporabo Adamovega optimizatorja z načrtovanjem stopnje učenja in zgodnjo ustavitvijo na podlagi uspešnosti validacijskega niza.

Avtomatizirano merjenje konfluence in sledenje rasti

Merjenje konfluence - določanje odstotka površine kulture, ki jo pokrivajo celice - je ena najbolj kritičnih, a subjektivnih ocen v celični kulturi. V podjetju Cytion uporabljamo arhitekture konvolucijskih nevronskih mrež U-Net, ki so posebej zasnovane za naloge semantične segmentacije, pri čemer dosegamo razvrščanje celic v primerjavi z območji ozadja na ravni pikslov z rezultati preseka nad unijo (IoU), ki presegajo 0,90. Naša implementacija U-Net vključuje kontrakcijsko pot (kodirnik) s štirimi stopnjami zmanjšanja vzorčenja z uporabo 3×3 konvolucij in 2×2 max-pooling ter ekspanzivno pot (dekoder) z večjim vzorčenjem in preskokom povezav, ki ohranjajo prostorske informacije iz prejšnjih slojev. Omrežje je usposobljeno na ročno anotiranih slikah, na katerih so strokovnjaki za celične kulture označili meje celic, pri čemer je za obravnavo neuravnoteženosti razredov uporabljena kombinacija binarne navzkrižne entropije in funkcije izgube Dice. Usposobljeni model obdela slike v velikosti 2048 × 2048 slikovnih pik v <300 ms na grafičnem procesorju in ustvari verjetnostne zemljevide po slikovnih pikah, ki so pragovi za ustvarjanje binarnih mask, iz katerih se izračuna odstotek zlitja kot (slikovne pike celic / vse slikovne pike) × 100. To avtomatizirano merjenje konfluence dosega natančnost v mejah ±2 %, ko je potrjeno z ročnimi strokovnimi opombami, v primerjavi z ±15-20 % odstopanji med različnimi človeškimi opazovalci. Poleg merjenja v eni časovni točki naš sistem spremlja konfluenco skozi čas, da ustvari krivulje rasti (izris konfluence v odvisnosti od časa s prilagajanjem eksponentne krivulje), kar omogoča izračun časa podvojitve, napoved optimalnega časa prehoda (običajno pri 80-90 % konfluence) in identifikacijo kultur, ki rastejo nenormalno počasi (> 2 standardna odklona pod pričakovano hitrostjo rasti), kar lahko kaže na senescenco celične linije, težave s kakovostjo medija ali inkubatorja. Za naš katalog celic in celičnih linij to natančno sledenje rasti zagotavlja optimalno časovno razporeditev spravila, ki povečuje kakovost in vitalnost celic.

Morfološka analiza in stabilnost fenotipov

Morfologija celic zagotavlja bogate informacije o zdravju, identiteti in funkcionalnem stanju celic. V podjetju Cytion pridobivamo celovite morfološke značilnosti z algoritmi računalniškega vida in ekstrakcijo značilnosti na podlagi globokega učenja. Po segmentaciji celic izračunamo klasične morfološke deskriptorje, vključno s površino celic (µm²), obodom (µm), krožnostjo (4π×območje/perimeter²), razmerjem stranic (glavna os/minorna os), trdnostjo (površina/površina konveksne lupine) in značilnostmi teksture na podlagi matrik sive ravni pojavljanja (GLCM), ki vključujejo kontrast, korelacijo, energijo in homogenost. Poleg tega uporabljamo konvolucijske mreže ResNet-50, ki so bile predhodno usposobljene na omrežju ImageNet in natančno nastavljene na našem naboru podatkov o slikah celic, da bi pridobili 2 048-dimenzionalne globoke vektorje značilnosti, ki zajemajo subtilne morfološke vzorce, ki jih ni lahko opisati z ročno izdelanimi značilnostmi. Te večstopenjske značilnosti (ki združujejo tradicionalno morfometrijo z globokimi značilnostmi) so vhodni podatki za klasifikatorje Random Forest (100 dreves, Ginijev kriterij nečistosti) ali Support Vector Machines (jedro RBF, C=1,0, gamma=auto), ki razlikujejo normalno morfologijo od aberantnih fenotipov s >92 % natančnostjo. Za nadzor kakovosti vzdržujemo referenčne morfološke profile za vsako celično linijo v našem katalogu - na primer celice HeLa imajo značilno epitelijsko morfologijo s povprečno površino 450±80 µm² in krožnostjo 0,65±0,12, medtem ko imajo celice HEK293 površino 380±70 µm² z večjo krožnostjo 0,72±0,10. Pri zaznavanju morfološkega zdrsa se uporablja Hotellingova statistika T² za preverjanje, ali morfologija trenutne serije bistveno odstopa od referenčne porazdelitve (prag p<0,05), pri čemer se kulture označijo za pregled, kadar se zaznajo fenotipske spremembe, ki lahko kažejo na neželeno diferenciacijo, genetski zdrs ali suboptimalne pogoje gojenja.

Zgodnje odkrivanje kontaminacije

Kontaminacija je ena od najresnejših groženj za delovanje celičnih kultur, ki lahko povzroči izgubo kultur, izgubo virov in slabše rezultate poskusov. V družbi Cytion smo razvili specializirane modele za odkrivanje kontaminacije, ki smo jih usposobili na kuriranih naborih podatkov o kontaminiranih kulturah, vključno z bakterijsko kontaminacijo (za katero je značilno hitro povečanje količine drobnih delcev, motnost medija, spremembe pH, vidne kot spremembe barve v mediju, ki vsebuje fenol rdeče), glivično kontaminacijo (vidno kot mikcijske strukture, spore) in okužbo z mikoplazmo (subtilne morfološke spremembe, zmanjšana hitrost rasti, večja zrnavost). Naš sistem za zaznavanje uporablja arhitekturo EfficientNetB4 (16,8 milijona parametrov, sestavljeno skaliranje globine, širine in ločljivosti), ki je usposobljena z dvostopenjskim pristopom: prvič, razvrščanje v kategorije čistih in okuženih (binarna izguba navzkrižne entropije, dosežena AUC-ROC 0,96); drugič, večrazredna klasifikacija, ki določa vrsto okužbe (kategorična navzkrižna entropija, 85 % natančnost v kategorijah bakterije/glivice/mikoplazme/kvas). Modeli analizirajo več značilnosti slik, vključno z nenavadnimi porazdelitvami delcev (zaznanimi z algoritmi za zaznavanje kapljic), spremembami videza medija (barvni premiki, kvantificirani v barvnem prostoru LAB) in nenormalnimi vzorci morfologije celic. Analiza časovnih vrst, ki primerja trenutne slike s 24- do 48-urno zgodovinsko osnovo, omogoča odkrivanje razvijajoče se kontaminacije, preden ta postane vizualno očitna za operaterje, kar običajno zagotavlja 24-48 ur zgodnejše opozorilo v primerjavi z ročnim pregledom. Ko verjetnost kontaminacije preseže prag 0,7, samodejna opozorila obvestijo osebje za kontrolo kakovosti prek e-pošte in obvestil LIMS ter sprožijo takojšnjo preiskavo, vključno z vizualno potrditvijo, barvanjem po Gramu (za bakterijsko kontaminacijo) in testiranjem mikoplazme PCR. S tem nadzorom kontaminacije, podprtim z umetno inteligenco, se je v podjetju Cytion zaradi zgodnejšega odkrivanja in posredovanja zmanjšalo število izgub serij, povezanih s kontaminacijo, za 60 %, kar je še posebej dragoceno za dolgoročne kulture in projekte razvoja celičnih linij visoke vrednosti, pri katerih bi kontaminacija v poznih fazah postopka pomenila veliko izgubo virov.

Neinvazivno ocenjevanje vitalnosti

Tradicionalno ocenjevanje viabilnosti z uporabo tripanovega modrega ali drugih barvil, ki prepuščajo membrano, zahteva vzorčenje celic iz kulture, kar je destruktivno in omejuje časovno ločljivost. V podjetju Cytion smo razvili modele za napovedovanje viabilnosti na podlagi morfologije, ki ocenjujejo viabilnost celic iz slik svetlega polja ali fazno kontrastnih slik brez oznak z uporabo strojnega učenja. Pristop temelji na opazovanju, da umirajoče in mrtve celice kažejo značilne morfološke spremembe: krčenje celic, izločanje membrane, granulacijo citoplazme, izgubo adhezije med celico in substratom ter povečan lom svetlobe. Iz posameznih segmentiranih celic smo pridobili 156 morfoloških in teksturnih značilnosti, nato pa smo z izbiro značilnosti (rekurzivna eliminacija značilnosti z navzkrižno potrditvijo) določili 35 najbolj napovednih značilnosti, vključno s površino celice, nepravilnostjo oboda, povprečno intenzivnostjo piksla, varianco intenzivnosti in teksturnimi deskriptorji GLCM. Regresijski modeli z gradientno ojačitvijo (XGBoost z 200 ocenjevalci, stopnja učenja 0,1, največja globina 6), usposobljeni na teh lastnostih, napovedujejo odstotek viabilnosti z R²=0,87, ko so potrjeni z zlatimi standardnimi meritvami izključitve tripanskega modrila, izvedenimi na vzporednih vzorcih. Model je bil usposobljen na 12 000 parih slika-življenjskost, ki zajemajo razpone življenskosti od 50 % do 99 % pri različnih vrstah celic in številu prehodov. Za spremljanje proizvodnje sistem obdeluje slike, ki jih sistemi za analizo živih celic IncuCyte zajamejo vsake 2-4 ure, in tako ustvarja neprekinjene podatke o gibanju viabilnosti, ne da bi pri tem motili kulture. Nenadni padci vitalnosti (> 10 % zmanjšanje v 12 urah) sprožijo opozorila za preiskavo, medtem ko postopni trendi upadanja obveščajo o odločitvah glede časa prehodov - običajno prehode izvajamo pri > 90 % predvidene vitalnosti, da ohranimo zdravje celic. To neinvazivno spremljanje vitalnosti je še posebej dragoceno za suspenzijske kulture in bioreaktorske sisteme, kjer je tradicionalno vzorčenje bolj moteče, ter za presejalne poskuse, kjer je ohranjanje celovitosti kulture ob spremljanju zdravja celic bistvenega pomena.

Večparametrsko ocenjevanje kakovosti

Namesto da bi se zanašali na posamezne metrike, lahko sistemi umetne inteligence v celovite ocene kakovosti vključijo več slikovnih parametrov. V podjetju Cytion smo razvili celovite modele za ocenjevanje kakovosti, ki združujejo konfluenco (cilj 80-90 % za prehod), morfološko oceno (lestvica 0-100, >75 pomeni normalno morfologijo), oceno vitalnosti (cilj >90 %), tveganje kontaminacije (prag verjetnosti <0,1) in uniformnost kulture (koeficient variacije velikosti/oblike celic, cilj <20 %) v splošno oceno kakovosti z uporabo metod tehtanega sklopa. Ansambel združuje napovedi specializiranih modelov: U-Net confluence (utež 0,25), morfološkega klasifikatorja ResNet-50 (utež 0,30), detektorja kontaminacije EfficientNet (utež 0,25), regresije viabilnosti XGBoost (utež 0,15), pri čemer so uteži optimizirane z mrežnim iskanjem na validacijskih nizih s pridržanim preverjanjem, da se čim bolj poveča korelacija s strokovnimi odločitvami QC. Končna ocena QC je od 0 do 100, pri čemer veljajo avtomatizirana pravila odločanja: ocena ≥85 = uspešno (nadaljuj s predelavo/skladiščenjem), 70-84 = mejno (označi za ročni pregled), <70 = neuspešno (preiskuj ali zavrzi). Te večparametrske ocene zagotavljajo objektivna, kvantitativna merila za odločitve o sprostitvi v proizvodnjo - v podjetju Cytion morajo kulture doseči oceno QC ≥ 85, preden se nadaljuje z naslednjim prehodom ali končnim spravilom, kar zagotavlja stalno kakovost proizvoda. Analiza naših proizvodnih podatkov kaže močno korelacijo (r=0,82) med ocenami AI QC in metrikami uspešnosti kultur v nadaljevanju, vključno z vitalnostjo po prehodu in uspešnostjo širjenja, kar potrjuje napovedno vrednost integriranega pristopa ocenjevanja. Avtomatizirani sistem točkovanja obdela celotne slike mikroploščic (96 vdolbinic) v 8-12 minutah v primerjavi s 45-60 minutami za ročni mikroskopski pregled, kar omogoča sprejemanje odločitev o QC v realnem času, zaradi česar se proizvodni delovni tokovi učinkovito izvajajo.

Učenje s prenosom in prilagajanje modelov

Eden od izzivov pri uvajanju umetne inteligence za analizo celičnih kultur je potreba po velikih naborih učnih podatkov, zlasti za specializirane ali redke celične linije. Prenosno učenje to rešuje tako, da začne z modeli, ki so predhodno usposobljeni na velikih splošnih naborih podatkov o slikah (ImageNet z 1,4 milijona slik in 1000 kategorijami), nato pa jih natančno prilagodi na slikah, specifičnih za celične kulture. V podjetju Cytion v veliki meri uporabljamo transferno učenje: svoje modele inicializiramo s predhodno usposobljenimi utežmi ImageNet (npr. ResNet-50, EfficientNetB4), nato pa končne plasti ali celotno omrežje natančno prilagodimo z uporabo naših zbirk podatkov o slikah celic, pri čemer so zahteve po podatkih za usposabljanje bistveno manjše. Za razvoj novega morfološkega klasifikatorja de novo je na primer potrebnih več kot 10 000 anotiranih slik, medtem ko prenosno učenje doseže primerljivo učinkovitost z 1 000-2 000 slikami. Naš protokol natančnega prilagajanja uporablja nižje stopnje učenja (1e-4 do 1e-5) v primerjavi z učenjem od začetka (1e-2 do 1e-3), običajno trenira 20-50 epoh z zgodnjo ustavitvijo na podlagi platoja izgube pri potrjevanju in uporablja diskriminativne stopnje učenja, pri katerih se zgodnje plasti (splošne značilnosti) posodabljajo počasi, medtem ko se poznejše plasti (značilnosti za posamezne celice) posodabljajo hitreje. Za nove celične linije, dodane v naš katalog celic in celičnih linij, izvajamo neprekinjeno učenje, pri katerem se modeli periodično ponovno usposabljajo z zbranimi slikami iz proizvodnih serij, običajno gre za četrtletne posodobitve, ki vključujejo 500-1000 novih potrjenih slik, kar ohranja natančnost modela, ko se naš portfelj celičnih linij širi. Tehnike prilagajanja domene, kot sta MMD (Maximum Mean Discrepancy) in nasprotno usposabljanje, pomagajo modelom posplošiti med platformami za slikanje - usposabljamo na podatkih iz več mikroskopskih sistemov (IncuCyte, ImageXpress, EVOS), da zagotovimo zanesljivo delovanje ne glede na strojno opremo za zajem.

Razložljiva umetna inteligenca in zagotavljanje kakovosti

Čeprav lahko modeli globokega učenja dosežejo impresivno natančnost, je lahko njihova narava "črne škatle" problematična za aplikacije nadzora kakovosti, kjer je pomembno razumevanje podlage za odločitve. V podjetju Cytion izvajamo tehnike razložljive umetne inteligence (XAI), da so odločitve modelov razumljive in vredne zaupanja. Uporabljamo Grad-CAM (Gradient-weighted Class Activation Mapping) za izdelavo toplotnih zemljevidov, ki poudarjajo, katera območja slike so najbolj vplivala na odločitve o razvrstitvi - na primer prikaz, da se odkrivanje kontaminacije osredotoča na delce ostankov in spremembe morfologije, ne pa na nepomembne značilnosti ozadja. Vrednosti SHAP (SHapley Additive exPlanations) kvantificirajo prispevek vsake lastnosti k posameznim napovedim, pri čemer je razvidno, da so napovedi zlitja odvisne predvsem od gostote celic in metrike pokritosti, medtem ko so napovedi vitalnosti močno odvisne od lastnosti integritete membrane in citoplazemske teksture. Za klasifikacijo morfologije vizualiziramo naučene filtre v konvolucijskih plasteh in pokažemo, da zgodnje plasti zaznajo robove in teksture, medtem ko globlje plasti prepoznajo vzorce, značilne za celice, kot je tvorba epitelijskih listov v celicah HeLa ali nevronom podobni procesi v diferenciranih vrstah celic. Te vizualizacije XAI služijo več namenom: krepitvi zaupanja med osebjem za kontrolo kakovosti, ki lahko preveri, ali umetna inteligenca sprejema odločitve na podlagi biološko pomembnih lastnosti, lažji odpravi težav ob nepričakovanih napovedih z ugotavljanjem, katere lastnosti so vodile odločitev, in zagotavljanju gradiva za usposabljanje novega osebja, ki pokaže, katere lastnosti so pomembne za oceno kakovosti. Vzdržujemo nadzorno ploščo XAI, ki prikazuje vizualizacije pojasnil za označene ali mejne kulture, kar omogoča hiter strokovni pregled s kontekstom o tem, zakaj je UI pripravila svojo oceno. Ta preglednost je bila ključnega pomena za regulativno sprejemanje kontrole kakovosti na podlagi umetne inteligence - naši validacijski paketi za proizvodnjo GMP vključujejo reprezentativne vizualizacije XAI, ki dokazujejo, da modeli sprejemajo odločitve na podlagi znanstveno utemeljenih meril, usklajenih s tradicionalnimi načeli strokovnega ocenjevanja.

Vključevanje analiz z visoko vsebnostjo

Analiza slik, ki jo poganja umetna inteligenca, se brez težav povezuje s platformami za slikanje z visoko vsebnostjo, ki zajemajo več fluorescenčnih kanalov, izvajajo samodejno Z-stacking in s precizno robotiko slikajo celotne plošče z več jamicami. V podjetju Cytion uporabljamo sisteme Molecular Devices ImageXpress Micro Confocal, ki zajemajo do 6 fluorescenčnih kanalov (DAPI, FITC, TRITC, Texas Red, Cy5, Cy5.5) in prepuščeno svetlobo, z avtomatiziranim Z-stackingom (1-50 ravnin, koraki 0,5-10 µm) in natančnim pozicioniranjem stojala XY (natančnost ±1 µm). Za aplikacije z visoko vsebnostjo, kot je ocenjevanje učinkovitosti diferenciacije matičnih celic, uporabljamo imunofluorescenčno barvanje za linearne označevalce, ki mu sledi analiza z umetno inteligenco: segmentacija celic na podlagi jedrnega barvanja (kanal DAPI, algoritem watershed), razvrstitev na pozitivne in negativne označevalce na podlagi pragov intenzivnosti fluorescence (optimizirano po Otsuovi metodi) in količinska opredelitev učinkovitosti diferenciacije kot odstotek celic, pozitivnih na označevalce. Večkanalna analiza omogoča prefinjeno fenotipizacijo - hkratno kvantifikacijo jedrne morfologije (velikost, oblika, kondenzacija DNK iz DAPI), lokalizacije proteinov (jedrska proti citoplazemski prek analize kolokacije kanalov) in stanja celičnega cikla (na podlagi histogramov vsebnosti DNK iz integrirane intenzivnosti DAPI). Pri inženirskih celičnih linijah z reporterskimi konstrukti se s slikanjem z visoko vsebnostjo v kombinaciji z analizo umetne inteligence pregledajo knjižnice klonov: pridobi se fluorescenca GFP za potrditev izražanja transgena, izmeri se porazdelitev intenzivnosti izražanja za oceno heterogenosti klonov (ciljni CV <25 %) in korelira izražanje z morfologijo za določitev stabilnih klonov z visokim izražanjem. Naši delovni postopki z visoko vsebnostjo dnevno ustvarijo od 50 do 100 GB slikovnih podatkov, kar zahteva učinkovito upravljanje podatkov (samodejno stiskanje, shranjevanje v oblaku na AWS S3) in visokozmogljivo računalništvo (analiza s pospeševanjem z grafičnimi procesorji na gručah NVIDIA A100, ki obdelujejo 200 slik na minuto). Kombinacija strojne opreme za slikanje z visoko vsebnostjo, ki ustvarja bogate večdimenzionalne nabore podatkov, in programske opreme za analizo umetne inteligence, ki iz vsake seje slikanja pridobi največ informacij, nam omogoča izvajanje zahtevne karakterizacije celičnih linij in nadzora kakovosti, kar bi bilo z ročno analizo nemogoče.

Časovna analiza in dinamično spremljanje

Mikroskopija s časovnim zamikom zagotavlja dragocene informacije o obnašanju celic skozi čas, vključno s hitrostjo delitev, migracijskimi vzorci in odzivi na okoljske spremembe. V podjetju Cytion uporabljamo sisteme Sartorius IncuCyte S3, ki zajemajo slike v 15-minutnih do 2-urnih intervalih neprekinjeno do 14 dni, pri čemer ustvarjajo podatkovne nize časovnih nizov s 100-1000 slikami na gojišče. Analiza umetne inteligence teh časovnih zaporedij vključuje: sledenje posameznim celicam z algoritmi, kot sta TrackMate ali DeepCell, za sledenje posameznim celicam v vseh posnetkih, merjenje časa delitve z zaznavanjem mitotičnih dogodkov (zaokrožitev celic, poznejša ločitev hčerinskih celic), količinsko določanje hitrosti in smeri migracije celic (srednji kvadratni premik, dolžina vztrajanja) ter prepoznavanje dogodkov celične smrti (značilne spremembe morfologije, odcepitev celic). Pri sledenju delitvam dosežemo 87-odstotno natančnost pri odkrivanju mitoze z uporabo 3D konvolucijskih mrež (arhitektura C3D), ki analizirajo prostorsko-časovne značilnosti v oknih 5 sličic, kar omogoča samodejni izračun časa podvojitve populacije, ki močno korelira (r=0,91) z ročnimi meritvami štetja celic. Analiza migracije uporablja algoritme optičnega toka in segmentacijo celic, ki temelji na globokem učenju, za sledenje centroidom celic od okvirja do okvirja, izračun hitrosti (µm/uro) in kemotaktičnih indeksov za migracijske teste. Časovni podatki razkrivajo dinamično vedenje, ki je nevidno na slikah z eno časovno točko: identificirali smo celične linije s cirkadianimi oscilacijami hitrosti proliferacije, odkrili heterogene hitrosti delitev znotraj kultur, ki kažejo na strukturo subpopulacij, in opisali kinetiko odziva na spremembe medijev za celične kulture ali zdravljenje z zdravili. Pri nadzoru kakovosti je spremljanje s časovnim zamikom zgodnje opozarjanje na težave - zaustavitev rasti (odsotnost delitev za več kot 24 ur) ali povišano stopnjo umiranja (> 5 % celic z apoptotično morfologijo v 24 urah) zaznamo veliko hitreje kot meritve končnih točk. Bogati časovni podatki omogočajo tudi napovedno modeliranje: z uporabo kinetike zgodnje faze rasti (prvih 24-48 ur) za napovedovanje končnih donosov celic, ki je bila usposobljena z rekurentnimi nevronskimi mrežami (arhitektura LSTM s 128 skritimi enotami), smo dosegli 82 % natančnost pri napovedovanju, ali bodo kulture dosegle ciljno gostoto v predvidenem času.

Standardizacija na različnih platformah za slikanje

Različni mikroskopi, kamere in pogoji slikanja lahko ustvarijo slike z različnimi značilnostmi, kar lahko zmede modele umetne inteligence, ki so bili usposobljeni na slikah z določene platforme. V podjetju Cytion se z raznolikostjo med platformami ukvarjamo s celovitimi postopki za predobdelavo in normalizacijo slik, ki se izvajajo v Pythonu z uporabo knjižnic OpenCV in scikit-image. Naš delovni postopek standardizacije vključuje: korekcijo ravnega polja za izravnavo neenakomerne osvetlitve (delitev vsake slike z referenčno sliko ravnega polja, odštevanje temnega toka), barvno normalizacijo za slike svetlega polja z uporabo ujemanja histogramov ali Reinhardovega prenosa barv, spreminjanje intenzitete na standardizirano dinamično območje ([0,1] float ali [0,255] uint8) in usklajevanje ločljivosti z bikubično interpolacijo, kadar imajo slike iz različnih sistemov različne velikosti pikslov. Pri slikah s faznim kontrastom, ki so še posebej občutljive na optične nastavitve, uporabljamo prilagajanje domen na podlagi sistema CycleGAN, ki prevede slike iz videza enega mikroskopa tako, da ustrezajo videzu drugega mikroskopa, pri čemer se usposobi na neparnih nizih slik iz obeh sistemov. Ta predobdelava zagotavlja, da modeli, ki so bili usposobljeni na slikah IncuCyte, po standardizaciji enako dobro delujejo na slikah ImageXpress ali EVOS. Učinkovitost standardizacije potrdimo z merjenjem poslabšanja učinkovitosti modelov, ko jih uporabimo na novih platformah: pred standardizacijo se natančnost zmanjša za 12-25 %, ko se modeli, usposobljeni na enem sistemu, uporabijo na drugem; po standardizaciji se poslabšanje zmanjša na <5 %. Naš standardizacijski cevovod je avtomatiziran v naši infrastrukturi za analizo slik in uporablja ustrezne transformacije na podlagi metapodatkovnih oznak, ki označujejo izvorni mikroskop, tako da slike z vseh platform tečejo skozi enotne delovne tokove analize. Ta medplatformna robustnost je bistvenega pomena za delovanje na več lokacijah in omogoča izmenjavo usposobljenih modelov v skupnosti raziskovalcev celičnih kultur, s čimer se to področje razvija preko posameznih laboratorijskih izvedb.

Integracija z laboratorijsko avtomatizacijo

Analiza slik z umetno inteligenco postane še močnejša, če je integrirana z avtomatiziranimi sistemi za celične kulture. V podjetju Cytion smo uvedli avtomatizacijo v zaprti zanki, pri kateri slikovni sistemi IncuCyte znotraj avtomatiziranih inkubatorjev (serija Liconic STX) zajemajo slike vsaki dve uri, analitični cevovodi, ki temeljijo na Pythonu, obdelajo slike v petih minutah po pridobitvi z uporabo kontejnerskih inferenčnih storitev (Docker na Kubernetes), rezultati analize pa se prek vmesnikov REST API prenesejo v naš krmilnik za avtomatizacijo Hamilton VENUS in sprožijo samodejne ukrepe. Ko na primer analiza konfluence pokaže, da so kulture dosegle 85 % (optimalna gostota prehoda), sistem samodejno ustvari seznam opravil v sistemu VENUS, ki načrtuje, da bo robot za ravnanje s tekočinami v naslednjem 4-urnem oknu izvedel operacije prehoda (aspiracijo medija, dodajanje tripsina, nevtralizacijo, štetje celic, zasajanje novih bučk). Verjetnost zaznavanja kontaminacije >0,7 takoj postavi prizadete kulture v karanteno, tako da jih premakne v izolirana območja inkubatorjev in ustvari nujna opozorila, s čimer prepreči širjenje kontaminacije. Ocene vitalnosti < 80 % prekinejo samodejno obdelavo in označijo kulture za ročni strokovni pregled. Ta integracija ustvarja avtonomne sisteme za upravljanje kultur, ki vzdržujejo optimalno zdravje celic z minimalnim človeškim posredovanjem - naši integrirani sistemi uspešno gojijo več kot 200 sočasnih celičnih linij, pri čemer se 92 % operacij prehoda izvede popolnoma samodejno, človeško sodelovanje pa je potrebno le za 8 % kultur, označenih zaradi izjemnih pogojev. Zaprta zanka vključuje varnostne blokade: Napovedi umetne inteligence pod pragovi zaupanja (običajno 0,75) sprožijo ročni pregled in ne samodejnih ukrepov, vse samodejne odločitve pa se zabeležijo s podatki o razlagi za sledljivost in nenehno izboljševanje. Spremljanje delovanja sistema spremlja ključne metrike, vključno z lažno pozitivnimi stopnjami za odkrivanje kontaminacije (cilj <2%), accuracy of confluence-based passage timing (>90 % prehodov se zgodi pri 80-95-odstotni zlitosti) in korelacijo med napovedano in izmerjeno vitalnostjo po prehodu (r>0,8), s četrtletnimi pregledi pa se zagotavlja, da je delovanje v skladu s specifikacijami.

Ustvarjanje učnih podatkov in anotacija

Uspešnost modelov umetne inteligence je v veliki meri odvisna od kakovosti in količine podatkov za usposabljanje. V podjetju Cytion vzdržujemo obsežne, skrbno anotirane zbirke podatkov o slikah, ki zajemajo vse naše celične linije v različnih pogojih in številkah prehodov, trenutno pa skupaj vsebujejo > 150 000 anotiranih slik, ki predstavljajo > 2 000 ur strokovnega anotiranja. Naša strategija anotiranja združuje več pristopov: ročno anotiranje, ki ga izvajajo strokovnjaki s področja celičnih kultur z uporabo orodij, kot sta LabelImg in VGG Image Annotator (VIA) za segmentacijske maske in oznake razredov, polavtomatsko anotiranje, kjer začetne napovedi umetne inteligence pregledajo in popravijo strokovnjaki (kar skrajša čas anotiranja za 60 % ob ohranjanju natančnosti), in aktivno učenje, kjer modeli prepoznajo slike z visoko negotovostjo napovedi za prednostno anotiranje, osredotočeno na mejne primere. Vzdržujemo strog nadzor kakovosti anotacij s testiranjem zanesljivosti med izvajalci - trije neodvisni anotatorji označijo podskupine 100 slik in dosežejo Cohenovo kappa >0,85 za klasifikacijske naloge in IoU >0,90 za segmentacijske anotacije, kar potrjuje doslednost anotacij. Za nenehno izboljševanje izvajamo sistematične protokole za zbiranje podatkov: vse produkcijske slike se samodejno arhivirajo z metapodatki (celična linija, prehod, datum, sistem za slikanje, pogoji gojenja), redne serije se anotirajo s strani strokovnjakov, kar povečuje raznolikost učnih nizov, slike, povezane z napakami kontrole kakovosti ali nenavadnimi dogodki, pa se prednostno anotirajo, da se izboljša obravnava robnih primerov. Povečanje podatkov poveča učinkovito velikost učnega nabora: rotacije (0-360°), horizontalni/vertikalni obrati, prilagoditev svetlosti/kontrasta (±20 %), elastične deformacije (simulacija variacij polja mikroskopa) in dodajanje Gaussovega šuma (σ=0,1) ustvarjajo povečane variante med usposabljanjem, kar učinkovito 10-krat poveča število podatkov za usposabljanje in hkrati izboljša odpornost modela na naravne variacije slik. Za posebne izzive pripravljamo tudi specializirane nabore podatkov: nabor podatkov o odkrivanju kontaminacije vključuje več kot 5 000 slik kultur, okuženih z bakterijami, glivami in mikoplazmo; nabor podatkov o redki morfologiji zajema nenavadne fenotipe, ostanke in artefakte; nabor podatkov o več fazah spremlja posamezne celične linije v obdobju P5-P30 in dokumentira staranje in fenotipski premik. Ta celovita, dobro pripravljena infrastruktura podatkov za usposabljanje je temeljnega pomena za natančnost in zanesljivost naših sistemov za nadzor kakovosti, ki jih poganja umetna inteligenca.

Potrjevanje modelov in spremljanje učinkovitosti

Pred uporabo modelov umetne inteligence za odločanje o nadzoru kakovosti je bistvena stroga validacija. V družbi Cytion upoštevamo strukturirane protokole potrjevanja, ki so usklajeni s smernicami FDA o potrjevanju programske opreme in strojnem učenju za medicinske pripomočke (veljavna načela za proizvodnjo celic GMP): med razvojem izvedemo k-kratno navzkrižno validacijo (k=5), da ocenimo posplošljivost modela; ocenimo uspešnost na zadržanih testnih nizih, ki jih med usposabljanjem nismo videli, z uporabo obsežnih metrik, vključno z natančnostjo, točnostjo, odpoklicem, F1-oceno za naloge klasifikacije, R², MAE, RMSE za naloge regresije in krivuljami AUC-ROC za napovedi verjetnosti; primerja napovedi umetne inteligence z zlatimi standardnimi meritvami (strokovna ročna ocena, pretočna citometrija za vitalnost, štetje v mikroskopski mreži za konfluenco) v različnih preskusnih pogojih; in izvaja prospektivno validacijo, pri kateri modeli delujejo v načinu sence vzporedno s standardnim QC 3 mesece pred uvedbo in primerja napovedi z dejanskimi rezultati QC. Po uvedbi izvajamo neprekinjeno spremljanje učinkovitosti: samodejno primerjavo napovedi AI z rednimi strokovnimi pregledi (20 % kultur se vzporedno ocenjuje s strokovnjaki), spremljanje ocene zaupanja napovedi skozi čas (upadanje zaupanja lahko pomeni premikanje podatkov), korelacijsko analizo med ocenami kakovosti AI in meritvami učinkovitosti serije na nižji stopnji (vitalnost po prehodu, uspešnost širitve) ter četrtletne preglede potrjevanja, ki preučujejo učinkovitost modelov v celičnih linijah in delovnih pogojih. Vzdržujemo podrobno dokumentacijo o potrjevanju, vključno s specifikacijami arhitekture modela, značilnostmi podatkov za usposabljanje (velikost, raznolikost, kakovost anotacij), rezultati primerjalnih meril uspešnosti in zapisi o nadzoru sprememb za posodobitve modela. Ko se zmogljivost modela poslabša pod merila sprejemljivosti (npr. natančnost spajanja pade pod ±5 %, AUC za odkrivanje kontaminacije <0,90), sprožimo prekvalifikacijo ali ponovno umerjanje: zbiranje dodatnih podatkov za usposabljanje iz zadnjih proizvodnih serij, prekvalifikacija modelov s posodobljenimi nabori podatkov, preverjanje posodobljenih modelov na novih testnih naborih in izvajanje nadzorovane uporabe, pri kateri posodobljeni modeli pred polno uporabo najprej delujejo v senci. Ta strogi okvir za potrjevanje in spremljanje zagotavlja, da naša kontrola kakovosti, ki jo poganja umetna inteligenca, ohranja natančnost in zanesljivost skozi čas kljub razvijajočim se portfeljem celičnih linij, spremembam opreme za slikanje in naravnemu premikanju podatkov.

Prihodnji razvoj na področju analize slik z umetno inteligenco

Področje analize celičnih slik z umetno inteligenco še naprej hitro napreduje, nove tehnike pa obljubljajo še večje zmogljivosti. Razvoj, ki ga v podjetju Cytion aktivno spremljamo in preizkušamo, vključuje: 3D analiza slik z uporabo volumetričnih segmentacijskih mrež (3D U-Net) za organoidne in sferoidne kulture, ki omogoča merjenje velikosti, morfologije in notranje strukture organoidov iz slik Z-stack; napovedovanje fluorescence brez oznak, kjer se modeli, usposobljeni na parih slik svetlega polja/fluorescence, naučijo napovedovati vzorce fluorescence samo iz slik svetlega polja, kar lahko nadomesti nekatere zahteve po barvanju; tehnike samonadzorovanega učenja (SimCLR, BYOL), ki se naučijo uporabnih predstavitev iz neoznačenih slik in zmanjšajo zahteve po anotacijah z učenjem splošnih značilnosti celičnih slik brez ročnih oznak; temeljni modeli za celično biologijo (podobno kot GPT za jezik), predhodno usposobljeni na obsežnih različnih naborih podatkov o celičnih slikah, ki jih je mogoče natančno prilagoditi za posebne naloge z minimalnimi podatki; analiza v realnem času med slikanjem v živo z latenco sklepanja < 1 sekunda, ki omogoča takojšnje povratne informacije za avtomatizirane poskuse; in napovedni modeli, ki napovedujejo rezultate kulture za več ur ali dni vnaprej na podlagi slik zgodnje faze, usposobljeni na longitudinalnih naborih podatkov, ki povezujejo značilnosti zgodnjih slik s kakovostjo končne serije. Raziskujemo tudi multimodalno integracijo, ki združuje mikroskopske slike s podatki molekularnega profiliranja (RNA-seq, proteomika) za odkrivanje slikovnih biomarkerjev, ki napovedujejo molekularne fenotipe, in fizikalno informirane nevronske mreže, ki vključujejo biološke omejitve (dinamika celičnega cikla, kinetika porabe hranil) za izboljšanje natančnosti napovedi in zmanjšanje podatkovnih zahtev. Ko bodo te tehnologije dozorele, pričakujemo, da bomo dosegli še zgodnejše odkrivanje težav s subtilnimi predsimptomatskimi spremembami, ki so za sedanje metode nevidne, natančnejše ocene kakovosti z vključevanjem različnih podatkovnih modalitet in globlji vpogled v dejavnike, ki vplivajo na uspešnost kulture. Ta napredek bo družbi Cytion omogočil, da bo še naprej zagotavljala celice in celične linije najvišje kakovosti s še večjo doslednostjo in učinkovitostjo ter tako ohranila vodilno vlogo na področju kakovosti in inovacij.