Ląstelių kultūrų kokybės kontrolei skirtų vaizdų analizė naudojant dirbtinį intelektą

Bendrovėje "Cytion" suprantame, kad vizualinis ląstelių kultūrų būklės vertinimas yra labai svarbus norint gaminti aukštos kokybės ląsteles ir ląstelių linijas. Tradicinė mikroskopija pagrįsta kokybės kontrolė labai priklauso nuo žmogaus patirties ir subjektyvaus interpretavimo, kuris gali skirtis tarp operatorių ir laikui bėgant. Dirbtiniu intelektu paremta vaizdų analizė šį subjektyvų procesą paverčia objektyvia, kiekybine ir keičiamo mastelio kokybės kontrolės sistema, kuri užtikrina nuoseklią produktų kokybę visose mūsų siūlomose ląstelių linijose. Naudodami gilaus mokymosi algoritmus, įskaitant "U-Net" architektūrą segmentavimui, "ResNet-50" ir "EfficientNet" modelius klasifikavimui ir pažangius kompiuterinės regos metodus, tokius kaip perkėlimo mokymasis ir ansamblio metodai, galime aptikti subtilius ląstelių morfologijos pokyčius, anksčiau nustatyti užterštumą ir priimti duomenimis pagrįstus sprendimus dėl kultūros būklės ir pasirengimo tolesniam naudojimui. Mūsų dirbtinio intelekto sistemos kas mėnesį apdoroja daugiau kaip 50 000 vaizdų iš mūsų gaminamų HeLa ląstelių, HEK293 ląstelių ir kitų svarbių ląstelių linijų, užtikrindamos nuoseklų kokybės vertinimą, kurio tikslumas pagal įvairius parametrus viršija 95 %.

AI analizės galimybės	Kokybės kontrolės taikymas	Privalumas, palyginti su rankiniu vertinimu
Automatinis konfluencijos matavimas	Nustatykite optimalų išleidimo laiką	±2 % tikslumas, palyginti su ±15-20 % rankiniu būdu gautais svyravimais
Morfologijos klasifikavimas	Nustatyti fenotipinius pokyčius ir diferenciaciją	Nustato subtilius, žmogaus akiai nematomus pokyčius
Užterštumo nustatymas	Ankstyvas bakterijų, grybelių, mikoplazmų identifikavimas	Aptikimas 24-48 valandomis anksčiau nei vizualinė apžiūra
Gyvybingumo įvertinimas	Neinvazinė ląstelių būklės stebėsena	Nuolatinė stebėsena be dažais pagrįstų tyrimų
Daugiaparametrinis fenotipavimas	Išsamus ląstelių linijos apibūdinimas	Vienu metu analizuojama daugiau kaip 50 požymių, palyginti su 3-5 rankiniu būdu atliktomis analizėmis

Giluminio mokymosi revoliucija ląstelių vaizdų analizėje

Gilaus mokymosi taikymas ląstelių kultūrų vaizdų analizei reiškia esminį pokytį mūsų požiūryje į kokybės kontrolę. Skirtingai nuo tradicinių vaizdų analizės algoritmų, kuriems reikia aiškiai suprogramuoti aptinkamus požymius, gilaus mokymosi modeliai gali automatiškai išmokti atitinkamų požymių iš tūkstančių mokomųjų vaizdų. Bendrovėje "Cytion" sukūrėme individualias konvoliucinių neuroninių tinklų (CNN) architektūras, pagrįstas patikrintais modeliais, tokiais kaip U-Net, skirtais semantiniam segmentavimui (ląstelių ribų nustatymui pikselio tikslumu), ResNet-50, skirtais požymių išskyrimui (hierarchinių reprezentacijų mokymuisi iš neapdorotų pikselių), ir EfficientNetB4, skirtais klasifikavimo užduotims (sveikų ląstelių atskyrimui nuo įtemptų). Mūsų modeliai yra apmokyti naudojant dideles vaizdų duomenų bazes - šiuo metu > 150 000 anotuotų vaizdų, apimančių daugiau nei 200 ląstelių tipų, daugybę eigų (P2-P30), įvairias kultūrų sąlygas (standartinės, stresinės, užterštos) ir įvairius vaizdavimo būdus (fazės kontrasto, šviesaus lauko, fluorescencijos). Šie modeliai pasiekia > 95 % tikslumą nustatant susiliejimą, > 92 % jautrumą nustatant užterštumą ir > 88 % tikslumą klasifikuojant morfologiją. Mokymo procese taikomi duomenų papildymo metodai (pasukimas, apvertimas, ryškumo koregavimas, tampri deformacija), kad būtų pagerintas modelio patikimumas, ir perkeliamasis mokymasis iš "ImageNet" iš anksto apmokytų svorių, kad būtų pagreitinta konvergencija. Modelis mokomas NVIDIA A100 GPU klasteriuose, kai partijos dydis yra 32-64 vaizdai, o mokymo trukmė - 12-48 valandos, priklausomai nuo modelio sudėtingumo, naudojant Adamo optimizatorių su mokymosi greičio planavimu ir ankstyvu sustabdymu, pagrįstu patvirtinimo rinkinio rezultatais.

Automatizuotas konfluencijos matavimas ir augimo stebėjimas

Confluence matavimas - nustatymas, kokį procentą kultūros paviršiaus dengia ląstelės - yra vienas svarbiausių, tačiau subjektyviausių vertinimų ląstelių kultūroje. "Cytion" naudoja "U-Net" konvoliucinių neuroninių tinklų architektūrą, specialiai sukurtą semantinio segmentavimo užduotims, ir pasiekia ląstelių ir fono regionų klasifikavimą pikselių lygmeniu, kai susikirtimo su sąjunga (IoU) balai viršija 0,90. Mūsų "U-Net" įgyvendinimas apima susitraukimo kelią (koduotoją) su 4 mažinimo etapais, naudojant 3×3 konvoliucijas ir 2×2 maksimalų telkimą, ir plečiamąjį kelią (dekoderį) su didinimo ir praleidimo jungtimis, išsaugančiomis ankstesnių sluoksnių erdvinę informaciją. Tinklas apmokytas naudojant rankiniu būdu anotuotus vaizdus, kuriuose ląstelių kultūrų mokslininkai ekspertai pažymėjo ląstelių ribas, o klasių disbalansui tvarkyti naudojamas dvejetainės kryžminės entropijos ir Dice nuostolių funkcijų derinys. Apmokytas modelis apdoroja 2048 × 2048 pikselių vaizdus per <300 ms, naudodamas GPU, ir sukuria pikselių tikimybių žemėlapius, kurie yra slenkstiniai, kad būtų sukurtos dvejetainės kaukės, iš kurių susiliejimo procentas apskaičiuojamas kaip (ląstelių pikseliai / visi pikseliai) × 100. Šis automatinis susiliejimo matavimas pasiekia ±2 % tikslumą, kai jis tikrinamas pagal ekspertų rankiniu būdu atliktą anotaciją, palyginti su ±15-20 % skirtumais tarp skirtingų žmonių stebėtojų. Be vienkartinio matavimo, mūsų sistema stebi susiliejimą laikui bėgant, kad būtų galima sudaryti augimo kreives (konfluencijos priklausomybės nuo laiko grafikas su eksponentinės kreivės priderinimu), leidžiančias apskaičiuoti padvigubėjimo laiką, numatyti optimalų perėjimo laiką (paprastai esant 80-90 % susiliejimui) ir nustatyti neįprastai lėtai augančias kultūras (>2 standartiniai nuokrypiai nuo numatomo augimo greičio), kurios gali rodyti ląstelių linijos senėjimą, terpės kokybės problemas arba inkubatoriaus problemas. Mūsų ląstelių ir ląstelių linijų kataloge šis tikslus augimo stebėjimas užtikrina optimalų derliaus nuėmimo laiką, kuris maksimaliai padidina ląstelių kokybę ir gyvybingumą.

Morfologinė analizė ir fenotipo stabilumas

Ląstelių morfologija suteikia daug informacijos apie ląstelių sveikatą, tapatybę ir funkcinę būklę. Bendrovėje "Cytion" išsamias morfologines savybes išgauname naudodami kompiuterinės regos algoritmus ir giliuoju mokymusi pagrįstą savybių išskyrimą. Po ląstelių segmentavimo apskaičiuojame klasikinius morfologijos deskriptorius, įskaitant ląstelių plotą (µm²), perimetrą (µm), apvalumą (4π×plotas/perimetras²), kraštinių santykį (didžioji ir mažoji ašys), vientisumą (plotas/išgaubto korpuso plotas) ir tekstūros požymius, grindžiamus pilkojo lygio sutapimo matricomis (GLCM), įskaitant kontrastą, koreliaciją, energiją ir homogeniškumą. Be to, naudojame "ResNet-50" konvoliucinius tinklus, iš anksto apmokytus "ImageNet" ir tiksliai suderintus su mūsų ląstelių vaizdų duomenų rinkiniu, kad išgautume 2 048 matmenų giliuosius požymių vektorius, kurie atspindi subtilius morfologinius modelius, nesunkiai aprašomus rankiniu būdu sukurtais požymiais. Šie daugialypės skalės požymiai (derinant tradicinę morfometriją ir giliuosius požymius) įvesti į atsitiktinių miškų klasifikatorius (100 medžių, Gini priemaišų kriterijus) arba atraminių vektorių mašinas (RBF branduolys, C=1,0, gama=auto), kurie atskiria normalią morfologiją nuo aberacinių fenotipų >92 % tikslumu. Pavyzdžiui, HeLa ląstelėms būdinga epitelio morfologija, kurių vidutinis plotas 450±80 µm², apskritimiškumas 0,65±0,12, o HEK293 ląstelėms būdingas 380±70 µm² plotas ir didesnis apskritimiškumas 0,72±0,10. Morfologinio dreifo nustatymui naudojama Hotellingo T² statistika, kuria tikrinama, ar dabartinės partijos morfologija reikšmingai nukrypsta nuo etaloninio pasiskirstymo (p<0,05 slenkstis), o nustačius fenotipinius pokyčius, kurie gali rodyti nepageidaujamą diferenciaciją, genetinį dreifą arba neoptimalias kultūros sąlygas, kultūros pažymimos peržiūrėti.

Ankstyvas užterštumo nustatymas

Užterštumas yra viena didžiausių grėsmių ląstelių kultūrų veiklai, dėl kurios gali būti prarastos kultūros, iššvaistyti ištekliai ir pablogėti eksperimentų rezultatai. "Cytion" sukūrėme specializuotus užterštumo aptikimo modelius, apmokytus pagal užterštų kultūrų duomenų rinkinius, įskaitant bakterinį užterštumą (būdingas greitas smulkių dalelių priemaišų padidėjimas, terpės drumstumas, pH pokyčiai, matomi kaip fenolo raudonojo turinčios terpės spalvos pokyčiai), grybelinį užterštumą (matomas kaip micelės struktūros, sporos) ir mikoplazminę infekciją (subtilūs morfologiniai pokyčiai, sumažėjęs augimo greitis, padidėjęs grūdėtumas). Mūsų aptikimo sistemoje naudojama EfficientNetB4 architektūra (16,8 mln. parametrų, sudėtinis gylio, pločio ir skiriamosios gebos mastelio keitimas), apmokyta taikant dviejų etapų metodą: pirma, klasifikavimas į švarias ir užterštas kategorijas (dvejetainiai kryžminės entropijos nuostoliai, pasiektas AUC-ROC 0,96); antra, kelių klasių klasifikavimas, nustatant užterštumo tipą (kategorinė kryžminė entropija, 85 % tikslumas bakterijų, grybelių, mikoplazmų ir mielių kategorijose). Modeliuose analizuojamos kelios vaizdo savybės, įskaitant neįprastą dalelių pasiskirstymą (aptiktą taikant dėmių aptikimo algoritmus), terpės išvaizdos pokyčius (spalvų poslinkiai, kiekybiškai įvertinti LAB spalvų erdvėje) ir neįprastus ląstelių morfologijos modelius. Laiko eilučių analizė, lyginanti dabartinius vaizdus su 24-48 valandų istorine atskaitos linija, leidžia aptikti besiformuojantį užterštumą anksčiau, nei jis tampa vizualiai akivaizdus operatoriams, paprastai įspėjant 24-48 valandomis anksčiau, palyginti su rankiniu patikrinimu. Kai užterštumo tikimybė viršija 0,7 slenkstį, automatiniai įspėjimai elektroniniu paštu ir LIMS pranešimais informuoja kokybės kontrolės darbuotojus, todėl nedelsiant pradedamas tyrimas, įskaitant vizualinį patvirtinimą, Gramo dažymą (dėl bakterinio užterštumo) ir mikoplazmos PGR tyrimą. Dėl šios dirbtinio intelekto patobulintos užterštumo priežiūros "Cytion" 60 % sumažino su užterštumu susijusių partijų nuostolius, nes tai buvo nustatyta ir imtasi veiksmų anksčiau, o tai ypač vertinga ilgalaikėms kultūroms ir didelės vertės ląstelių linijų kūrimo projektams, kai užteršimas vėlyvuoju proceso etapu reikštų didelius išteklių nuostolius.

Neinvazinis gyvybingumo vertinimas

Tradiciniam gyvybingumo vertinimui naudojant tripano mėlynąjį ar kitus membranų nepermatomus dažus reikia paimti ląstelių mėginius iš kultūros, o tai yra destruktyvu ir riboja laiko skiriamąją gebą. "Cytion" sukūrėme morfologija pagrįstus gyvybingumo prognozavimo modelius, kurie, naudodami mašininį mokymąsi, įvertina ląstelių gyvybingumą iš beženklinių šviesaus lauko arba fazinio kontrasto vaizdų. Šis metodas pagrįstas pastebėjimu, kad mirštančios ir negyvos ląstelės pasižymi būdingais morfologiniais pokyčiais: ląstelių susitraukimu, membranos išblukimu, citoplazmos granuliacija, ląstelių ir substrato sukibimo praradimu ir padidėjusiu šviesos lūžiu. Iš atskirų segmentuotų ląstelių išskyrėme 156 morfologinius ir tekstūros požymius, paskui, naudodami požymių atranką (pasikartojantis požymių šalinimas su kryžminiu tikrinimu), nustatėme 35 labiausiai prognozuojančius požymius, įskaitant ląstelių plotą, perimetro nelygumus, vidutinį pikselių intensyvumą, intensyvumo dispersiją ir GLCM tekstūros deskriptorius. Pagal šiuos požymius apmokyti gradientinės stiprinimo regresijos modeliai (XGBoost su 200 įverčių, mokymosi greitis 0,1, didžiausias gylis 6) prognozuoja gyvybingumą procentais su R² = 0,87, kai jie patvirtinami pagal auksinio standarto tripan mėlynojo išskyrimo matavimus, atliktus su lygiagrečiais mėginiais. Modelis buvo apmokytas naudojant 12 000 vaizdų ir gyvybingumo porų, apimančių gyvybingumo intervalus nuo 50 % iki 99 % įvairiems ląstelių tipams ir išėjimo skaičiams. Gamybos stebėsenai sistema apdoroja "IncuCyte" gyvų ląstelių analizės sistemomis kas 2-4 valandas užfiksuotus vaizdus, taip generuodama nuolatinius gyvybingumo tendencijų duomenis netrikdant kultūrų. Staigus gyvybingumo sumažėjimas (>10 % sumažėjimas per 12 val.) sukelia įspėjimus, kuriuos reikia ištirti, o laipsniškai mažėjančios tendencijos padeda priimti sprendimus dėl išleidimo laiko - paprastai išleidžiame >90 % prognozuojamo gyvybingumo, kad išlaikytume ląstelių sveikatą. Ši neinvazinė gyvybingumo stebėsena ypač vertinga suspensinėms kultūroms ir bioreaktorių sistemoms, kai tradicinis mėginių ėmimas labiau trikdo veiklą, ir atrankos eksperimentams, kai svarbu išsaugoti kultūros vientisumą ir kartu stebėti ląstelių sveikatą.

Daugiaparametrinis kokybės vertinimas

Užuot pasikliovusios atskirais rodikliais, dirbtinio intelekto sistemos gali integruoti kelis vaizdų parametrus į išsamius kokybės balus. "Cytion" sukūrėme holistinius kokybės vertinimo modelius, kuriuose, taikant svertinio ansamblio metodus, į bendrą kokybės vertinimo balą sujungiami konfluencijos lygis (80-90 % perėjimo tikslas), morfologijos balas (0-100 balų skalė, >75 reiškia normalią morfologiją), gyvybingumo įvertinimas (>90 % tikslas), užteršimo rizika (<0,1 tikimybės slenkstis) ir kultūros vienodumas (ląstelių dydžio / formos variacijos koeficientas, <20 % tikslas). Ansamblis sujungia specializuotų modelių prognozes: U-Net konfluencijos (svoris 0,25), ResNet-50 morfologijos klasifikatoriaus (svoris 0,30), EfficientNet užterštumo detektoriaus (svoris 0,25), XGBoost gyvybingumo regresijos (svoris 0,15), kurių svoriai optimizuojami atliekant tinklelio paiešką pagal išlaikyto patvirtinimo rinkinius, kad būtų maksimaliai padidinta koreliacija su ekspertų sprendimais dėl kokybės kontrolės. Galutinis kokybės kontrolės balas yra 0-100 balų, taikomos automatinės sprendimų priėmimo taisyklės: balas ≥85 = teigiamas (pereiti prie perleidimo / derliaus nuėmimo), 70-84 = ribinis (pažymėti rankine peržiūra), <70 = neigiamas (ištirti arba atmesti). Šie daugiaparametriniai vertinimai yra objektyvūs kiekybiniai kriterijai, pagal kuriuos priimami sprendimai dėl išleidimo į gamybą - "Cytion" kultūroms, prieš pradedant kitą išleidimą arba galutinį derliaus nuėmimą, turi būti suteiktas ≥85 balų QC įvertinimas, taip užtikrinant pastovią produkto kokybę. Mūsų gamybos duomenų analizė rodo stiprią koreliaciją (r=0,82) tarp AI QC balų ir tolesnių kultūrų veiklos rodiklių, įskaitant gyvybingumą po perėjimo ir sėkmingą plėtrą, o tai patvirtina integruoto vertinimo metodo prognozinę vertę. Automatizuota vertinimo sistema apdoroja visus mikroplokštelių (96 duobučių) vaizdus per 8-12 minučių, palyginti su 45-60 minučių trunkančia rankine mikroskopine patikra, todėl galima priimti sprendimus dėl kokybės kontrolės realiuoju laiku, kad gamybos procesai vyktų efektyviai.

Perkėlimo mokymasis ir modelio pritaikymas

Vienas iš iššūkių diegiant dirbtinį intelektą ląstelių kultūrų analizei yra poreikis turėti didelius mokymo duomenų rinkinius, ypač specializuotų ar retų ląstelių linijų atveju. Perkėlimo mokymasis sprendžia šį uždavinį, pradedant nuo modelių, iš anksto parengtų pagal didelius bendrųjų vaizdų duomenų rinkinius (ImageNet su 1,4 mln. vaizdų, 1000 kategorijų), o vėliau juos tikslinant pagal konkrečių ląstelių kultūrų vaizdus. "Cytion" plačiai naudojame perkėlimo mokymą: savo modelius inicijuojame su "ImageNet" iš anksto apmokytais svoriais (pvz., "ResNet-50", "EfficientNetB4"), tada galutinius sluoksnius arba visą tinklą deriname naudodami savo ląstelių vaizdų duomenų rinkinius, o mokymo duomenų poreikis gerokai sumažėja. Pavyzdžiui, kuriant naują morfologijos klasifikatorių de novo gali prireikti daugiau nei 10 000 anotuotų vaizdų, o taikant perkeliamąjį mokymą panašių rezultatų pasiekiama naudojant 1 000-2 000 vaizdų. Mūsų tikslaus derinimo protokole naudojami mažesni mokymosi greičiai (nuo 1e-4 iki 1e-5), palyginti su mokymu iš naujo (nuo 1e-2 iki 1e-3), paprastai mokomasi 20-50 epochų, anksti sustabdant pagal patvirtinimo nuostolių plokštumą, ir taikomi diskriminaciniai mokymosi greičiai, kai ankstesni sluoksniai (bendrieji požymiai) atnaujinami lėtai, o vėlesni sluoksniai (konkrečios ląstelės požymiai) atnaujinami greičiau. Naujoms ląstelių linijoms, įtrauktoms į mūsų ląstelių ir ląstelių linijų katalogą, įgyvendiname nuolatinį mokymąsi, kai modeliai periodiškai permokomi naudojant sukauptus vaizdus iš gamybinių partijų, paprastai kas ketvirtį atnaujinami, įtraukiant 500-1000 naujų patvirtintų vaizdų, taip išlaikant modelio tikslumą, nes mūsų ląstelių linijų portfelis plečiasi. Tokie srities pritaikymo metodai kaip didžiausio vidutinio neatitikimo (MMD) ir priešpriešinis mokymas padeda modeliams apibendrinti įvairias vaizdavimo platformas - mes mokomės iš kelių mikroskopų sistemų ("IncuCyte", "ImageXpress", EVOS) duomenų, kad užtikrintume patikimą veikimą nepriklausomai nuo įsigijimo įrangos.

Paaiškinamasis dirbtinis intelektas ir kokybės užtikrinimas

Nors gilaus mokymosi modeliai gali pasiekti įspūdingą tikslumą, jų "juodosios dėžės" pobūdis gali būti problemiškas kokybės kontrolės programose, kuriose svarbu suprasti sprendimų pagrindą. Bendrovėje "Cytion" diegiame paaiškinamojo dirbtinio intelekto (XAI) metodus, kad modelių sprendimai būtų aiškūs ir patikimi. Taikome Grad-CAM (Gradient-weighted Class Activation Mapping), kad sukurtume šilumos žemėlapius, kuriuose išryškinama, kurie vaizdo regionai labiausiai paveikė klasifikavimo sprendimus, pavyzdžiui, parodome, kad nustatant užterštumą daugiausia dėmesio skiriama šiukšlių dalelėms ir morfologijos pokyčiams, o ne nereikšmingiems fono požymiams. SHAP (angl. SHapley Additive exPlanations) reikšmės kiekybiškai įvertina kiekvieno požymio indėlį į atskiras prognozes, atskleisdamos, kad susiliejimo prognozės pirmiausia priklauso nuo ląstelių tankio ir padengimo rodiklių, o gyvybingumo prognozės labai priklauso nuo membranos vientisumo ir citoplazmos tekstūros požymių. Morfologijos klasifikavimui išmoktus filtrus vizualizuojame konvoliuciniuose sluoksniuose, parodydami, kad ankstyvieji sluoksniai aptinka kraštus ir tekstūras, o gilesni sluoksniai atpažįsta ląstelėms būdingus modelius, pavyzdžiui, epitelio lapų formavimąsi HeLa ląstelėse arba į neuronus panašius procesus diferencijuotų tipų ląstelėse. Šios XAI vizualizacijos naudojamos įvairiais tikslais: didina QC darbuotojų pasitikėjimą, kurie gali patikrinti, ar dirbtinis intelektas priima sprendimus remdamasis biologiškai svarbiais požymiais, palengvina trikčių šalinimą, kai atsiranda netikėtų prognozių, nustatant, kokie požymiai lėmė sprendimą, ir pateikia mokymo medžiagą, kurioje naujiems darbuotojams parodoma, kokie požymiai yra svarbūs kokybės vertinimui. Mes prižiūrime XAI prietaisų skydelį, kuriame rodomi pažymėtų arba ribinių kultūrų paaiškinimai, leidžiantys greitai atlikti ekspertinę peržiūrą, nurodant kontekstą, kodėl dirbtinis intelektas atliko vertinimą. Šis skaidrumas buvo labai svarbus siekiant, kad dirbtiniu intelektu grindžiamą kokybės kontrolę pripažintų teisės aktai - į mūsų GMP gamybai skirtus patvirtinimo paketus įtrauktos reprezentatyvios XAI vizualizacijos, rodančios, kad modeliai priima sprendimus remdamiesi moksliškai pagrįstais kriterijais, suderintais su tradiciniais ekspertinio vertinimo principais.

Didelio turinio analizės integracija

AI paremta vaizdų analizė sklandžiai integruojama su didelio turinio vaizdavimo platformomis, kurios fiksuoja kelis fluorescencinius kanalus, atlieka automatinį Z-stacking ir tiksliais robotais atvaizduoja ištisas kelių duobučių plokšteles. "Cytion" naudoja "Molecular Devices ImageXpress Micro Confocal" sistemas, kurios fiksuoja iki 6 fluorescencijos kanalų (DAPI, FITC, TRITC, Texas Red, Cy5, Cy5.5) ir perduodamą šviesą, su automatiniu Z išdėstymu (1-50 plokštumų, 0,5-10 µm žingsniu) ir tiksliu XY pakopos nustatymu (±1 µm tikslumu). Didelio turinio programoms, tokioms kaip kamieninių ląstelių diferenciacijos efektyvumo vertinimas, naudojame linijinių ląstelių žymenų imunofluorescencinį dažymą, po kurio atliekama dirbtinio intelekto paremta analizė: ląstelių segmentavimas pagal branduolio dažymą (DAPI kanalas, "watershed" algoritmas), klasifikavimas į teigiamas ir neigiamas pagal fluorescencijos intensyvumo ribas (optimizuotas pagal Otsu metodą) ir diferenciacijos efektyvumo kiekybinis įvertinimas kaip teigiamų žymenų ląstelių procentinė dalis. Daugiakanalė analizė leidžia atlikti sudėtingą fenotipizaciją - vienu metu kiekybiškai įvertinti branduolio morfologiją (dydį, formą, DNR kondensaciją pagal DAPI), baltymų lokalizaciją (branduolio ir citoplazmos, naudojant kanalų kolokacijos analizę) ir ląstelės ciklo būklę (pagal DNR kiekio histogramas pagal integruotą DAPI intensyvumą). Inžinerinių ląstelių linijų su reporterio konstruktais atveju didelio turinio vaizdavimas kartu su AI analize atrenka klonų bibliotekas: įgyjama GFP fluorescencija, kad būtų patvirtinta transgeno raiška, matuojamas raiškos intensyvumo pasiskirstymas, kad būtų įvertintas klonų heterogeniškumas (CV <25 % tikslo), ir raiška siejama su morfologija, kad būtų nustatyti stabilūs didelės raiškos klonai. Mūsų didelio turinio darbo eigos kasdien generuoja 50-100 GB vaizdų duomenų, todėl reikalingas veiksmingas duomenų valdymas (automatinis suspaudimas, debesijos saugykla AWS S3) ir didelio našumo skaičiavimai (GPU spartinama analizė NVIDIA A100 klasteriuose, apdorojančiuose 200 vaizdų per minutę). Didelio turinio vaizdavimo įrangos, generuojančios gausius daugialypius duomenų rinkinius, ir dirbtinio intelekto analizės programinės įrangos, iš kiekvienos vaizdavimo sesijos išgaunančios maksimalią informaciją, derinys leidžia mums atlikti sudėtingą ląstelių linijų apibūdinimą ir kokybės kontrolę, kurios būtų neįmanoma atlikti atliekant rankinę analizę.

Laiko trukmės analizė ir dinaminė stebėsena

Laiko intervalų mikroskopija suteikia vertingos informacijos apie ląstelių elgseną laike, įskaitant dalijimosi greitį, migracijos modelius ir reakciją į aplinkos pokyčius. Bendrovėje "Cytion" naudojame "Sartorius IncuCyte S3" sistemas, kurios vaizdus fiksuoja nuo 15 minučių iki 2 valandų intervalais nepertraukiamai iki 14 dienų, taip sukurdamos laiko eilučių duomenų rinkinius, kuriuos sudaro 100-1000 vaizdų iš vienos kultūros duobutės. Šių laiko sekų AI analizė apima: pavienių ląstelių stebėjimą naudojant tokius algoritmus kaip TrackMate arba DeepCell, kad būtų galima sekti atskiras ląsteles visuose kadruose, dalijimosi laiko matavimą nustatant mitozės įvykius (ląstelių apvalėjimą, vėlesnį dukterinių ląstelių atsiskyrimą), kiekybinį ląstelių migracijos greičio ir krypties nustatymą (vidutinis kvadratinis poslinkis, išsilaikymo ilgis) ir ląstelių mirties įvykių nustatymą (būdingi morfologijos pokyčiai, ląstelių atsiskyrimas). Dalijimosi stebėjimui 87 % tikslumu aptinkame mitozę, naudodami 3D konvoliucinius tinklus (C3D architektūra), kurie analizuoja erdvėlaikio požymius 5 kadrų languose ir leidžia automatizuotai apskaičiuoti populiacijos padvigubėjimo laiką, kuris stipriai koreliuoja (r=0,91) su rankiniu ląstelių skaičiavimu. Migracijos analizei naudojami optinio srauto algoritmai ir giliuoju mokymusi pagrįstas ląstelių segmentavimas, kad būtų galima sekti ląstelių centroidus nuo kadro iki kadro, apskaičiuoti greičius (µm/val.) ir chemotaksinius indeksus migracijos tyrimams. Laiko intervalų duomenys atskleidžia dinamišką elgesį, nematomą vieno laiko taško vaizduose: nustatėme ląstelių linijas su cirkadiniais proliferacijos greičio svyravimais, aptikome nevienodą dalijimosi greitį kultūrose, rodantį subpopuliacijos struktūrą, ir apibūdinome atsako kinetiką į ląstelių kultūros terpės pokyčius ar gydymą vaistais. Kokybės kontrolei laiko intervalų stebėjimas leidžia anksti įspėti apie problemas - mes daug greičiau nei galutiniai matavimai aptinkame augimo sustabdymą (dalijimosi nebuvimas >24 valandas) arba padidėjusį mirtingumo lygį (>5 % ląstelių, turinčių apoptozės morfologiją per 24 valandas). Turtingi laiko duomenys taip pat leidžia taikyti prognozavimo modeliavimą: naudojant ankstyvosios augimo fazės kinetiką (pirmosios 24-48 valandos) prognozuoti galutinį ląstelių kiekį, apmokyti pasikartojantys neuroniniai tinklai (LSTM architektūra su 128 paslėptaisiais vienetais) pasiekia 82 % tikslumą prognozuojant, ar kultūros pasieks tikslinį tankį numatytu laiku.

Įvairių vaizdavimo platformų standartizavimas

Skirtingi mikroskopai, kameros ir vaizdavimo sąlygos gali sukurti skirtingų savybių vaizdus, todėl dirbtinio intelekto modeliai, apmokyti pagal konkrečios platformos vaizdus, gali būti klaidinantys. "Cytion" sprendžia skirtingų platformų kintamumo problemą, naudodami išsamius vaizdų pirminio apdorojimo ir normalizavimo vamzdynus, įgyvendintus "Python" kalba, naudojant "OpenCV" ir "scikit-image" bibliotekas. Mūsų standartizavimo darbo eiga apima: plokščiojo lauko korekciją siekiant kompensuoti netolygų apšvietimą (kiekvieno vaizdo padalijimas iš etaloninio plokščiojo lauko vaizdo, tamsiosios srovės atėmimas), šviesiojo lauko vaizdų spalvų normalizavimą naudojant histogramų atitikimą arba Reinhardo spalvų perkėlimą, intensyvumo perskaičiavimą į standartizuotą dinaminį diapazoną ([0,1] float arba [0,255] uint8) ir skiriamosios gebos suderinimą naudojant dvimačio interpoliavimo metodą, kai vaizdai iš skirtingų sistemų turi skirtingo dydžio pikselius. Fazinio kontrasto vaizdams, kurie ypač jautrūs optiniams nustatymams, naudojame CycleGAN grindžiamą srities pritaikymą, kuriuo vieno mikroskopo vaizdai išverčiami taip, kad atitiktų kito mikroskopo išvaizdą, išmokytą pagal nesuporuotus abiejų sistemų vaizdų rinkinius. Šis išankstinis apdorojimas užtikrina, kad "IncuCyte" vaizdais apmokyti modeliai po standartizavimo vienodai gerai veiktų "ImageXpress" arba EVOS vaizduose. Standartizavimo veiksmingumą patvirtiname matuodami modelių našumo pablogėjimą, kai jie taikomi naujoms platformoms: prieš standartizavimą tikslumas sumažėja 12-25 %, kai modeliai, apmokyti vienoje sistemoje, taikomi kitoje; po standartizavimo pablogėjimas sumažėja iki <5 %. Mūsų standartizavimo vamzdynas automatizuotas vaizdų analizės infrastruktūroje, taikant atitinkamas transformacijas pagal šaltinio mikroskopą nurodančias metaduomenų žymas, kad vaizdai iš visų platformų patektų į unifikuotas analizės darbo eigas. Šis tarpplatforminis patikimumas yra labai svarbus vykdant veiklą keliose vietose ir leidžia dalytis apmokytais modeliais su ląstelių kultūrų tyrėjų bendruomene, taip plėtojant šią sritį už atskirų laboratorijų įgyvendinimo ribų.

Integracija su laboratorijų automatizavimu

Dirbtinio intelekto paremta vaizdų analizė tampa dar galingesnė, kai ji integruojama su automatizuotomis ląstelių kultūrų sistemomis. "Cytion" įdiegėme uždaro ciklo automatizavimą, kai "IncuCyte" vaizdavimo sistemos automatiniuose inkubatoriuose (Liconic STX serija) fiksuoja vaizdus kas 2 valandas, "Python" pagrįsti analizės vamzdynai apdoroja vaizdus per 5 minutes nuo jų gavimo, naudodami konteinerines išvadų paslaugas (Docker Kubernetes sistemoje), o analizės rezultatai per REST API perduodami į mūsų "Hamilton VENUS" automatizavimo valdiklį, kad būtų paleisti automatiniai veiksmai. Pavyzdžiui, kai konfliuencinė analizė rodo, kad kultūros pasiekė 85 % (optimalus perėjimo tankis), sistema automatiškai sukuria VENUS darbo sąrašą, pagal kurį suplanuojama, kad skysčių tvarkymo robotas per artimiausias 4 valandas atliks perėjimo operacijas (aspiruos terpę, pridės tripsino, neutralizuos, suskaičiuos ląsteles, pasės naujas kolbas). Aptikus užterštumo tikimybę >0,7, paveiktos kultūros iš karto patenka į karantiną, perkeliamos į izoliuotas inkubatoriaus zonas ir generuojami skubūs įspėjimai, užkertantys kelią užteršimo plitimui. Gyvybingumo įverčiai <80 % sustabdo automatinį apdorojimą ir pažymi kultūras, kad jos būtų peržiūrėtos rankiniu ekspertiniu būdu. Ši integracija sukuria autonomines kultūrų valdymo sistemas, kurios palaiko optimalią ląstelių sveikatą su minimaliu žmogaus įsikišimu - mūsų integruotos sistemos sėkmingai kultivuoja daugiau kaip 200 vienu metu veikiančių ląstelių linijų, 92 % pasavimo operacijų atliekama visiškai automatiškai, o žmogaus dalyvavimas reikalingas tik 8 % kultūrų, pažymėtų dėl išskirtinių sąlygų. Uždaro ciklo veikimas apima saugos blokatorius: Dirbtinio intelekto prognozės žemiau patikimumo ribos (paprastai 0,75) verčia atlikti rankinę peržiūrą, o ne automatinius veiksmus, o visi automatiniai sprendimai registruojami kartu su paaiškinimo duomenimis, kad juos būtų galima atsekti ir nuolat tobulinti. Vykdant sistemos veikimo stebėseną, stebimi pagrindiniai rodikliai, įskaitant klaidingai teigiamus užterštumo aptikimo rodiklius (tikslas <2%), accuracy of confluence-based passage timing (>90 % perėjimų vyksta esant 80-95 % susiliejimui) ir koreliaciją tarp prognozuoto ir išmatuoto gyvybingumo po perėjimo (r>0,8), o kas ketvirtį atliekamos peržiūros užtikrina, kad veikimas atitiktų specifikacijas.

Mokymo duomenų generavimas ir anotavimas

Dirbtinio intelekto modelių veikimas labai priklauso nuo mokymo duomenų kokybės ir kiekio. Bendrovėje "Cytion" turime išsamias, kruopščiai anotuotas vaizdų duomenų bazes, apimančias visą mūsų ląstelių linijų katalogą įvairiomis sąlygomis ir su įvairiais pasažų skaičiais, šiuo metu iš viso > 150 000 anotuotų vaizdų, kurie sudaro > 2 000 valandų ekspertų anotavimo pastangų. Mūsų anotavimo strategijoje derinami keli metodai: rankinis anotavimas, kurį atlieka ląstelių kultūrų ekspertai mokslininkai, naudodami tokias priemones kaip "LabelImg" ir "VGG Image Annotator" (VIA) segmentavimo kaukėms ir klasių etiketėms, pusiau automatinis anotavimas, kai pradines AI prognozes peržiūri ir koreguoja ekspertai (anotavimo laikas sutrumpėja 60 %, tačiau išlaikomas tikslumas), ir aktyvusis mokymasis, kai modeliai nustato vaizdus su dideliu prognozių neapibrėžtumu, kad būtų galima nustatyti anotavimo prioritetus ir sutelkti dėmesį į kraštutinius atvejus. Vykdome griežtą anotavimo kokybės kontrolę, atlikdami patikimumo testus tarp ekspertų - trys nepriklausomi anotatoriai ženklina 100 vaizdų pogrupius, pasiekdami Coheno kappa >0,85 sutapimą atliekant klasifikavimo užduotis ir IoU >0,90 atliekant segmentavimo anotacijas, taip patvirtindami anotavimo nuoseklumą. Siekdami nuolat tobulėti, įgyvendiname sistemingus duomenų rinkimo protokolus: visi gamybiniai vaizdai automatiškai archyvuojami su metaduomenimis (ląstelių linija, ištrauka, data, vaizdinimo sistema, kultūros sąlygos), reguliariai partijose ekspertai anotuoja vaizdus, taip padidindami mokymo rinkinių įvairovę, o vaizdai, susiję su kokybės kontrolės klaidomis ar neįprastais įvykiais, anotuojami prioriteto tvarka, kad būtų galima pagerinti kraštutinių atvejų tvarkymą. Duomenų papildymas padidina efektyvų mokymo rinkinio dydį: pasukimai (0-360°), horizontalūs ir vertikalūs apvertimai, ryškumo ir (arba) kontrasto reguliavimas (±20 %), elastinės deformacijos (imituojant mikroskopo lauko svyravimus) ir Gauso triukšmo pridėjimas (σ=0,1) mokymo metu sukuria papildytus variantus, kurie veiksmingai 10 kartų padidina mokymo duomenis ir kartu pagerina modelio atsparumą natūraliems vaizdų svyravimams. Mes taip pat kuruojame specializuotus duomenų rinkinius, skirtus konkretiems uždaviniams spręsti: užterštumo aptikimo duomenų rinkinį sudaro daugiau kaip 5 000 bakterijomis, grybeliais ir mikoplazma užterštų kultūrų vaizdų; retos morfologijos duomenų rinkinyje fiksuojami neįprasti fenotipai, nuolaužos, artefaktai; kelių etapų duomenų rinkinyje stebimos atskiros ląstelių linijos per P5-P30, kuriose fiksuojamas senėjimas ir fenotipų poslinkis. Ši išsami, gerai sukaupta mokymo duomenų infrastruktūra yra labai svarbi mūsų dirbtiniu intelektu paremtų kokybės kontrolės sistemų tikslumui ir patikimumui.

Modelio patvirtinimas ir veikimo stebėsena

Prieš diegiant dirbtinio intelekto modelius kokybės kontrolės sprendimams priimti, būtina atlikti griežtą jų patvirtinimą. Bendrovėje "Cytion" vadovaujamės struktūrizuotais patvirtinimo protokolais, suderintais su FDA gairėmis dėl programinės įrangos patvirtinimo ir mašininio mokymosi, skirto medicinos prietaisams (taikomi GMP ląstelių gamybos principai): mes suskirstome duomenų rinkinius į mokymo (70 %), patvirtinimo (15 %) ir testavimo (15 %) rinkinius su stratifikacija, užtikrinančia, kad visos ląstelių linijos ir sąlygos būtų proporcingai atstovaujamos; kūrimo metu atliekame k kartų kryžminį patvirtinimą (k = 5), kad įvertintume modelio apibendrinamumą; vertiname našumą su laikomais testavimo rinkiniais, kurie nebuvo naudojami mokymo metu, naudodami išsamius rodiklius, įskaitant tikslumą, tikslumą, atšaukimą, F1 balą klasifikavimo užduotims, R², MAE, RMSE regresijos užduotims ir AUC-ROC kreives tikimybių prognozėms; palyginti dirbtinio intelekto prognozes su standartiniais matavimais (eksperto rankiniu vertinimu, srauto citometrija gyvybingumui nustatyti, mikroskopo tinklelio skaičiavimu susiliejimui nustatyti) įvairiomis bandymo sąlygomis; ir atlikti perspektyvinį patvirtinimą, kai modeliai veikia šešėliniu režimu lygiagrečiai su standartine kokybės kontrole 3 mėnesius iki įdiegimo, lyginant prognozes su faktiniais kokybės kontrolės rezultatais. Įdiegus modelį, vykdoma nuolatinė veiksmingumo stebėsena: automatinis AI prognozių palyginimas su periodinėmis ekspertinėmis peržiūromis (20 % kultūrų atliekamas lygiagretus ekspertinis vertinimas), prognozių patikimumo balų stebėjimas laikui bėgant (mažėjantis patikimumas gali reikšti duomenų nuokrypį), AI kokybės balų ir tolesnių partijų veiksmingumo rodiklių (gyvybingumas po pasėlio, plėtros sėkmė) koreliacijos analizė ir ketvirtinės patvirtinimo peržiūros, kuriose nagrinėjamas modelio veiksmingumas įvairiose ląstelių linijose ir darbo sąlygose. Tvarkome išsamią patvirtinimo dokumentaciją, įskaitant modelio architektūros specifikacijas, mokymo duomenų charakteristikas (dydis, įvairovė, anotacijų kokybė), veiklos lyginamųjų rodiklių rezultatus ir modelio atnaujinimų pakeitimų kontrolės įrašus. Kai modelio našumas sumažėja žemiau priimtinų kriterijų (pvz., susiliejimo tikslumas nukrenta žemiau ±5 %, užterštumo aptikimo AUC <0,90), pradedame perkvalifikavimą arba pakartotinį kalibravimą: renkame papildomus mokymo duomenis iš naujausių gamybos serijų, perkvalifikuojame modelius naudodami atnaujintus duomenų rinkinius, patvirtiname atnaujintus modelius naujuose bandymų rinkiniuose ir įgyvendiname kontroliuojamą diegimą, kai atnaujinti modeliai iš pradžių veikia šešėliniu režimu, o tik po to visiškai diegiami. Ši griežta patvirtinimo ir stebėsenos sistema užtikrina, kad mūsų dirbtiniu intelektu paremta kontrolė laikui bėgant išliktų tiksli ir patikima, nepaisant besikeičiančių ląstelių linijų portfelių, vaizdavimo įrangos pokyčių ir natūralaus duomenų nuokrypio.

Ateities AI vaizdų analizės plėtra

Ląstelių vaizdų analizės su dirbtiniu intelektu sritis ir toliau sparčiai tobulėja, o nauji metodai žada dar didesnes galimybes. "Cytion" aktyviai stebi ir bando šiuos pasiekimus: 3D vaizdų analizė naudojant tūrinius segmentavimo tinklus (3D U-Net) organoidinėms ir sferoidinėms kultūroms, leidžianti įvertinti organoidų dydį, morfologiją ir vidinę struktūrą iš Z-stack vaizdų; fluorescencijos prognozavimas be etikečių, kai modeliai, apmokyti pagal suporuotus šviesaus lauko ir fluorescencijos vaizdus, išmoksta prognozuoti fluorescencijos modelius tik iš šviesaus lauko vaizdų, galinčių pakeisti kai kuriuos dažymo reikalavimus; savaiminio mokymosi metodai (SimCLR, BYOL), kurie iš neženklintų vaizdų išmoko naudingų atvaizdų, sumažindami anotavimo reikalavimus, nes mokosi bendrųjų ląstelių vaizdų savybių be rankinių etikečių; ląstelių biologijos pagrindų modeliai (analogiški GPT kalbai), iš anksto apmokyti pagal didžiulius įvairių ląstelių vaizdų duomenų rinkinius, kuriuos galima tiksliai pritaikyti konkrečioms užduotims su minimaliu duomenų kiekiu; realaus laiko analizė tiesioginio vaizdavimo metu, kai išvados vėlavimas <1 sekundė, leidžianti iš karto gauti grįžtamąjį ryšį automatizuotiems eksperimentams; ir prognozavimo modeliai, kuriais pagal ankstyvosios fazės vaizdus prognozuojami kultūros rezultatai prieš kelias valandas ar dienas, apmokyti pagal išilginių duomenų rinkinius, susiejančius ankstyvųjų vaizdų požymius su galutinės partijos kokybe. Taip pat tiriame daugiamodalinę integraciją, derindami mikroskopinius vaizdus su molekulinio profiliavimo duomenimis (RNR-seq, proteomika), siekdami atrasti vaizdo biomarkerius, pagal kuriuos galima prognozuoti molekulinius fenotipus, ir fizikiniais duomenimis pagrįstus neuroninius tinklus, į kuriuos įtraukti biologiniai apribojimai (ląstelių ciklo dinamika, maistinių medžiagų suvartojimo kinetika), kad padidėtų prognozavimo tikslumas ir sumažėtų duomenų poreikis. Tobulėjant šioms technologijoms, tikimės, kad pavyks dar anksčiau aptikti problemas dėl subtilių, dabartiniams metodams nematomų ikisimptominių pokyčių, tiksliau įvertinti kokybę integruojant įvairius duomenų būdus ir giliau įžvelgti veiksnius, darančius įtaką kultūros sėkmei. Ši pažanga leis "Cytion" ir toliau tiekti aukščiausios kokybės ląsteles ir ląstelių linijas dar nuosekliau ir efektyviau, išlaikant lyderystę kokybės ir inovacijų srityje.