Mākslīgā intelekta darbināta attēlu analīze šūnu kultūru kvalitātes kontrolei
Uzņēmumā Cytion mēs saprotam, ka šūnu kultūru veselības vizuāla novērtēšana ir būtiska, lai ražotu augstas kvalitātes šūnas un šūnu līnijas. Tradicionālā uz mikroskopiju balstītā kvalitātes kontrole lielā mērā ir atkarīga no cilvēka zināšanām un subjektīvas interpretācijas, kas var atšķirties atkarībā no operatora un laika gaitā. Mākslīgā intelekta balstīta attēlu analīze pārvērš šo subjektīvo procesu objektīvā, kvantitatīvā un mērogojamā kvalitātes kontroles sistēmā, kas nodrošina konsekventu produktu kvalitāti visos mūsu šūnu līniju piedāvājumos. Izmantojot dziļās mācīšanās algoritmus, tostarp U-Net arhitektūras segmentācijai, ResNet-50 un EfficientNet modeļus klasifikācijai, kā arī progresīvas datorredzes metodes, piemēram, pārneses mācīšanos un ansambļa metodes, mēs varam atklāt smalkas šūnu morfoloģijas izmaiņas, agrāk identificēt piesārņojumu un pieņemt uz datiem balstītus lēmumus par kultūru veselību un gatavību turpmākai lietošanai. Mūsu mākslīgā intelekta sistēmas ik mēnesi apstrādā vairāk nekā 50 000 attēlu no mūsu ražotajām HeLa šūnām, HEK293 šūnām un citām kritiskām šūnu līnijām, nodrošinot konsekventu kvalitātes novērtēšanu ar precizitāti, kas pārsniedz 95 % vairākos parametros.
| AI analīzes iespējas | Kvalitātes kontroles lietojumprogramma | Priekšrocības salīdzinājumā ar manuālo novērtēšanu |
|---|---|---|
| Automatizēts konfluences mērījums | Optimālā pasāžas laika noteikšana | ±2% precizitāte salīdzinājumā ar ±15-20% manuālo variāciju |
| Morfoloģijas klasifikācija | Fenotipisko izmaiņu un diferenciācijas noteikšana | Identificē cilvēka acīm neredzamas smalkas izmaiņas |
| Piesārņojuma noteikšana | Baktēriju, sēnīšu, mikoplazmu agrīna identificēšana | Atklāšana 24-48 stundas agrāk nekā vizuālā pārbaude |
| Dzīvotspējas novērtējums | Neinvazīva šūnu veselības uzraudzība | Nepārtraukta uzraudzība bez uz krāsvielām balstītiem testiem |
| Daudzparametru fenotipēšana | Visaptveroša šūnu līniju raksturošana | Vienlaicīga vairāk nekā 50 pazīmju analīze salīdzinājumā ar 3-5 manuālu analīzi |
Dziļas mācīšanās revolūcija šūnu attēlu analīzē
Dziļās mācīšanās izmantošana šūnu kultūru attēlu analīzē ir fundamentāla pārmaiņa mūsu pieejā kvalitātes kontrolei. Atšķirībā no tradicionālajiem attēlu analīzes algoritmiem, kuru noteikšanai nepieciešams skaidri ieprogrammēt pazīmes, dziļās mācīšanās modeļi var automātiski apgūt attiecīgās pazīmes no tūkstošiem mācību attēlu. Uzņēmumā Cytion mēs esam izstrādājuši pielāgotas konvolūcijas neironu tīklu (CNN) arhitektūras, kas balstītas uz pārbaudītiem modeļiem, piemēram, U-Net semantiskai segmentācijai (šūnu robežu noteikšanai ar pikseļa līmeņa precizitāti), ResNet-50 pazīmju ekstrakcijai (hierarhisku reprezentāciju apgūšanai no neapstrādātiem pikseļiem) un EfficientNetB4 klasifikācijas uzdevumiem (veselu šūnu nošķiršanai no stresa skartām). Mūsu modeļi ir apmācīti, izmantojot plašas attēlu datubāzes - pašlaik > 150 000 anotētu attēlu, kas aptver vairāk nekā 200 šūnu tipus, vairākus pāreju numurus (P2-P30), dažādus kultūras apstākļus (standarta, stresa, piesārņotas) un dažādus attēlveidošanas veidus (fāžu kontrasts, spilgtais lauks, fluorescence). Šie modeļi nodrošina > 95 % precizitāti konfluences novērtēšanā, > 92 % jutību piesārņojuma noteikšanā un > 88 % precizitāti morfoloģijas klasifikācijā. Apmācīšanas procesā tiek izmantotas datu papildināšanas metodes (rotācija, apgriešana, spilgtuma korekcija, elastīga deformācija), lai uzlabotu modeļa noturību, un pārneses mācīšanās no ImageNet iepriekš apmācītiem svariem, lai paātrinātu konverģenci. Modeļa apmācība tiek veikta NVIDIA A100 GPU klasteros ar 32-64 attēlu partijas lielumu un apmācības laiku 12-48 stundas atkarībā no modeļa sarežģītības, izmantojot Adam optimizatoru ar mācīšanās ātruma plānošanu un agrīnu apstāšanos, pamatojoties uz validācijas kopas veiktspēju.
Automatizēti konfluences mērījumi un augšanas izsekošana
Konfluences mērīšana - noteikt, cik procentu kultūras virsmas klāj šūnas - ir viens no vissvarīgākajiem, bet subjektīvākajiem novērtējumiem šūnu kultūrā. Uzņēmumā Cytion mēs izmantojam U-Net konvolūcijas neironu tīklu arhitektūru, kas īpaši izstrādāta semantiskās segmentācijas uzdevumiem, panākot šūnu un fona reģionu klasifikāciju pikseļu līmenī ar Intersection over Union (IoU) rādītājiem virs 0,90. Mūsu U-Net īstenošanā ir līgumprojekts (kodētājs) ar 4 samazināšanas posmiem, izmantojot 3 × 3 konvolūcijas un 2 × 2 maksimālo apvienošanu, un paplašinošs ceļš (dekodētājs) ar palielināšanu un izlaišanas savienojumiem, kas saglabā telpisko informāciju no iepriekšējiem slāņiem. Tīkls ir apmācīts ar manuāli anotētiem attēliem, kuros eksperti šūnu kultūru zinātnieki ir apzīmējuši šūnu robežas, izmantojot bināro krusteniskās entropijas un Dice zudumu funkciju kombināciju, lai novērstu klašu nelīdzsvarotību. Apmācītais modelis apstrādā 2048 × 2048 pikseļu attēlus <300 ms, izmantojot GPU, ģenerējot pikseļu varbūtības kartes, kas tiek sliekšņotas, lai izveidotu bināro masku, no kuras tiek aprēķināta saplūšanas procentuālā daļa kā (šūnu pikseļi / kopējais pikseļu skaits) × 100. Šī automatizētā saplūšanas mērīšana sasniedz precizitāti ±2 % robežās, ja to validē, salīdzinot ar manuālu ekspertu anotāciju, salīdzinot ar ±15-20 % atšķirībām starp dažādiem cilvēku novērotājiem. Papildus viena laika punkta mērījumiem mūsu sistēma seko līdzi konfluencei laika gaitā, lai ģenerētu augšanas līknes (konfigurējot konfluences attiecību pret laiku ar eksponenciālās līknes pielāgošanu), kas ļauj aprēķināt dubultošanās laikus, paredzēt optimālo pasāžas laiku (parasti pie 80-90 % konfluences) un identificēt kultūras, kas aug anomāli lēni (> 2 standartnovirzes zem paredzētā augšanas ātruma), kas var norādīt uz šūnu līnijas novecošanos, barotnes kvalitātes problēmām vai inkubatora problēmām. Šāda precīza šūnu un šūnu līniju kataloga augšanas izsekošana nodrošina optimālu ražas novākšanas laiku, kas maksimāli uzlabo šūnu kvalitāti un dzīvotspēju.
Morfoloģiskā analīze un fenotipa stabilitāte
Šūnu morfoloģija sniedz bagātīgu informāciju par šūnu veselību, identitāti un funkcionālo stāvokli. Uzņēmumā Cytion mēs iegūstam visaptverošas morfoloģiskās pazīmes, izmantojot datorredzes algoritmus un uz dziļo mācīšanos balstītu pazīmju ekstrakciju. Pēc šūnu segmentācijas mēs aprēķinām klasiskos morfoloģijas deskriptorus, tostarp šūnu laukumu (µm²), perimetru (µm), apaļumu (4π × laukums/perimetrs²), aspektu attiecību (galvenā ass/ mazākā ass), cietību (laukums/izliektā korpusa laukums) un tekstūras pazīmes, pamatojoties uz pelēkā līmeņa sakritības matricām (GLCM), tostarp kontrastu, korelāciju, enerģiju un homogenitāti. Turklāt mēs izmantojam ResNet-50 konvolūcijas tīklus, kas iepriekš apmācīti ImageNet tīklā un precizēti mūsu šūnu attēlu datu kopā, lai iegūtu 2048-dimensiju dziļo pazīmju vektorus, kas atspoguļo smalkus morfoloģiskos modeļus, kurus nav viegli aprakstīt ar rokām veidotām pazīmēm. Šie daudzšķautņainie raksturlielumi (apvienojot tradicionālo morfometriju ar dziļajiem raksturlielumiem) tiek ievadīti Random Forest klasifikatoriem (100 koki, Gini piemaisījumu kritērijs) vai atbalsta vektoru mašīnām (RBF kodols, C=1,0, gamma=auto), kas atšķir normālu morfoloģiju no novirzes fenotipiem ar > 92 % precizitāti. Kvalitātes kontrolei mēs uzturam standartmorfoloģijas profilus katrai šūnu līnijai mūsu katalogā, piemēram, HeLa šūnām ir raksturīga epitēlija morfoloģija ar vidējo laukumu 450±80 µm² un cirkularitāti 0,65±0,12, bet HEK293 šūnām ir 380±70 µm² laukums ar lielāku cirkularitāti 0,72±0,10. Morfoloģiskā dreifa noteikšanai izmanto Hotellinga T² statistiku, lai pārbaudītu, vai pašreizējās partijas morfoloģija būtiski atšķiras no references sadalījuma (p<0,05 slieksnis), atzīmējot kultūras pārskatīšanai, ja tiek konstatētas fenotipa izmaiņas, kas var liecināt par nevēlamu diferenciāciju, ģenētisko dreifu vai suboptimāliem kultūras apstākļiem.
Agrīna piesārņojuma atklāšana
Piesārņojums ir viens no nopietnākajiem draudiem šūnu kultūru darbībai, kas var radīt zaudētas kultūras, izšķērdēt resursus un apdraudēt eksperimentu rezultātus. Uzņēmumā Cytion mēs esam izstrādājuši specializētus piesārņojuma noteikšanas modeļus, kas apmācīti, izmantojot kontrolētas piesārņotu kultūru datu kopas, tostarp baktēriju piesārņojumu (ko raksturo straujš sīku daļiņu atlieku pieaugums, barotnes duļķainība, pH izmaiņas, kas redzamas kā krāsas izmaiņas fenola sarkano saturošā barotnē), sēnīšu piesārņojumu (redzams kā micēlija struktūras, sporas) un mikoplazmas infekciju (smalkas morfoloģiskas izmaiņas, samazināts augšanas ātrums, palielināta graudainība). Mūsu noteikšanas sistēmā izmantota EfficientNetB4 arhitektūra (16,8M parametru, dziļuma, platuma un izšķirtspējas saliktā mērogošana), kas apmācīta, izmantojot divpakāpju pieeju: pirmkārt, klasifikācija tīrās un piesārņotās kategorijās (bināri krusteniskās entropijas zudumi, sasniedzot AUC-ROC 0,96); otrkārt, vairāku klašu klasifikācija, nosakot piesārņojuma veidu (kategoriska krusteniskā entropija, 85 % precizitāte visās baktēriju/ sēnīšu/ mikoplazmu/ rauga kategorijās). Modeļi analizē vairākas attēlu pazīmes, tostarp neparastu daļiņu sadalījumu (atklāts, izmantojot plankumu noteikšanas algoritmus), nesēja izskata izmaiņas (krāsu nobīdes, kas kvantificētas LAB krāsu telpā) un patoloģiskus šūnu morfoloģijas modeļus. Laika rindu analīze, salīdzinot pašreizējos attēlus ar 24-48 stundu vēsturisko bāzes līniju, ļauj atklāt pieaugošo piesārņojumu, pirms tas kļūst operatoriem vizuāli acīmredzams, parasti nodrošinot 24-48 stundu agrāku brīdinājumu salīdzinājumā ar manuālu pārbaudi. Ja piesārņojuma varbūtība pārsniedz 0,7 robežvērtību, automatizēti brīdinājumi informē QC personālu, izmantojot e-pastu un LIMS paziņojumus, un uzsāk tūlītēju izmeklēšanu, tostarp vizuālu apstiprinājumu, Grama krāsošanu (baktēriju piesārņojumam) un mikoplazmas PCR testēšanu. Šī mākslīgā intelekta uzlabotā piesārņojuma uzraudzība ir samazinājusi ar piesārņojumu saistītos partijas zudumus par 60 % uzņēmumā Cytion, pateicoties agrīnākai atklāšanai un iejaukšanai, kas ir īpaši vērtīgi ilgtermiņa kultūrām un augstvērtīgiem šūnu līniju izstrādes projektiem, kur piesārņojums vēlā procesa posmā varētu radīt ievērojamus resursu zaudējumus.
Neinvazīva dzīvotspējas novērtēšana
Tradicionālajai dzīvotspējas novērtēšanai, izmantojot tripāna zilo vai citas membrānas necaurlaidīgas krāsvielas, nepieciešams ņemt šūnu paraugus no kultūras, kas ir destruktīvi un ierobežo laika izšķirtspēju. Uzņēmumā Cytion mēs esam izstrādājuši uz morfoloģiju balstītus dzīvotspējas prognozēšanas modeļus, kas, izmantojot mašīnmācīšanos, novērtē šūnu dzīvotspēju no bezmarķējuma spilgtā lauka vai fāžu kontrasta attēliem. Šī pieeja ir balstīta uz novērojumu, ka mirstošām un mirušām šūnām ir raksturīgas raksturīgas morfoloģiskas izmaiņas: šūnu saraušanās, membrānas izplūšana, citoplazmas granulācija, šūnu un substrāta adhēzijas zudums un palielināta gaismas laušana. No atsevišķām segmentētām šūnām tika iegūti 156 morfoloģiskie un tekstūras raksturlielumi, pēc tam tika izmantota raksturlielumu atlase (rekursīvā raksturlielumu izslēgšana ar krustenisko validāciju), lai identificētu 35 vislabāk prognozējošos raksturlielumus, tostarp šūnas laukumu, perimetra neregularitāti, vidējo pikseļu intensitāti, intensitātes dispersiju un GLCM tekstūras deskriptorus. Gradient Boosting regresijas modeļi (XGBoost ar 200 aplēsēm, mācīšanās ātrums 0,1, maksimālais dziļums 6), kas apmācīti pēc šiem raksturlielumiem, prognozē dzīvotspējas procentuālo daļu ar R²=0,87, kad tie tiek validēti, salīdzinot ar zelta standarta trypan blue izslēgšanas mērījumiem, kas veikti ar paralēliem paraugiem. Modelis tika apmācīts, izmantojot 12 000 attēlu un dzīvotspējas pāru, kas aptver dzīvotspējas diapazonus no 50 % līdz 99 % dažādiem šūnu tipiem un pasāžu skaitļiem. Ražošanas uzraudzībai sistēma apstrādā attēlus, ko ik pēc 2-4 stundām uzņem IncuCyte dzīvu šūnu analīzes sistēmas, ģenerējot nepārtrauktus dzīvotspējas tendenču datus, netraucējot kultūras. Pēkšņs dzīvotspējas kritums (> 10 % samazinājums 12 stundu laikā) izraisa brīdinājumus izmeklēšanai, savukārt pakāpeniskas samazināšanās tendences informē par lēmumu pieņemšanu attiecībā uz pasāžas laiku - mēs parasti pasažējam pie > 90 % paredzamās dzīvotspējas, lai saglabātu šūnu veselību. Šī neinvazīvā dzīvotspējas uzraudzība ir īpaši vērtīga suspensijas kultūrām un bioreaktoru sistēmām, kur tradicionālā paraugu ņemšana ir traucējoša, un skrīninga eksperimentiem, kur ir svarīgi saglabāt kultūras integritāti, vienlaikus uzraugot šūnu veselību.
Daudzparametru kvalitātes vērtēšana
Tā vietā, lai paļautos uz atsevišķiem parametriem, mākslīgā intelekta sistēmas var integrēt vairākus attēlos iegūtos parametrus visaptverošos kvalitātes vērtējumos. Uzņēmumā Cytion mēs esam izstrādājuši holistiskus kvalitātes novērtēšanas modeļus, kas apvieno konfluenci (mērķis 80-90 % caurlaišanai), morfoloģijas novērtējumu (0-100 skala, >75 norāda uz normālu morfoloģiju), dzīvotspējas novērtējumu (mērķis >90 %), piesārņojuma risku (varbūtības slieksnis <0,1) un kultūras viendabīgumu (šūnu izmēra/formas variāciju koeficients, mērķis <20 %) kopējā kvalitātes kontroles novērtējumā, izmantojot svērtas ansambļa metodes. Ansamblis apvieno specializēto modeļu prognozes: U-Net konfluence (svars 0,25), ResNet-50 morfoloģijas klasifikators (svars 0,30), EfficientNet piesārņojuma detektors (svars 0,25), XGBoost dzīvotspējas regresija (svars 0,15), kuru svari optimizēti, izmantojot režģa meklēšanu uz noturētām validācijas kopām, lai maksimāli palielinātu korelāciju ar ekspertu QC lēmumiem. Galīgais QC rezultāts ir no 0 līdz 100 punktiem, ar automatizētiem lēmumu pieņemšanas noteikumiem: rezultāts ≥85 = atbilst (turpināt caurlaišanu/novākšanu), 70-84 = robežvērtība (atzīmēt manuālai pārskatīšanai), <70 = neatbilst (izmeklēt vai izmest). Šie daudzparametru novērtējumi nodrošina objektīvus, kvantitatīvus kritērijus, lai pieņemtu lēmumus par izlaišanu ražošanā - pie Cytion kultūrām, pirms tās tiek virzītas uz nākamo pāreju vai galīgo ražas novākšanu, jāsaņem ≥ 85 punkti, nodrošinot konsekventu produkta kvalitāti. Mūsu ražošanas datu analīze liecina par spēcīgu korelāciju (r = 0,82) starp AI QC punktiem un pakārtoto kultūru veiktspējas rādītājiem, tostarp dzīvotspēju pēc pasāžas un izplešanās panākumiem, tādējādi apstiprinot integrētās vērtēšanas pieejas prognozēšanas vērtību. Automatizētā vērtēšanas sistēma apstrādā pilnus mikroplatīšu attēlus (96 iedobes) 8-12 minūtēs, salīdzinot ar 45-60 minūtēm, kas nepieciešamas manuālai mikroskopiskai pārbaudei, tādējādi ļauj pieņemt lēmumus par kvalitātes kontroli reāllaikā, kas nodrošina efektīvu ražošanas darba plūsmu.
Pārneses mācīšanās un modeļa pielāgošana
Viens no izaicinājumiem mākslīgā intelekta ieviešanā šūnu kultūru analīzē ir vajadzība pēc lielām mācību datu kopām, īpaši specializētām vai retām šūnu līnijām. Pārneses mācīšanās risina šo problēmu, sākot ar modeļiem, kas iepriekš apmācīti ar lielām vispārīgu attēlu datu kopām (ImageNet ar 1,4 miljoniem attēlu, 1000 kategorijām), un pēc tam tos precizējot ar šūnu kultūrām specifiskiem attēliem. Uzņēmumā Cytion mēs plaši izmantojam pārneses mācīšanos: mēs inicializējam savus modeļus ar ImageNet iepriekš apmācītiem svariem (piemēram, ResNet-50, EfficientNetB4), pēc tam precizējam pēdējos slāņus vai visu tīklu, izmantojot mūsu šūnu attēlu datu kopas ar ievērojami samazinātām mācību datu prasībām. Piemēram, jauna morfoloģijas klasifikatora izstrādei de novo varētu būt nepieciešami vairāk nekā 10 000 anotētu attēlu, savukārt transfermācīšanās nodrošina salīdzināmu veiktspēju ar 1 000 līdz 2 000 attēlu. Mūsu precizēšanas protokols izmanto zemāku mācīšanās ātrumu (1e-4 līdz 1e-5) salīdzinājumā ar mācīšanos no nulles (1e-2 līdz 1e-3), parasti trenē 20-50 epohās ar agrīnu apstāšanos, pamatojoties uz validācijas zaudējumu plato, un izmanto diskriminējošu mācīšanās ātrumu, kur agrīnie slāņi (vispārīgie raksturlielumi) tiek atjaunināti lēni, bet vēlākie slāņi (šūnu specifiskie raksturlielumi) atjaunināti ātrāk. Jaunām šūnu līnijām, kas pievienotas mūsu šūnu un šūnu līniju katalogam, mēs īstenojam nepārtrauktu mācīšanos, kad modeļi tiek periodiski pārmācīti, izmantojot uzkrātos attēlus no ražošanas partijām, parasti reizi ceturksnī, kad tiek veikti atjauninājumi, kas ietver 500-1000 jaunus validētus attēlus, saglabājot modeļa precizitāti, jo mūsu šūnu līniju portfelis paplašinās. Tādas domēna pielāgošanas metodes kā maksimālā vidējā neatbilstība (MMD) un apmācības, kas balstītas uz pretrunām, palīdz modeļiem vispārināties dažādās attēlveidošanas platformās - mēs apmācāmies ar vairāku mikroskopu sistēmu (IncuCyte, ImageXpress, EVOS) datiem, lai nodrošinātu stabilu veiktspēju neatkarīgi no iegūšanas aparatūras.
Izskaidrojams mākslīgais intelekts un kvalitātes nodrošināšana
Lai gan dziļās mācīšanās modeļi var sasniegt iespaidīgu precizitāti, to "melnās kastes" raksturs var būt problemātisks kvalitātes kontroles lietojumprogrammās, kur ir svarīgi saprast lēmumu pamatojumu. Uzņēmumā Cytion mēs ieviešam izskaidrojamā mākslīgā intelekta (XAI) metodes, lai modeļu lēmumus padarītu interpretējamus un uzticamus. Mēs izmantojam Grad-CAM (Gradient-weighted Class Activation Mapping), lai ģenerētu karstuma kartes, kas parāda, kuri attēla reģioni visvairāk ietekmēja klasifikācijas lēmumus, piemēram, parādot, ka piesārņojuma noteikšana koncentrējas uz gružu daļiņām un morfoloģijas izmaiņām, nevis uz nebūtiskām fona iezīmēm. SHAP (SHapley Additive exPlanations) vērtības kvantificē katras pazīmes devumu atsevišķās prognozēs, atklājot, ka konfluences prognozes galvenokārt ir atkarīgas no šūnu blīvuma un pārklājuma rādītājiem, bet dzīvotspējas prognozēs liela nozīme ir membrānas integritātes un citoplazmas tekstūras pazīmēm. Attiecībā uz morfoloģijas klasifikāciju mēs vizualizējam apgūtos filtrus konvolūcijas slāņos, parādot, ka agrīnie slāņi nosaka malas un tekstūras, bet dziļākie slāņi atpazīst specifiskus šūnu modeļus, piemēram, epitēlija lapu veidošanos HeLa šūnās vai neironiem līdzīgus procesus diferencētu šūnu tipos. Šādas XAI vizualizācijas kalpo vairākiem mērķiem: vairot uzticību kvalitātes kontroles personālam, kas var pārliecināties, ka mākslīgais intelekts pieņem lēmumus, pamatojoties uz bioloģiski būtiskām pazīmēm, atvieglot problēmu novēršanu, ja rodas neparedzēti prognozes, nosakot, kādas pazīmes noteica lēmumu, un nodrošināt mācību materiālu, kas jaunajiem darbiniekiem parāda, kādas pazīmes ir svarīgas kvalitātes novērtēšanai. Mēs uzturam XAI paneli, kurā tiek parādītas skaidrojumu vizualizācijas par atzīmētām vai robežšķirtām kultūrām, kas ļauj veikt ātru ekspertu pārskatīšanu ar kontekstu par to, kāpēc mākslīgais intelekts ir veicis savu novērtējumu. Šī pārredzamība ir bijusi ļoti svarīga, lai regulatīvie dienesti akceptētu uz AI balstītu QC - mūsu validācijas paketes GMP ražošanai ietver reprezentatīvas XAI vizualizācijas, kas parāda, ka modeļi pieņem lēmumus, pamatojoties uz zinātniski pamatotiem kritērijiem, kas saskaņoti ar tradicionālajiem ekspertu novērtēšanas principiem.
Augsta satura analīzes integrācija
Ar mākslīgo intelektu darbināma attēlu analīze ir viegli integrējama ar augsta satura attēlveidošanas platformām, kas uztver vairākus fluorescējošus kanālus, veic automātisku Z-stacking un ar precīzu robotizāciju attēlot veselas vairāku iedobju plates. Uzņēmumā Cytion mēs izmantojam Molecular Devices ImageXpress Micro Confocal sistēmas, kas iegūst līdz pat 6 fluorescences kanālus (DAPI, FITC, TRITC, Texas Red, Cy5, Cy5.5) un izstaroto gaismu, ar automātisku Z-stacking (1-50 plaknes, 0,5-10 µm soļi) un precīzu XY statīva pozicionēšanu (±1 µm precizitāte). Lietojumiem ar lielu saturu, piemēram, cilmes šūnu diferenciācijas efektivitātes novērtēšanai, mēs izmantojam imunofluorescences krāsošanu līnijveidības marķieriem, kam seko analīze ar mākslīgo intelektu: šūnu segmentācija, pamatojoties uz kodola krāsojumu (DAPI kanāls, ūdeņu algoritms), marķieru pozitīvo un negatīvo šūnu klasifikācija, pamatojoties uz fluorescences intensitātes sliekšņiem (optimizēts pēc Otsu metodes), un diferenciācijas efektivitātes kvantitatīva noteikšana kā marķieru pozitīvo šūnu procentuālais daudzums. Daudzkanālu analīze ļauj veikt sarežģītu fenotipēšanu - vienlaicīgi kvantitatīvi noteikt kodola morfoloģiju (izmērs, forma, DNS kondensācija no DAPI), proteīnu lokalizāciju (kodola pret citoplazmu, izmantojot kanālu kolokalizācijas analīzi) un šūnu cikla stāvokli (pamatojoties uz DNS satura histogrammām no integrētās DAPI intensitātes). Inženierijas šūnu līnijām ar reportieru konstrukcijām, izmantojot augsta satura attēlveidošanu apvienojumā ar AI analīzi, pārbauda klonu bibliotēkas: iegūst GFP fluorescenci, lai apstiprinātu transgēna ekspresiju, mēra ekspresijas intensitātes sadalījumu, lai novērtētu klonu heterogenitāti (CV < 25 % mērķa), un korelē ekspresiju ar morfoloģiju, lai noteiktu stabilus klonus ar augstu ekspresijas līmeni. Mūsu augsta satura darba plūsmas ik dienu ģenerē 50-100 GB attēlu datu, tāpēc nepieciešama efektīva datu pārvaldība (automātiska saspiešana, mākoņglabāšana AWS S3) un augstas veiktspējas skaitļošana (GPU paātrināta analīze NVIDIA A100 klasteros, kas apstrādā 200 attēlu minūtē). Augsta satura attēlveidošanas aparatūras kombinācija, kas ģenerē bagātīgas daudzdimensiju datu kopas, un mākslīgā intelekta analīzes programmatūra, kas no katras attēlveidošanas sesijas iegūst maksimālu informāciju, ļauj mums veikt sarežģītu šūnu līniju raksturojumu un kvalitātes kontroli, ko nebūtu iespējams veikt ar manuālu analīzi.
Laika joslu analīze un dinamiska uzraudzība
Laika intervāla mikroskopija sniedz vērtīgu informāciju par šūnu uzvedību laika gaitā, tostarp dalīšanās ātrumu, migrācijas modeļiem un reakciju uz vides izmaiņām. Uzņēmumā Cytion mēs izmantojam Sartorius IncuCyte S3 sistēmas, kas uzņem attēlus ar 15 minūšu līdz 2 stundu intervālu nepārtraukti līdz pat 14 dienām, ģenerējot laika rindas datu kopas ar 100-1000 attēliem katrā kultūras iedobē. Šo laika intervālu sekvenču AI analīze ietver: atsevišķu šūnu izsekošanu, izmantojot tādus algoritmus kā TrackMate vai DeepCell, lai sekotu atsevišķām šūnām visos kadros, dalīšanās laika mērīšanu, konstatējot mitotiskos notikumus (šūnu noapaļošanās, sekojoša meitas šūnu atdalīšanās), šūnu migrācijas ātruma un virziena kvantitatīvu noteikšanu (vidējais kvadrātiskais pārvietojums, noturības garums) un šūnu nāves notikumu identificēšanu (raksturīgas morfoloģijas izmaiņas, šūnu atdalīšanās). Dalīšanās izsekošanai mēs sasniedzam 87 % precizitāti mitožu noteikšanā, izmantojot 3D konvolūcijas tīklus (C3D arhitektūra), kas analizē telpiski temporālās iezīmes 5 kadru logos, ļaujot automatizēti aprēķināt populācijas dubultošanās laiku, kas cieši korelē (r=0,91) ar manuāliem šūnu skaitīšanas mērījumiem. Migrācijas analīzei izmanto optiskās plūsmas algoritmus un uz dziļo mācīšanos balstītu šūnu segmentāciju, lai izsekotu šūnu centroidus no kadra līdz kadram, aprēķinot ātrumu (µm/h) un ķīmotaktiskos indeksus migrācijas testiem. Laika intervāla dati atklāj dinamisku uzvedību, kas nav redzama atsevišķos laikapunktu attēlos: mēs esam identificējuši šūnu līnijas ar cirkādiskām proliferācijas ātruma svārstībām, atklājuši neviendabīgu dalīšanās ātrumu kultūru ietvaros, kas norāda uz subpopulācijas struktūru, un raksturojuši atbildes reakcijas kinētiku uz šūnu kultūru barotņu izmaiņām vai zāļu terapiju. Kvalitātes kontrolei lappusveida uzraudzība nodrošina agrīnu brīdinājumu par problēmām - mēs konstatējam augšanas apstāšanos (dalīšanās nenotiek > 24 stundas) vai paaugstinātu bojāejas līmeni (> 5 % šūnu ar apoptozes morfoloģiju 24 stundās) daudz ātrāk nekā galapunktu mērījumi. Bagātīgie laika dati ļauj veikt arī prognozēšanas modelēšanu: izmantojot agrīnās fāzes augšanas kinētiku (pirmās 24-48 stundas), lai prognozētu galīgo šūnu daudzumu, apmācīti ar rekurentiem neironu tīkliem (LSTM arhitektūra ar 128 slēptajām vienībām), kas nodrošina 82 % precizitāti, prognozējot, vai kultūras sasniegs mērķa blīvumu paredzētajā laikā.
Standartizācija dažādās attēlveidošanas platformās
Dažādi mikroskopi, kameras un attēlveidošanas apstākļi var radīt attēlus ar atšķirīgām īpašībām, kas var mulsināt mākslīgā intelekta modeļus, kuri apmācīti uz konkrētas platformas attēliem. Uzņēmumā Cytion mēs risinām starpplatformu mainīguma problēmu, izmantojot visaptverošas attēlu pirmapstrādes un normalizēšanas cauruļvadus, kas īstenoti Python valodā, izmantojot OpenCV un scikit-image bibliotēkas. Mūsu standartizācijas darbplūsma ietver: plakanā lauka korekciju, lai kompensētu nevienmērīgu apgaismojumu (katra attēla dalīšana ar standarta plakanā lauka attēlu, atņemot tumšo strāvu), krāsu normalizāciju spilgtā lauka attēliem, izmantojot histogrammas saskaņošanu vai Reinharda krāsu pārnesi, intensitātes pārrēķināšanu uz standartizētu dinamisko diapazonu ([0,1] float vai [0,255] uint8) un izšķirtspējas saskaņošanu, izmantojot divkubisko interpolāciju, ja dažādu sistēmu attēliem ir dažādi pikseļu izmēri. Fāžu kontrasta attēliem, kas ir īpaši jutīgi pret optiskajiem iestatījumiem, mēs izmantojam uz CycleGAN balstītu domēna pielāgošanu, kas viena mikroskopa attēlus pārveido tā, lai tie atbilstu otra mikroskopa izskata attēliem, apmācot tos uz abu sistēmu nepāra attēlu kopām. Šī pirmapstrāde nodrošina, ka modeļi, kas apmācīti uz IncuCyte attēliem, pēc standartizācijas vienlīdz labi darbojas uz ImageXpress vai EVOS attēliem. Mēs apstiprinām standartizācijas efektivitāti, izmērot modeļu veiktspējas pasliktināšanos, kad tie tiek piemēroti jaunām platformām: pirms standartizācijas precizitāte samazinās par 12-25 %, kad vienā sistēmā apmācītie modeļi tiek piemēroti citai sistēmai; pēc standartizācijas pasliktināšanās samazinās līdz <5 %. Mūsu standartizācijas cauruļvads ir automatizēts mūsu attēlu analīzes infrastruktūrā, piemērojot atbilstošas transformācijas, pamatojoties uz metadatu tagiem, kas norāda avota mikroskopu, lai attēli no visām platformām plūstu cauri vienotām analīzes darbplūsmām. Šāda starpplatformu stabilitāte ir būtiska darbībai vairākās darbavietās un ļauj dalīties ar apmācītiem modeļiem visā šūnu kultūru pētnieku kopienā, attīstot šo jomu tālāk par atsevišķu laboratoriju implementācijām.
Integrācija ar laboratorijas automatizāciju
Ar mākslīgo intelektu darbināma attēlu analīze kļūst vēl jaudīgāka, ja to integrē ar automatizētām šūnu kultūru sistēmām. Uzņēmumā Cytion mēs esam ieviesuši slēgta cikla automatizāciju, kurā IncuCyte attēlu apstrādes sistēmas automatizētos inkubatoros (Liconic STX sērija) uztver attēlus ik pēc 2 stundām, Python analīzes cauruļvadi apstrādā attēlus 5 minūšu laikā pēc iegūšanas, izmantojot konteinerizētus secinājumu pakalpojumus (Docker uz Kubernetes), un analīzes rezultāti tiek ievadīti mūsu Hamilton VENUS automatizācijas kontrolierī, izmantojot REST API, lai iedarbinātu automatizētas darbības. Piemēram, kad konfluences analīze liecina, ka kultūras ir sasniegušas 85 % (optimālais caurlaides blīvums), sistēma automātiski ģenerē darba sarakstu VENUS sistēmā, kas plāno šķidrumu apstrādes robotu veikt caurlaides operācijas (aspirēt barotni, pievienot tripsīnu, neitralizēt, saskaitīt šūnas, iesēt jaunas kolbas) nākamo 4 stundu laikā. Piesārņojuma noteikšanas varbūtība > 0,7 nekavējoties nosaka karantīnu skartajām kultūrām, pārvietojot tās uz izolētām inkubatoru zonām un ģenerējot steidzamus brīdinājumus, tādējādi novēršot piesārņojuma izplatīšanos. Dzīvotspējas aplēses < 80 % aptur automatizētu apstrādi un atzīmē kultūras manuālai ekspertu pārbaudei. Šī integrācija rada autonomas kultūru pārvaldības sistēmas, kas uztur optimālu šūnu veselību ar minimālu cilvēka iejaukšanos - mūsu integrētās sistēmas sekmīgi kultivē vairāk nekā 200 vienlaicīgu šūnu līniju, 92 % pasāžas operāciju veicot pilnīgi automātiski, un cilvēka iesaistīšanās nepieciešama tikai 8 % kultūru, kas atzīmētas par ārkārtas apstākļiem. Slēgtā cikla darbība ietver drošības bloķēšanu: Mākslīgā intelekta prognozes, kas ir zemākas par ticamības robežvērtībām (parasti 0,75), izraisa manuālu pārskatīšanu, nevis automātiskas darbības, un visi automātiskie lēmumi tiek reģistrēti kopā ar paskaidrojuma datiem, lai tos varētu izsekot un nepārtraukti uzlabot. Sistēmas veiktspējas uzraudzība seko līdzi galvenajiem rādītājiem, tostarp kļūdaini pozitīviem piesārņojuma atklāšanas rādītājiem (mērķis <2%), accuracy of confluence-based passage timing (>90 % caurlaižu notiek pie 80-95 % saplūšanas) un korelācijai starp prognozēto un izmērīto dzīvotspēju pēc caurlaišanas (r>0,8), reizi ceturksnī veicot pārskatus, lai nodrošinātu veiktspējas atbilstību specifikācijām.
Mācību datu ģenerēšana un anotēšana
Mākslīgā intelekta modeļu veiktspēja ir būtiski atkarīga no mācību datu kvalitātes un kvantitātes. Uzņēmumā Cytion mēs uzturam plašas, rūpīgi anotētas attēlu datubāzes, kas aptver visu mūsu šūnu līniju katalogu dažādos apstākļos un ar dažādiem pasāžu numuriem, un pašlaik kopā ir > 150 000 anotētu attēlu, kas veido > 2 000 stundas ekspertu anotācijas darba. Mūsu anotācijas stratēģija apvieno vairākas pieejas: manuālu anotāciju, ko veic šūnu kultūru eksperti, izmantojot tādus rīkus kā LabelImg un VGG Image Annotator (VIA) segmentācijas maskām un klašu marķējumiem, daļēji automatizētu anotāciju, kur sākotnējās AI prognozes pārskata un koriģē eksperti (anotācijas laiks samazinās par 60 %, vienlaikus saglabājot precizitāti), un aktīvo mācīšanos, kur modeļi identificē attēlus ar augstu prognožu nenoteiktību, lai anotācijas prioritāšu noteikšanai koncentrētos uz galējiem gadījumiem. Mēs nodrošinām stingru anotācijas kvalitātes kontroli, izmantojot savstarpējās uzticamības testēšanu - trīs neatkarīgi anotatori marķē 100 attēlu apakškopas, panākot Koena kappa >0,85 atbilstību klasifikācijas uzdevumiem un IoU >0,90 segmentācijas anotācijām, tādējādi apstiprinot anotācijas konsekvenci. Pastāvīgai uzlabošanai mēs ieviešam sistemātiskus datu vākšanas protokolus: visi ražošanas attēli tiek automātiski arhivēti ar metadatiem (šūnu līnija, pasāža, datums, attēlveidošanas sistēma, kultūras apstākļi), regulārās partijās tiek veikta ekspertu anotācija, kas palielina mācību kopu daudzveidību, un attēli, kas saistīti ar kvalitātes kontroles kļūdām vai neparastiem notikumiem, tiek anotēti prioritārā secībā, lai uzlabotu gadījumus, kad ir jāuzlabo to apstrāde. Datu papildināšana paplašina efektīvo mācību kopas lielumu: rotācijas (0-360°), horizontālie/vertikālie apgriešanas leņķi, spilgtuma/kontrasta korekcija (±20 %), elastīgas deformācijas (imitējot mikroskopa lauka svārstības) un Gausa trokšņa pievienošana (σ=0,1) mācību laikā rada papildinātus variantus, efektīvi 10 reizes palielinot mācību datus, vienlaikus uzlabojot modeļa noturību pret dabiskām attēlu variācijām. Mēs arī veidojam specializētas datu kopas īpašiem uzdevumiem: piesārņojuma noteikšanas datu kopa ietver vairāk nekā 5000 attēlu ar baktērijām, sēnītēm un mikoplazmu piesārņotām kultūrām; retas morfoloģijas datu kopa fiksē neparastus fenotipus, atlūzas, artefaktus; daudzposmu datu kopa izseko atsevišķas šūnu līnijas P5-P30, dokumentējot novecošanos un fenotipu novirzes. Šī visaptverošā, labi apkopoto mācību datu infrastruktūra ir mūsu mākslīgā intelekta kvalitātes kontroles sistēmu precizitātes un uzticamības pamatā.
Modeļu validācija un veiktspējas uzraudzība
Pirms mākslīgā intelekta modeļu izmantošanas kvalitātes kontroles lēmumu pieņemšanai ir būtiski veikt rūpīgu validāciju. Uzņēmumā Cytion mēs ievērojam strukturētus validācijas protokolus, kas saskaņoti ar FDA vadlīnijām par programmatūras validāciju un mašīnmācīšanos medicīnas ierīcēm (piemērojami principi GMP šūnu ražošanai): mēs sadalām datu kopas mācību (70 %), validācijas (15 %) un testa (15 %) kopās, izmantojot stratifikāciju, lai nodrošinātu, ka visas šūnu līnijas un apstākļi ir proporcionāli pārstāvēti; izstrādes laikā veicam k-kārtēju krustenisko validāciju (k = 5), lai novērtētu modeļa vispārināmību; novērtējam veiktspēju, izmantojot mācību laikā neredzētas testa kopas, izmantojot visaptverošus rādītājus, tostarp precizitāti, precizitāti, atsaukšanu, F1 punktu klasifikācijas uzdevumiem, R², MAE, RMSE regresijas uzdevumiem un AUC-ROC līknes varbūtības prognozēm; salīdzināt mākslīgā intelekta prognozes ar "zelta standarta" mērījumiem (eksperta manuāls novērtējums, plūsmas citometrija dzīvotspējas noteikšanai, mikroskopa režģa skaitīšana konfluences noteikšanai) dažādos testa apstākļos; un veikt perspektīvu validāciju, kurā modeļi darbojas ēnu režīmā paralēli standarta QC 3 mēnešus pirms ieviešanas, salīdzinot prognozes ar faktiskajiem QC rezultātiem. Pēc izvietošanas mēs īstenojam nepārtrauktu veiktspējas uzraudzību: automatizētu AI prognožu salīdzināšanu ar periodiskiem ekspertu novērtējumiem (20 % kultūru tiek veikta paralēla ekspertu novērtēšana), prognožu ticamības rezultātu izsekošanu laika gaitā (ticamības samazināšanās var liecināt par datu novirzi), korelācijas analīzi starp AI kvalitātes rādītājiem un pakārtotajiem partijas veiktspējas rādītājiem (dzīvotspēja pēc pasāžas, paplašināšanās panākumi) un ceturkšņa validācijas pārskatus, kuros pārbauda modeļu veiktspēju dažādās šūnu līnijās un darbības apstākļos. Mēs uzturam detalizētu validācijas dokumentāciju, tostarp modeļa arhitektūras specifikācijas, mācību datu raksturlielumus (lielums, daudzveidība, anotācijas kvalitāte), veiktspējas salīdzinošo testu rezultātus un modeļa atjauninājumu izmaiņu kontroles ierakstus. Ja modeļa veiktspēja pasliktinās zem pieņemšanas kritērijiem (piemēram, konfluences precizitāte samazinās zem ±5 %, piesārņojuma noteikšanas AUC <0,90), mēs veicam pārkvalificēšanu vai atkārtotu kalibrēšanu: vācam papildu mācību datus no jaunākajām ražošanas partijām, pārkvalificējam modeļus ar atjauninātām datu kopām, validējam atjauninātos modeļus ar jaunām testu kopām un īstenojam kontrolētu izvietošanu, kad atjauninātie modeļi pirms pilnīgas izvietošanas sākotnēji darbojas ēnu režīmā. Šī stingrā validēšanas un uzraudzības sistēma nodrošina, ka mūsu mākslīgā intelekta darbinātais QC saglabā precizitāti un uzticamību laika gaitā, neraugoties uz šūnu līniju portfeļu attīstību, attēlveidošanas aprīkojuma izmaiņām un dabisko datu novirzi.
AI attēlu analīzes turpmākā attīstība
Ar mākslīgo intelektu darbināmu šūnu attēlu analīzes joma turpina strauji attīstīties, un jaunās metodes sola vēl lielākas iespējas. Izstrādes, kurām mēs aktīvi sekojam līdzi un kuras izmēģinām Cytion, ir šādas: 3D attēlu analīze, izmantojot tilpuma segmentācijas tīklus (3D U-Net) organoīdu un sferoīdu kultūrām, kas ļauj izmērīt organoīdu izmērus, morfoloģiju un iekšējo struktūru no Z-stack attēliem; fluorescences prognozēšana bez marķējuma, kur modeļi, kas apmācīti uz spilgtā lauka/fluorescences attēlu pāriem, mācās prognozēt fluorescences modeļus tikai no spilgtā lauka attēliem, potenciāli aizstājot dažas krāsošanas prasības; pašuzraudzītas mācīšanās metodes (SimCLR, BYOL), kas mācās noderīgas reprezentācijas no nemarķētiem attēliem, samazinot anotācijas prasības, mācoties vispārīgas šūnu attēlu iezīmes bez manuāla marķējuma; pamatmodeļi šūnu bioloģijai (analogi GPT valodai), kas iepriekš apmācīti, izmantojot milzīgas dažādu šūnu attēlu datu kopas, kuras var precīzi pielāgot konkrētiem uzdevumiem ar minimālu datu apjomu; reāllaika analīze tiešraides attēlu uzņemšanas laikā ar secību < 1 sekunde, kas ļauj nekavējoties saņemt atgriezenisko saiti automatizētiem eksperimentiem; un prognozēšanas modeļi, kas prognozē kultūras rezultātus stundām vai dienām uz priekšu no agrīnās fāzes attēliem, apmācīti, izmantojot garengriezuma datu kopas, kas saista agrīno attēlu pazīmes ar galīgās partijas kvalitāti. Mēs pētām arī multimodālu integrāciju, apvienojot mikroskopijas attēlus ar molekulārās profilēšanas datiem (RNS-seq, proteomika), lai atklātu attēlu biomarķierus, kas prognozē molekulāros fenotipus, un fizikāli informētus neironu tīklus, kuros iekļauti bioloģiskie ierobežojumi (šūnu cikla dinamika, barības vielu patēriņa kinētika), lai uzlabotu prognožu precizitāti un samazinātu datu prasības. Šīm tehnoloģijām pilnveidojoties, mēs ceram panākt vēl agrīnāku problēmu atklāšanu, izmantojot pašreizējām metodēm neredzamas smalkas pirmsimptomātiskas izmaiņas, precīzāku kvalitātes novērtēšanu, integrējot dažādus datu veidus, un padziļinātu ieskatu par faktoriem, kas ietekmē kultūras panākumus. Šie sasniegumi ļaus Cytion turpināt piegādāt augstākās kvalitātes šūnas un šūnu līnijas ar vēl lielāku konsekvenci un efektivitāti, saglabājot vadošo pozīciju kvalitātes un inovāciju jomā.