세포 배양 품질 관리를 위한 AI 기반 이미지 분석

싸이티온은 고품질의 세포 및 세포주를 생산하기 위해서는 세포 배양 상태를 육안으로 평가하는 것이 필수적이라는 것을 잘 알고 있습니다. 기존의 현미경 기반 품질 관리는 사람의 전문 지식과 주관적인 해석에 크게 의존하며, 이는 작업자마다 그리고 시간이 지남에 따라 달라질 수 있습니다. 인공지능 기반 이미지 분석은 이러한 주관적인 프로세스를 객관적이고 정량적이며 확장 가능한 품질 관리 시스템으로 전환하여 모든 세포주 제품에서 일관된 제품 품질을 보장합니다. 세분화를 위한 U-Net 아키텍처, 분류를 위한 ResNet-50 및 EfficientNet 모델, 전이 학습 및 앙상블 방법과 같은 고급 컴퓨터 비전 기술을 포함한 딥러닝 알고리즘을 활용하여 세포 형태의 미세한 변화를 감지하고 오염을 조기에 식별하며 배양 상태 및 다운스트림 애플리케이션 준비에 대한 데이터 기반 의사 결정을 내릴 수 있습니다. 당사의 AI 시스템은 매월 50,000개 이상의 HeLa 세포, HEK293 세포 및 기타 중요 세포주 생산 이미지를 처리하여 여러 매개변수에서 95% 이상의 정확도로 일관된 품질 평가를 제공합니다.

AI 분석 기능	품질 관리 애플리케이션	수동 평가에 비해 유리한 점
자동화된 합류 측정	최적의 통과 타이밍 결정	±2% 정확도 대 ±15~20% 수동 변동률
형태학 분류	표현형 변화 및 분화 감지	육안으로 보이지 않는 미묘한 변화 식별
오염 감지	박테리아, 곰팡이, 마이코플라즈마 조기 식별	육안 검사보다 24-48시간 빠른 검출
생존력 평가	비침습적 세포 상태 모니터링	염료 기반 분석 없이 지속적인 모니터링
다중 파라미터 표현형 분석	포괄적인 세포주 특성 분석	50개 이상의 특징 동시 분석 대 3-5개의 수동 분석

세포 이미지 분석의 딥러닝 혁명

세포 배양 이미징에 딥러닝을 적용하는 것은 품질 관리 접근 방식에 근본적인 변화를 의미합니다. 탐지할 특징을 명시적으로 프로그래밍해야 하는 기존의 이미지 분석 알고리즘과 달리, 딥러닝 모델은 수천 개의 훈련 이미지에서 관련 특징을 자동으로 학습할 수 있습니다. 사이티온은 의미적 분할(픽셀 수준의 정확도로 셀 경계 식별)을 위한 U-Net, 특징 추출(원시 픽셀에서 계층적 표현 학습)을 위한 ResNet-50, 분류 작업(정상 세포와 스트레스 세포 구분)을 위한 EfficientNetB4 등 검증된 모델을 기반으로 맞춤형 컨볼루션 신경망(CNN) 아키텍처를 개발해 왔습니다. 현재 200개 이상의 세포 유형, 여러 통로 번호(P2-P30), 다양한 배양 조건(표준, 스트레스, 오염), 다양한 이미징 양식(위상차, 명시야, 형광)을 포함하는 15만 개 이상의 주석이 달린 이미지 등 광범위한 이미지 데이터베이스를 기반으로 모델을 학습시켰습니다. 이 모델은 합류 추정에서 95% 이상의 정확도, 오염 검출에서 92% 이상의 감도, 형태 분류에서 88% 이상의 정확도를 달성합니다. 훈련 프로세스는 데이터 증강 기법(회전, 뒤집기, 밝기 조정, 탄성 변형)을 사용해 모델 견고성을 개선하고, ImageNet 사전 훈련 가중치에서 전이 학습을 수행하여 수렴을 가속화합니다. 모델 훈련은 모델 복잡도에 따라 32-64개의 이미지 배치 크기와 12-48시간의 훈련 시간을 가진 NVIDIA A100 GPU 클러스터에서 학습 속도 스케줄링 및 검증 세트 성능에 따른 조기 중지 기능을 갖춘 Adam 옵티마이저를 사용하여 수행됩니다.

자동화된 컨플루언스 측정 및 성장 추적

세포 배양 표면의 몇 퍼센트가 세포로 덮여 있는지를 결정하는 Confluence 측정은 세포 배양에서 가장 중요하면서도 주관적인 평가 중 하나입니다. 싸이티온에서는 시맨틱 세분화 작업을 위해 특별히 설계된 U-Net 컨볼루션 신경망 아키텍처를 사용하여 0.90 이상의 IoU(Intersection over Union) 점수로 세포 대 배경 영역의 픽셀 수준 분류를 달성합니다. U-Net 구현은 3×3 컨볼루션과 2×2 최대 풀링을 사용하는 4개의 다운샘플링 단계가 있는 축소 경로(인코더)와 이전 계층의 공간 정보를 보존하는 업샘플링 및 스킵 연결이 있는 확장 경로(디코더)를 특징으로 합니다. 이 네트워크는 이진 교차 엔트로피와 주사위 손실 함수를 조합하여 클래스 불균형을 처리하기 위해 전문 세포 배양 과학자가 세포 경계에 라벨을 붙인 수동 주석이 달린 이미지로 학습됩니다. 학습된 모델은 2048×2048픽셀 이미지를 GPU에서 300밀리초 이내에 처리하여 임계값이 설정된 픽셀 단위 확률 맵을 생성하여 이진 마스크를 생성하고, 이로부터 (세포 픽셀/총 픽셀) × 100으로 합류 비율을 계산합니다. 이 자동화된 합류 측정은 전문가의 수동 주석과 비교하여 검증할 때 ±2% 이내의 정확도를 달성하는데, 이는 사람마다 ±15~20%의 편차를 보이는 것과 비교됩니다. 단일 시점 측정 외에도, 당사의 시스템은 시간에 따른 합류를 추적하여 성장 곡선(지수 곡선 피팅으로 합류 대 시간을 플로팅)을 생성함으로써 배양 시간 계산, 최적의 통과 시기 예측(일반적으로 80-90% 합류 시), 세포주 노화, 배지 품질 문제 또는 인큐베이터 문제를 나타낼 수 있는 비정상적으로 천천히 성장(예상 성장률보다 2표준편차 이상)하는 배양을 식별할 수 있도록 지원합니다. 세포 및 세포주 카탈로그의 경우, 이러한 정밀한 성장 추적은 세포 품질과 생존력을 극대화하는 최적의 수확 시기를 보장합니다.

형태학적 분석 및 표현형 안정성

세포 형태는 세포의 건강, 정체성, 기능 상태에 대한 풍부한 정보를 제공합니다. 싸이티온은 컴퓨터 비전 알고리즘과 딥러닝 기반 특징 추출을 사용하여 포괄적인 형태학적 특징을 추출합니다. 세포 세분화에 이어 세포 면적(µm²), 둘레(µm), 원형도(4π×면적/둘레²), 종횡비(장축/부축), 단단함(면적/볼록한 선체 면적), 대비, 상관관계, 에너지, 동질성을 포함한 회색 수준 발생 행렬(GLCM)을 기반으로 텍스처 특징을 포함한 고전적 형태학 설명자를 계산합니다. 또한 이미지넷에서 사전 학습되고 셀 이미지 데이터 세트에서 미세 조정된 ResNet-50 컨볼루션 네트워크를 사용해 수작업 피처로는 쉽게 설명할 수 없는 미묘한 형태학적 패턴을 포착하는 2,048차원의 심층 피처 벡터를 추출합니다. 이러한 다중 스케일 특징(기존 형태 측정과 딥 피처를 결합한)은 무작위 숲 분류기(100개의 나무, 지니 불순물 기준) 또는 지원 벡터 머신(RBF 커널, C=1.0, 감마=자동)에 입력되어 92% 이상의 정확도로 정상 형태와 비정상 표현형을 구별합니다. 품질 관리를 위해 각 세포주에 대한 참조 형태 프로파일을 카탈로그에 유지합니다. 예를 들어 HeLa 세포는 평균 면적 450±80 µm², 원형도 0.65±0.12의 특징적인 상피 형태를 보이는 반면, HEK293 세포는 380±70 µm²의 면적에 0.72±0.10의 높은 원형도를 보입니다. 형태학적 드리프트 감지는 호텔링의 T² 통계를 사용하여 현재 배치 형태가 기준 분포(p<0.05 임계값)에서 크게 벗어나는지 테스트하여 원치 않는 분화, 유전적 드리프트 또는 최적의 배양 조건을 나타낼 수 있는 표현형 변화가 감지되면 검토를 위해 배양에 플래그를 지정합니다.

오염 조기 감지

오염은 세포 배양 작업에 가장 심각한 위협 중 하나로, 잠재적으로 배양 손실, 자원 낭비, 실험 결과의 손상으로 이어질 수 있습니다. 싸이티온은 박테리아 오염(작은 입자 파편, 배지 탁도, 페놀 레드 함유 배지의 색상 변화로 보이는 pH 변화의 급격한 증가), 진균 오염(균사 구조, 포자로 보이는), 마이코플라즈마 감염(미묘한 형태 변화, 성장률 감소, 입도 증가) 등 오염된 배양의 선별된 데이터 세트에서 훈련된 특수 오염 감지 모델을 개발했습니다. Basler의 탐지 시스템은 2단계 접근 방식으로 학습된 EfficientNetB4 아키텍처(16.8M 파라미터, 깊이, 폭, 해상도의 복합 스케일링)를 사용합니다: 첫째, 깨끗한 카테고리와 오염된 카테고리로 분류(이진 교차 엔트로피 손실, AUC-ROC 0.96 달성); 둘째, 오염 유형을 식별하는 다중 클래스 분류(범주 교차 엔트로피, 세균/진균/마이코플라즈마/효모 카테고리 전반에서 85%의 정확도). 이 모델은 비정상적인 입자 분포(블롭 감지 알고리즘을 통해 감지), 미디어 외관 변화(LAB 색 공간에서 정량화된 색상 변화), 비정상적인 세포 형태 패턴 등 여러 이미지 특징을 분석합니다. 현재 이미지를 24-48시간의 과거 기준선과 비교하는 시계열 분석을 통해 작업자가 육안으로 확인하기 전에 오염이 진행 중인 것을 감지할 수 있으며, 일반적으로 수동 검사에 비해 24-48시간 더 일찍 경고를 제공합니다. 오염 확률이 임계값 0.7을 초과하면 자동화된 경고가 이메일과 LIMS 알림을 통해 QC 담당자에게 통보되어 육안 확인, 그람 염색(박테리아 오염), 마이코플라스마 PCR 검사 등 즉각적인 조사가 시작됩니다. 이 AI 강화 오염 감시 기능은 조기 발견 및 개입을 통해 Cytion에서 오염 관련 배치 손실을 60%까지 줄였으며, 특히 프로세스 후반에 오염이 발생하면 상당한 자원 손실이 발생하는 장기 배양 및 고가 세포주 개발 프로젝트에 유용합니다.

비침습적 생존율 평가

트리판 블루 또는 기타 막 불투과성 염료를 사용하는 기존의 생존력 평가는 배양에서 세포를 샘플링해야 하므로 파괴적이며 시간적 해상도가 제한됩니다. 싸이티온은 머신러닝을 사용하여 라벨이 없는 명시야 또는 위상차 이미지에서 세포 생존력을 추정하는 형태학 기반 생존력 예측 모델을 개발했습니다. 이 접근 방식은 죽어가는 세포와 죽은 세포는 세포 수축, 막 출혈, 세포질 과립화, 세포-기질 접착력 상실, 빛 굴절 증가 등 특징적인 형태학적 변화를 보인다는 관찰을 기반으로 합니다. 개별 분할된 세포에서 156개의 형태 및 질감 특징을 추출한 다음 특징 선택(교차 검증을 통한 재귀적 특징 제거)을 사용하여 세포 면적, 주변 불규칙성, 평균 픽셀 강도, 강도 분산 및 GLCM 질감 설명자를 포함한 가장 예측력이 높은 35개의 특징을 식별했습니다. 이러한 특징으로 훈련된 그라데이션 부스팅 회귀 모델(200개의 추정자, 학습률 0.1, 최대 깊이 6)은 병렬 샘플에 대해 수행된 골드 표준 트라이판 블루 제외 측정과 비교하여 검증했을 때 R²=0.87로 생존율을 예측합니다. 이 모델은 다양한 세포 유형과 통과 수에 걸쳐 50%에서 99%의 생존율 범위를 포함하는 12,000개의 이미지-생존율 쌍에 대해 학습되었습니다. 생산 모니터링을 위해 이 시스템은 2~4시간마다 캡처한 이미지를 IncuCyte 라이브 세포 분석 시스템으로 처리하여 배양을 방해하지 않고 지속적인 생존율 추세 데이터를 생성합니다. 갑작스러운 생존율 감소(12시간 내 10% 이상 감소)는 조사를 위한 경고를 트리거하고, 점진적인 감소 추세는 통과 시기를 결정하는 데 정보를 제공하며, 일반적으로 세포 건강을 유지하기 위해 90% 이상의 예측 생존율에서 통과합니다. 이 비침습적 생존율 모니터링은 기존 샘플링이 더 혼란스러운 현탁 배양 및 생물 반응기 시스템과 세포 건강을 모니터링하면서 배양 무결성을 보존하는 것이 필수적인 선별 실험에 특히 유용합니다.

다중 파라미터 품질 스코어링

AI 시스템은 단일 메트릭에 의존하는 대신 이미지에서 파생된 여러 매개변수를 종합적인 품질 점수로 통합할 수 있습니다. 싸이티온은 합류(통과율 80-90% 목표), 형태 점수(0-100 척도, 75 이상은 정상 형태), 생존율 추정(90% 이상 목표), 오염 위험(0.1 확률 임계값 미만), 배양 균일성(세포 크기/형태의 변동 계수, 20% 미만 목표)을 가중 앙상블 방법을 사용하여 전체 QC 점수로 결합하는 총체적인 품질 평가 모델을 개발했습니다. 이 앙상블은 전문 모델의 예측을 결합합니다: U-Net 합류(가중치 0.25), ResNet-50 형태 분류기(가중치 0.30), EfficientNet 오염 검출기(가중치 0.25), XGBoost 생존력 회귀(가중치 0.15) 등 전문 모델의 예측과 홀드아웃 검증 세트에서 그리드 검색을 통해 최적화된 가중치로 전문가 QC 결정과의 상관관계를 최대화합니다. 최종 QC 점수는 0-100점 범위의 자동화된 결정 규칙에 따라 85점 이상 = 합격(통과/수확 진행), 70-84점 = 경계선(수동 검토 플래그), 70 미만 = 불합격(조사 또는 폐기)으로 나뉩니다. 이러한 다중 매개변수 평가는 생산 과정에서 출시 결정을 위한 객관적이고 정량적인 기준을 제공하며, 싸이티온에서는 배양이 다음 통과 또는 최종 수확으로 진행되기 전에 반드시 QC 점수 ≥85점을 획득하여 일관된 제품 품질을 보장합니다. 생산 데이터를 분석한 결과, AI QC 점수와 통과 후 생존율 및 확장 성공을 포함한 다운스트림 배양 성과 지표 간에 강력한 상관관계(r=0.82)가 있는 것으로 나타나 통합 채점 방식의 예측 가치가 입증되었습니다. 자동화된 채점 시스템은 수동 현미경 검사에 45~60분이 걸리는 데 비해 전체 마이크로플레이트 이미지(96개 웰)를 8~12분 만에 처리하여 생산 워크플로우를 효율적으로 유지하는 실시간 QC 결정을 내릴 수 있습니다.

전이 학습 및 모델 적응

세포 배양 분석에 AI를 구현할 때 어려운 점 중 하나는 특히 특수하거나 희귀한 세포주에 대한 대규모 학습 데이터 세트가 필요하다는 점입니다. 전이 학습은 대규모 일반 이미지 데이터 세트(140만 개의 이미지, 1000개의 카테고리가 있는 ImageNet)로 사전 학습된 모델로 시작한 다음 세포 배양에 특화된 이미지를 미세 조정함으로써 이 문제를 해결합니다. 사이티온에서는 전이 학습을 광범위하게 활용합니다. ImageNet에서 사전 학습된 가중치(예: ResNet-50, EfficientNetB4)로 모델을 초기화한 다음, 학습 데이터 요구 사항을 크게 줄인 세포 이미지 데이터 세트를 사용하여 최종 레이어 또는 전체 네트워크를 미세 조정합니다. 예를 들어, 새로운 형태 분류기를 새로 개발하려면 10,000개 이상의 주석이 달린 이미지가 필요할 수 있지만, 전이 학습은 1,000~2,000개의 이미지로 비슷한 성능을 달성할 수 있습니다. 당사의 미세 조정 프로토콜은 처음부터 학습하는 것(1e-2~1e-3)에 비해 낮은 학습 속도(1e-4~1e-5)를 사용하며, 일반적으로 검증 손실 고원에 따라 조기 중단을 통해 20~50회 동안 학습하고, 초기 계층(일반 특징)은 천천히 업데이트하고 후기 계층(세포별 특징)은 빠르게 업데이트하는 차별적 학습 속도를 채택하고 있습니다. 세포 및 세포주 카탈로그에 추가된 새로운 세포주에 대해서는 생산 배치에서 축적된 이미지로 모델을 주기적으로 재학습하는 연속 학습을 구현하며, 일반적으로 분기별로 500-1000개의 새로운 검증된 이미지를 통합하는 업데이트를 통해 세포주 포트폴리오가 확장됨에 따라 모델 정확도를 유지합니다. 최대 평균 불일치(MMD) 및 적대적 훈련과 같은 도메인 적응 기술은 모델이 이미징 플랫폼 전반에서 일반화되도록 지원하며, 여러 현미경 시스템(IncuCyte, ImageXpress, EVOS)의 데이터로 훈련하여 획득 하드웨어에 관계없이 강력한 성능을 보장합니다.

설명 가능한 AI 및 품질 보증

딥러닝 모델은 놀라운 정확도를 달성할 수 있지만, 결정의 근거를 이해하는 것이 중요한 품질 관리 애플리케이션에서는 '블랙박스' 특성이 문제가 될 수 있습니다. 싸이티온에서는 설명 가능한 AI(XAI) 기술을 구현하여 모델 결정을 해석 가능하고 신뢰할 수 있게 만듭니다. 예를 들어, 오염 감지가 관련 없는 배경 특징보다는 파편 입자와 형태 변화에 초점을 맞춘다는 것을 보여주는 등 분류 결정에 가장 큰 영향을 미치는 이미지 영역을 강조하는 히트맵을 생성하기 위해 Grad-CAM(그라데이션 가중 클래스 활성화 매핑)을 사용합니다. 각 특징의 개별 예측에 대한 기여도를 정량화한 SHAP(SHapley Additive exPlanations) 값을 통해 합류 예측은 주로 세포 밀도와 커버리지 메트릭에 의존하는 반면 생존력 예측은 막 무결성과 세포질 질감 특징에 큰 비중을 둔다는 것을 알 수 있습니다. 형태 분류의 경우, 학습된 필터를 컨볼루션 레이어로 시각화하여 초기 레이어는 가장자리와 텍스처를 감지하고 더 깊은 레이어는 HeLa 세포의 상피 시트 형성이나 분화 세포 유형의 뉴런 유사 과정과 같은 세포별 패턴을 인식하는 것을 보여줍니다. 이러한 XAI 시각화는 AI가 생물학적으로 관련된 특징을 기반으로 의사 결정을 내리는지 확인할 수 있는 QC 담당자 간의 신뢰를 구축하고, 예상치 못한 예측이 발생했을 때 어떤 특징이 결정을 내리는지 파악하여 문제 해결을 용이하게 하며, 신규 직원에게 품질 평가에 중요한 특징을 보여주는 교육 자료를 제공하는 등 다양한 용도로 사용됩니다. 또한 플래그가 지정된 문화 또는 경계선 문화에 대한 설명 시각화를 표시하는 XAI 대시보드를 유지하여 AI가 평가를 내린 이유에 대한 컨텍스트와 함께 전문가의 신속한 검토를 가능하게 합니다. 이러한 투명성은 AI 기반 QC의 규제 승인에 매우 중요한 요소로, GMP 생산을 위한 검증 패키지에는 모델이 기존의 전문가 평가 원칙에 따라 과학적으로 타당한 기준에 따라 의사 결정을 내리는 것을 보여주는 대표적인 XAI 시각화가 포함되어 있습니다.

고함량 분석 통합

AI 기반 이미지 분석은 여러 형광 채널을 캡처하고, 자동화된 Z-스태킹을 수행하고, 정밀 로봇 공학을 통해 전체 멀티웰 플레이트를 이미지화하는 고함량 이미징 플랫폼과 원활하게 통합됩니다. Cytion에서는 자동화된 Z-스태킹(1-50 평면, 0.5-10 µm 단계)과 정밀한 XY 스테이지 위치 지정(±1 µm 정확도)으로 최대 6개의 형광 채널(DAPI, FITC, TRITC, 텍사스 레드, Cy5, Cy5.5)과 투과광을 획득하는 Molecular Devices ImageXpress 마이크로 컨포컬 시스템을 배포하고 있습니다. 줄기세포 분화 효율 평가와 같은 고함량 애플리케이션의 경우, 계통 마커에 대한 면역 형광 염색을 사용한 후 핵 염색(DAPI 채널, 워터쉐드 알고리즘)을 기반으로 한 세포 분할, 형광 강도 임계값(Otsu의 방법으로 최적화)을 기반으로 마커 양성 대 음성으로 분류, 분화 효율의 정량화 등 AI 기반 분석을 통해 마커 양성 세포의 비율로 분화 효율을 평가할 수 있습니다. 다중 채널 분석을 통해 정교한 표현형 분석이 가능하여 핵 형태(크기, 모양, DAPI의 DNA 응축), 단백질 위치(채널 코로컬라이제이션 분석을 통한 핵 대 세포질), 세포 주기 상태(통합 DAPI 강도에서 얻은 DNA 함량 히스토그램 기반)를 동시에 정량화할 수 있습니다. 리포터 구조가 있는 엔지니어링 세포주의 경우, AI 분석과 결합된 고함량 이미징으로 클론 라이브러리를 선별합니다: 형질전환 유전자 발현을 확인하기 위한 GFP 형광 획득, 클론 이질성 평가를 위한 발현 강도 분포 측정(CV <25% 목표), 안정적인 고 발현 클론 식별을 위한 형태와의 발현 상관관계. 하이 콘텐츠 워크플로우에서는 매일 50~100GB의 이미지 데이터가 생성되므로 효율적인 데이터 관리(자동 압축, AWS S3의 클라우드 스토리지)와 고성능 컴퓨팅(분당 200개의 이미지를 처리하는 NVIDIA A100 클러스터의 GPU 가속 분석)이 필요합니다. 풍부한 다차원 데이터 세트를 생성하는 고함량 이미징 하드웨어와 각 이미징 세션에서 최대 정보를 추출하는 AI 분석 소프트웨어의 결합으로 수동 분석으로는 불가능한 정교한 세포주 특성 분석 및 품질 관리를 수행할 수 있습니다.

타임랩스 분석 및 동적 모니터링

타임랩스 현미경은 분열 속도, 이동 패턴, 환경 변화에 대한 반응 등 시간에 따른 세포 행동에 대한 귀중한 정보를 제공합니다. 싸이티온에서는 최대 14일 동안 15분~2시간 간격으로 이미지를 연속적으로 캡처하여 배양 웰당 100~1000개의 시계열 데이터 세트를 생성하는 Sartorius IncuCyte S3 시스템을 사용합니다. 이러한 타임랩스 시퀀스에 대한 AI 분석에는 TrackMate 또는 DeepCell과 같은 알고리즘을 사용하여 프레임 전체에서 개별 세포를 추적하는 단일 세포 추적, 유사 분열 이벤트(세포 라운딩, 후속 딸세포 분리)를 감지하여 분열 시간 측정, 세포 이동 속도 및 방향성(평균 제곱 변위, 지속 길이) 정량화, 세포 사멸 이벤트(특징적인 형태 변화, 세포 분리) 식별이 포함됩니다. 분열 추적의 경우, 5프레임 창에서 시공간적 특징을 분석하는 3D 컨볼루션 네트워크(C3D 아키텍처)를 사용하여 유사 분열 감지 정확도 87%를 달성하여 수동 세포 계수 측정과 높은 상관관계(r=0.91)를 보이는 인구 배가 시간을 자동으로 계산할 수 있습니다. 이동 분석은 광학 흐름 알고리즘과 딥러닝 기반 세포 세분화를 사용하여 프레임별로 세포 중심을 추적하고 이동 분석을 위한 속도(µm/시간)와 화학적 접촉 지수를 계산합니다. 타임랩스 데이터는 단일 시점 이미지에서는 보이지 않는 동적 동작을 보여줍니다. 증식 속도에 일주기적 진동이 있는 세포주를 식별하고, 하위 집단 구조를 나타내는 배양 내 이질적인 분열 속도를 감지하고, 세포 배양 배지 변경 또는 약물 처리에 대한 반응 동역학을 특성화했습니다. 품질 관리를 위해 타임랩스 모니터링은 엔드포인트 측정보다 훨씬 빠르게 성장 정지(24시간 이상 분열이 없는 경우) 또는 높은 사멸률(24시간당 5% 이상의 세포가 아포토시스 형태를 보이는 경우)을 감지하여 문제에 대한 조기 경고를 제공합니다. 또한 풍부한 시간적 데이터는 예측 모델링을 가능하게 합니다. 초기 단계의 성장 동역학(첫 24-48시간)을 사용하여 최종 세포 수율을 예측하고, 반복 신경망(128개의 숨겨진 유닛이 있는 LSTM 아키텍처)을 통해 훈련되어 배양이 예상 시점에 목표 밀도에 도달할지 82%의 정확도로 예측할 수 있습니다.

이미징 플랫폼 전반의 표준화

현미경, 카메라, 이미징 조건에 따라 다양한 특성을 가진 이미지가 생성될 수 있으며, 특정 플랫폼의 이미지로 학습된 AI 모델은 잠재적으로 혼동을 일으킬 수 있습니다. 사이티온은 OpenCV와 scikit 이미지 라이브러리를 사용해 Python으로 구현된 포괄적인 이미지 전처리 및 정규화 파이프라인을 통해 플랫폼 간 가변성을 해결합니다. 표준화 워크플로에는 고르지 않은 조명을 보정하기 위한 평평한 필드 보정(각 이미지를 참조 평평한 필드 이미지로 나누고 암전류 빼기), 히스토그램 매칭 또는 라인하드 컬러 전송을 사용한 밝은 필드 이미지의 색상 정규화, 표준화된 동적 범위([0,1] float 또는 [0,255] uint8)로 강도 재조정, 다른 시스템의 이미지가 픽셀 크기가 다른 경우 바이큐빅 보간을 통한 해상도 조화가 포함됩니다. 광학 설정에 특히 민감한 위상차 이미지의 경우, 두 시스템의 페어링되지 않은 이미지 세트에 대해 학습된 한 현미경의 이미지를 다른 현미경의 이미지와 일치하도록 변환하는 CycleGAN 기반 도메인 적응을 사용합니다. 이러한 전처리를 통해 IncuCyte 이미지에서 학습된 모델이 표준화 후 ImageXpress 또는 EVOS 이미지에서도 동일하게 잘 작동하도록 보장합니다. 새로운 플랫폼에 적용할 때 모델 성능 저하를 측정하여 표준화 효과를 검증합니다. 표준화 전에는 한 시스템에서 학습된 모델을 다른 시스템에 적용할 때 정확도가 12~25% 떨어지지만 표준화 후에는 5% 미만으로 저하가 감소합니다. 표준화 파이프라인은 이미지 분석 인프라에서 자동화되어 소스 현미경을 나타내는 메타데이터 태그를 기반으로 적절한 변환을 적용하므로 모든 플랫폼의 이미지가 통합된 분석 워크플로우를 통해 흐르도록 합니다. 이러한 플랫폼 간 견고성은 다중 사이트 운영에 필수적이며 세포 배양 연구 커뮤니티 전체에서 훈련된 모델을 공유할 수 있어 개별 실험실의 구현을 넘어 분야를 발전시킬 수 있습니다.

실험실 자동화와 통합

AI 기반 이미지 분석은 자동화된 세포 배양 시스템과 통합될 때 더욱 강력해집니다. 싸이티온에서는 자동화 인큐베이터(Liconic STX 시리즈) 내부의 인큐사이트 이미징 시스템이 2시간마다 이미지를 캡처하고, 파이썬 기반 분석 파이프라인이 컨테이너화된 추론 서비스(Kubernetes의 도커)를 사용하여 획득 후 5분 이내에 이미지를 처리하며, 분석 결과가 REST API를 통해 해밀턴 비너스 자동화 컨트롤러에 공급되어 자동화된 작업을 트리거하는 폐쇄 루프 자동화를 구현해왔습니다. 예를 들어, 합류 분석 결과 배양이 85%(최적의 통과 밀도)에 도달한 것으로 나타나면 시스템은 다음 4시간 이내에 액체 처리 로봇이 통과 작업(배지 흡인, 트립신 추가, 중화, 세포 계수, 새 플라스크 시드)을 수행하도록 VENUS에서 작업 목록을 자동으로 생성합니다. 오염 감지 확률이 0.7을 초과하면 오염된 배양액을 격리된 인큐베이터 구역으로 이동하고 긴급 경보를 발생시켜 오염 확산을 방지함으로써 즉시 격리합니다. 생존 가능성 추정치가 80% 미만이면 자동 처리를 일시 중지하고 전문가의 수동 검토를 위해 배양에 플래그를 지정합니다. 이러한 통합을 통해 사람의 개입을 최소화하면서 최적의 세포 상태를 유지하는 자율 배양 관리 시스템을 구축할 수 있으며, 통합 시스템은 92%의 통과 작업을 완전히 자동으로 수행하면서 200개 이상의 세포주를 동시에 성공적으로 배양하고 예외적인 조건으로 플래그가 지정된 8%의 배양에만 사람의 개입이 필요합니다. 폐쇄 루프 작동에는 안전 인터록이 포함되어 있습니다: 신뢰 임계값(일반적으로 0.75) 미만의 AI 예측은 자동 조치가 아닌 수동 검토를 트리거하며, 모든 자동화된 결정은 추적성과 지속적인 개선을 위해 설명 데이터와 함께 기록됩니다. 시스템 성능 모니터링은 오염 탐지에 대한 오탐률(목표 <2%), accuracy of confluence-based passage timing (>80~95% 합류점에서 90%의 통과 발생), 예측과 측정된 통과 후 생존 가능성 간의 상관관계(r>0.8) 등 주요 지표를 추적하며 분기별 검토를 통해 성능이 사양 내에서 유지되도록 보장합니다.

학습 데이터 생성 및 어노테이션

AI 모델의 성능은 학습 데이터의 품질과 양에 따라 결정적으로 달라집니다. 싸이티온은 다양한 조건과 통과 번호에 따라 모든 세포주 카탈로그를 포괄하는 광범위하고 세심한 주석이 달린 이미지 데이터베이스를 유지하고 있으며, 현재 총 15만 개 이상의 주석이 달린 이미지에 2,000시간 이상의 전문가 주석 작업을 거쳤습니다. 당사의 주석 전략에는 세분화 마스크 및 클래스 라벨을 위해 LabelImg 및 VGG Image Annotator(VIA) 같은 도구를 사용하는 전문 세포 배양 과학자의 수동 주석, 전문가가 초기 AI 예측을 검토하고 수정하는 반자동 주석(정확도는 유지하면서 주석 시간을 60% 단축), 모델이 예측 불확실성이 높은 이미지를 식별하는 능동 학습 등 다양한 접근 방식이 결합되어 있으며, 엣지 케이스에 중점을 둔 우선적인 주석 작업을 위해 우선적으로 사용됩니다. 평가자 간 신뢰성 테스트를 통해 엄격한 주석 품질 관리를 유지하며, 세 명의 독립적인 주석자가 100개의 이미지 하위 집합에 라벨을 지정하여 분류 작업의 경우 Cohen's kappa > 0.85 일치도, 세분화 주석의 경우 IoU > 0.90을 달성하여 주석의 일관성을 검증합니다. 지속적인 개선을 위해 모든 생산 이미지는 메타데이터(세포주, 통과, 날짜, 이미징 시스템, 배양 조건)와 함께 자동으로 보관되고, 일반 배치에는 전문가 주석을 추가하여 훈련 세트에 다양성을 더하며, QC 실패 또는 비정상적인 이벤트와 관련된 이미지에는 주석의 우선순위를 지정하여 엣지 케이스 처리를 개선하는 등 체계적인 데이터 수집 프로토콜을 구현하고 있습니다. 데이터 증강은 효과적인 훈련 세트 크기를 확장합니다. 회전(0-360°), 수평/수직 뒤집기, 밝기/대비 조정(±20%), 탄성 변형(현미경 필드 변화 시뮬레이션), 가우스 노이즈 추가(σ=0.1)는 훈련 중에 증강된 변형을 생성하여 훈련 데이터를 효과적으로 10배 늘리는 동시에 자연 이미지 변화에 대한 모델 강건성을 개선합니다. 오염 감지 데이터 세트에는 박테리아, 곰팡이, 마이코플라즈마에 오염된 배양물의 5,000개 이상의 이미지가 포함되어 있으며, 희귀 형태 데이터 세트에는 특이한 표현형, 파편, 아티팩트를 캡처하고, 다중 경로 데이터 세트에는 노화 및 표현형 드리프트를 기록한 P5-P30의 개별 세포주를 추적하는 등 특정 과제에 맞는 전문 데이터 세트도 큐레이팅되어 있습니다. 이 포괄적이고 잘 선별된 훈련 데이터 인프라는 AI 기반 품질 관리 시스템의 정확성과 신뢰성의 기본입니다.

모델 검증 및 성능 모니터링

품질 관리 결정을 위해 AI 모델을 배포하기 전에 엄격한 검증이 필수적입니다. 사이티온은 의료 기기용 소프트웨어 검증 및 머신러닝에 대한 FDA 지침(GMP 세포 생산에 적용되는 원칙)에 따른 구조화된 검증 프로토콜을 따릅니다: 데이터 세트를 훈련(70%), 검증(15%), 테스트(15%) 세트로 분할하여 모든 세포주와 조건이 비례적으로 대표되도록 계층화하고, 개발 중에 k배 교차 검증(k=5)을 수행하여 모델 일반화 가능성을 평가하고, 정확도, 정밀도, 리콜, 분류 작업을 위한 F1 점수, 회귀 작업을 위한 R², MAE, RMSE 및 확률 예측을 위한 AUC-ROC 곡선을 포함한 포괄적인 메트릭을 사용하여 훈련 중에 보지 못한 테스트 세트에 대한 성능을 평가합니다; 다양한 테스트 조건에서 AI 예측을 골드 표준 측정(전문가 수동 평가, 생존율에 대한 유세포 분석, 합류에 대한 현미경 그리드 카운팅)과 비교하고, 배포 전 3개월 동안 모델을 표준 QC와 병행하여 섀도 모드에서 실행하여 예측을 실제 QC 결과와 비교하는 전향적 검증을 수행합니다. 배포 후에는 정기적인 전문가 검토(배양의 20%는 전문가 평가 병행), 시간에 따른 예측 신뢰도 점수 추적(신뢰도 감소는 데이터 드리프트일 수 있음), AI 품질 점수와 다운스트림 배치 성능 지표(통과 후 생존력, 확장 성공) 간의 상관관계 분석, 세포주 및 작동 조건 전반에서 모델 성능을 검사하는 분기별 검증 검토 등 지속적인 성능 모니터링을 구현합니다. 모델 아키텍처 사양, 훈련 데이터 특성(크기, 다양성, 주석 품질), 성능 벤치마크 결과, 모델 업데이트를 위한 변경 제어 기록을 포함한 상세한 검증 문서를 유지합니다. 모델 성능이 허용 기준 이하로 저하되는 경우(예: 합류 정확도가 ±5% 이하로 떨어지거나 오염 탐지 AUC가 0.90 미만으로 떨어짐), 최근 생산 배치에서 추가 학습 데이터 수집, 업데이트된 데이터 세트로 모델 재학습, 새 테스트 세트에서 업데이트된 모델 검증, 전체 배포 전에 섀도 모드에서 업데이트 모델을 처음 실행하는 제어 배포 구현 등 재학습 또는 재보정을 트리거합니다. 이러한 엄격한 검증 및 모니터링 프레임워크는 진화하는 세포주 포트폴리오, 이미징 장비 변경, 자연스러운 데이터 드리프트에도 불구하고 시간이 지나도 AI 기반 QC가 정확성과 신뢰성을 유지하도록 보장합니다.

AI 이미지 분석의 향후 발전

AI 기반 세포 이미지 분석 분야는 더 뛰어난 기능을 약속하는 새로운 기술과 함께 빠르게 발전하고 있습니다. 사이티온에서 적극적으로 추적하고 시범 운영 중인 개발 사항은 다음과 같습니다: 오가노이드 및 구상체 배양에 체적 분할 네트워크(3D U-Net)를 사용한 3D 이미지 분석으로 Z-스택 이미지에서 오가노이드 크기, 형태 및 내부 구조를 측정할 수 있으며, 쌍을 이룬 명시야/형광 이미지로 훈련된 모델이 명시야 이미지만으로 형광 패턴을 예측하는 방법을 학습하여 일부 염색 요건을 잠재적으로 대체하는 라벨 없는 형광 예측, 라벨이 없는 이미지에서 유용한 표현을 학습하는 자기 지도 학습 기술(SimCLR, BYOL), 수동 라벨 없이 일반 세포 이미지 특징을 학습하여 주석 요구 사항을 줄이는 것 등이 있습니다; 최소한의 데이터로 특정 작업에 맞게 미세 조정할 수 있는 대규모의 다양한 세포 이미지 데이터 세트에 대해 사전 학습된 세포 생물학용 기초 모델(언어용 GPT와 유사), 추론 지연 시간이 1초 미만인 라이브 이미징 중 실시간 분석으로 자동화된 실험에 즉각적인 피드백 제공, 초기 이미징 특징과 최종 배치 품질을 연결하는 종단 데이터 세트에 학습된 초기 단계 이미지에서 몇 시간 또는 며칠 전에 배양 결과를 예측하는 예측 모델 등이 그 예입니다. 또한 분자 표현형을 예측하는 이미징 바이오마커를 발견하기 위해 현미경 이미지와 분자 프로파일링 데이터(RNA-seq, 프로테오믹스)를 결합하는 다중 모드 통합과 생물학적 제약(세포 주기 역학, 영양소 소비 동력학)을 통합하는 물리학 정보 신경망을 통해 예측 정확도를 개선하고 데이터 요구 사항을 줄이는 방법을 모색하고 있습니다. 이러한 기술이 발전함에 따라 현재의 방법으로는 보이지 않는 미묘한 사전 증상 변화를 통해 문제를 조기에 감지하고, 다양한 데이터 양식을 통합하여 더욱 정밀한 품질 평가를 수행하며, 배양 성공에 영향을 미치는 요인에 대한 심층적인 인사이트를 얻을 수 있을 것으로 기대합니다. 이러한 발전을 통해 싸이티온은 최고 품질의 세포와 세포주를 더욱 일관성 있고 효율적으로 지속적으로 제공하여 품질과 혁신에 대한 리더십을 유지할 수 있을 것입니다.