Phân tích hình ảnh do AI hỗ trợ cho kiểm soát chất lượng nuôi cấy tế bào
Tại Cytion, chúng tôi hiểu rằng đánh giá trực quan sức khỏe của nuôi cấy tế bào là yếu tố cơ bản để sản xuất các tế bào và dòng tế bào chất lượng cao. Hệ thống kiểm soát chất lượng dựa trên kính hiển vi truyền thống phụ thuộc nặng nề vào chuyên môn của con người và đánh giá chủ quan, điều này có thể thay đổi giữa các nhà điều hành và theo thời gian. Phân tích hình ảnh dựa trên trí tuệ nhân tạo (AI) chuyển đổi quy trình chủ quan này thành hệ thống kiểm soát chất lượng khách quan, định lượng và có thể mở rộng, đảm bảo chất lượng sản phẩm nhất quán trên tất cả các dòng tế bào của chúng tôi. Bằng cách sử dụng các thuật toán học sâu bao gồm kiến trúc U-Net cho phân đoạn, mô hình ResNet-50 và EfficientNet cho phân loại, cùng các kỹ thuật thị giác máy tính tiên tiến như học chuyển giao và phương pháp tập hợp, chúng tôi có thể phát hiện những thay đổi tinh tế trong hình thái tế bào, xác định sự nhiễm bẩn sớm hơn và đưa ra quyết định dựa trên dữ liệu về sức khỏe nuôi cấy và sự sẵn sàng cho các ứng dụng tiếp theo. Hệ thống AI của chúng tôi xử lý hơn 50.000 hình ảnh mỗi tháng từ quá trình sản xuất tế bào HeLa, HEK293 và các dòng tế bào quan trọng khác, cung cấp đánh giá chất lượng nhất quán với độ chính xác vượt quá 95% trên nhiều thông số.
| Khả năng phân tích AI | Ứng dụng kiểm soát chất lượng | Ưu điểm so với đánh giá thủ công |
|---|---|---|
| Đo lường độ phủ tự động | Xác định thời điểm chuyển dòng tối ưu | độ chính xác ±2% so với ±15-20% biến động thủ công |
| Phân loại hình thái | Phát hiện sự thay đổi hình thái và sự phân hóa | Phát hiện các thay đổi tinh tế không thể nhìn thấy bằng mắt thường |
| Phát hiện nhiễm khuẩn | Phát hiện sớm vi khuẩn, nấm, mycoplasma | Phát hiện sớm hơn 24-48 giờ so với kiểm tra bằng mắt thường |
| Đánh giá khả năng sống còn | Theo dõi sức khỏe tế bào không xâm lấn | Theo dõi liên tục mà không cần sử dụng các xét nghiệm dựa trên thuốc nhuộm |
| Phân loại đa thông số | Đặc trưng toàn diện dòng tế bào | Phân tích đồng thời hơn 50 đặc điểm so với 3-5 đặc điểm thủ công |
Cách mạng học sâu trong phân tích hình ảnh tế bào
Ứng dụng học sâu vào hình ảnh nuôi cấy tế bào đánh dấu một sự thay đổi cơ bản trong cách chúng ta tiếp cận kiểm soát chất lượng. Khác với các thuật toán phân tích hình ảnh truyền thống yêu cầu lập trình rõ ràng các đặc điểm cần phát hiện, các mô hình học sâu có thể tự động học các đặc điểm liên quan từ hàng nghìn hình ảnh đào tạo. Tại Cytion, chúng tôi đã phát triển các kiến trúc mạng nơ-ron convolutional (CNN) tùy chỉnh dựa trên các mô hình đã được chứng minh như U-Net cho phân đoạn ngữ nghĩa (xác định biên giới tế bào với độ chính xác cấp pixel), ResNet-50 cho trích xuất đặc điểm (học các biểu diễn phân cấp từ pixel thô) và EfficientNetB4 cho các tác vụ phân loại (phân biệt tế bào khỏe mạnh với tế bào bị stress). Các mô hình của chúng tôi được đào tạo trên các cơ sở dữ liệu hình ảnh rộng lớn — hiện tại >150.000 hình ảnh được chú thích, bao phủ hơn 200 loại tế bào, nhiều số lần nhân (P2-P30), điều kiện nuôi cấy đa dạng (chuẩn, bị stress, bị nhiễm khuẩn) và các phương thức hình ảnh khác nhau (đối chiếu pha, ánh sáng trường, huỳnh quang). Các mô hình này đạt độ chính xác >95% trong ước lượng mật độ tế bào, độ nhạy >92% trong phát hiện nhiễm khuẩn và độ chính xác >88% trong phân loại hình thái. Quá trình đào tạo sử dụng các kỹ thuật tăng cường dữ liệu (xoay, lật, điều chỉnh độ sáng, biến dạng đàn hồi) để cải thiện độ bền của mô hình và học chuyển giao từ trọng số được đào tạo trước trên ImageNet để đẩy nhanh quá trình hội tụ. Đào tạo mô hình được thực hiện trên cụm GPU NVIDIA A100 với kích thước lô 32-64 hình ảnh và thời gian đào tạo từ 12-48 giờ tùy thuộc vào độ phức tạp của mô hình, sử dụng tối ưu hóa Adam với lịch trình tỷ lệ học và dừng sớm dựa trên hiệu suất tập kiểm tra.
Đo lường độ phủ và theo dõi sự phát triển tự động
Đo lường mật độ tế bào—xác định tỷ lệ phần trăm bề mặt nuôi cấy được phủ bởi tế bào—là một trong những đánh giá quan trọng nhất nhưng cũng chủ quan nhất trong nuôi cấy tế bào. Tại Cytion, chúng tôi sử dụng kiến trúc mạng nơ-ron convolutional U-Net được thiết kế riêng cho các tác vụ phân đoạn ngữ nghĩa, đạt được phân loại cấp pixel giữa vùng tế bào và nền với điểm số Intersection over Union (IoU) vượt quá 0.90. Thực hiện U-Net của chúng tôi bao gồm một đường dẫn thu hẹp (encoder) với 4 giai đoạn giảm mẫu sử dụng convolutions 3×3 và max-pooling 2×2, và một đường dẫn mở rộng (decoder) với upsampling và các kết nối nhảy (skip connections) để bảo tồn thông tin không gian từ các lớp trước đó. Mạng được đào tạo trên các hình ảnh được chú thích thủ công, nơi các chuyên gia về nuôi cấy tế bào đã đánh dấu biên giới tế bào, sử dụng kết hợp hàm mất mát nhị phân và hàm mất mát Dice để xử lý sự mất cân bằng lớp. Mô hình được huấn luyện xử lý hình ảnh có kích thước 2048×2048 pixel trong <300ms trên GPU, tạo ra bản đồ xác suất theo pixel, sau đó được ngưỡng hóa để tạo mặt nạ nhị phân, từ đó tính toán tỷ lệ phủ kín (confluence) theo công thức (số pixel tế bào / tổng số pixel) × 100. Phương pháp đo lường phủ kín tự động này đạt độ chính xác trong khoảng ±2% khi so sánh với chú thích thủ công của chuyên gia, so với độ biến động ±15-20% giữa các quan sát viên con người khác nhau. Ngoài đo lường tại một thời điểm, hệ thống của chúng tôi theo dõi độ phủ theo thời gian để tạo ra các đường cong tăng trưởng (vẽ độ phủ theo thời gian với mô hình đường cong mũ), cho phép tính toán thời gian nhân đôi, dự đoán thời điểm chuyển cấy tối ưu (thường ở 80-90% độ phủ) và xác định các văn hóa phát triển chậm bất thường (>2 độ lệch chuẩn so với tốc độ tăng trưởng dự kiến), có thể chỉ ra sự lão hóa của dòng tế bào, vấn đề chất lượng môi trường nuôi cấy hoặc sự cố trong tủ ấm. Đối với danh mục Tế bào và Dòng tế bào của chúng tôi, việc theo dõi tăng trưởng chính xác này đảm bảo thời điểm thu hoạch tối ưu để tối đa hóa chất lượng và độ sống của tế bào.
Phân tích hình thái và tính ổn định của biểu hiện gen
Hình thái tế bào cung cấp thông tin phong phú về sức khỏe, bản chất và trạng thái chức năng của tế bào. Tại Cytion, chúng tôi trích xuất các đặc điểm hình thái toàn diện bằng cách sử dụng các thuật toán thị giác máy tính và trích xuất đặc điểm dựa trên học sâu. Sau khi phân đoạn tế bào, chúng tôi tính toán các chỉ số hình thái học cổ điển bao gồm diện tích tế bào (µm²), chu vi (µm), độ tròn (4π × diện tích / chu vi²), tỷ lệ khía cạnh (trục chính / trục phụ), độ đặc (diện tích / diện tích vỏ lồi) và các đặc trưng kết cấu dựa trên Ma trận Đồng xuất hiện Mức xám (GLCM) bao gồm độ tương phản, độ tương quan, năng lượng và độ đồng nhất. Ngoài ra, chúng tôi sử dụng mạng nơ-ron convolutional ResNet-50 được huấn luyện trước trên ImageNet và tinh chỉnh trên tập dữ liệu hình ảnh tế bào của chúng tôi để trích xuất các vectơ đặc trưng sâu 2.048 chiều, ghi lại các mẫu hình thái học tinh tế không dễ mô tả bằng các đặc trưng được thiết kế thủ công. Các đặc trưng đa quy mô này (kết hợp morphometrics truyền thống với đặc trưng sâu) được đưa vào các máy phân loại Random Forest (100 cây, tiêu chí độ không đồng nhất Gini) hoặc Máy Hỗ Trợ Vector (hạt nhân RBF, C=1.0, gamma=auto) để phân biệt morphologie bình thường với các biểu hiện bất thường với độ chính xác trên 92%. Để kiểm soát chất lượng, chúng tôi duy trì các hồ sơ hình thái tham chiếu cho từng dòng tế bào trong danh mục của mình—ví dụ, tế bào HeLa có hình thái biểu mô đặc trưng với diện tích trung bình 450±80 µm², độ tròn 0.65±0.12, trong khi tế bào HEK293 có diện tích 380±70 µm² với độ tròn cao hơn 0.72±0.10. Phát hiện sự thay đổi hình thái sử dụng thống kê Hotelling's T² để kiểm tra xem hình thái của lô hiện tại có khác biệt đáng kể so với phân phối tham chiếu (ngưỡng p<0.05) hay không, đánh dấu các văn hóa để xem xét khi phát hiện sự thay đổi biểu hiện có thể chỉ ra sự biệt hóa không mong muốn, sự thay đổi di truyền hoặc điều kiện nuôi cấy không tối ưu.
Phát hiện nhiễm khuẩn sớm
Ô nhiễm là một trong những mối đe dọa nghiêm trọng nhất đối với hoạt động nuôi cấy tế bào, có thể dẫn đến mất mát văn hóa, lãng phí tài nguyên và kết quả thí nghiệm bị ảnh hưởng. Tại Cytion, chúng tôi đã phát triển các mô hình phát hiện nhiễm khuẩn chuyên biệt được đào tạo trên tập dữ liệu được tuyển chọn của các văn hóa bị nhiễm khuẩn, bao gồm nhiễm khuẩn vi khuẩn (đặc trưng bởi sự gia tăng nhanh chóng của các mảnh vụn nhỏ, độ đục của môi trường, sự thay đổi pH thể hiện qua sự thay đổi màu sắc trong môi trường chứa phenol red), nhiễm khuẩn nấm (thể hiện qua cấu trúc sợi nấm, bào tử) và nhiễm khuẩn mycoplasma (thay đổi hình thái tinh tế, tốc độ tăng trưởng giảm, độ hạt tăng). Hệ thống phát hiện của chúng tôi sử dụng kiến trúc EfficientNetB4 (16,8 triệu tham số, tỷ lệ mở rộng tổng hợp về độ sâu, chiều rộng và độ phân giải) được đào tạo bằng phương pháp hai giai đoạn: đầu tiên, phân loại thành hai loại sạch và nhiễm bẩn (mất mát entropy nhị phân, đạt AUC-ROC 0,96); thứ hai, phân loại đa lớp xác định loại nhiễm khuẩn (hàm mất mát entropy phân loại, độ chính xác 85% trên các nhóm vi khuẩn/nấm/mycoplasma/men). Các mô hình phân tích nhiều đặc trưng hình ảnh bao gồm phân bố hạt bất thường (phát hiện qua thuật toán phát hiện blob), thay đổi ngoại hình môi trường nuôi cấy (sự thay đổi màu sắc được định lượng trong không gian màu LAB) và mẫu hình thái tế bào bất thường. Phân tích chuỗi thời gian so sánh hình ảnh hiện tại với cơ sở dữ liệu lịch sử 24-48 giờ cho phép phát hiện ô nhiễm đang phát triển trước khi nó trở nên rõ ràng về mặt thị giác đối với nhân viên vận hành, thường cung cấp cảnh báo sớm hơn 24-48 giờ so với kiểm tra thủ công. Khi xác suất ô nhiễm vượt quá ngưỡng 0.7, các cảnh báo tự động thông báo cho nhân viên kiểm soát chất lượng (QC) qua email và thông báo LIMS, kích hoạt điều tra ngay lập tức bao gồm xác nhận thị giác, nhuộm Gram (đối với ô nhiễm vi khuẩn) và xét nghiệm PCR mycoplasma. Hệ thống giám sát ô nhiễm được tăng cường bằng AI này đã giảm 60% tổn thất lô do ô nhiễm tại Cytion thông qua phát hiện và can thiệp sớm, đặc biệt có giá trị đối với các dự án nuôi cấy lâu dài và phát triển dòng tế bào giá trị cao, nơi ô nhiễm ở giai đoạn cuối quá trình sẽ gây tổn thất tài nguyên đáng kể.
Đánh giá khả năng sống còn không xâm lấn
Đánh giá khả năng sống truyền thống sử dụng thuốc nhuộm trypan blue hoặc các thuốc nhuộm không thấm màng khác yêu cầu lấy mẫu tế bào từ nuôi cấy, điều này gây hư hại và hạn chế độ phân giải theo thời gian. Tại Cytion, chúng tôi đã phát triển các mô hình dự đoán khả năng sống dựa trên hình thái, sử dụng hình ảnh ánh sáng trường hoặc tương phản pha không nhuộm để ước tính khả năng sống của tế bào thông qua học máy. Phương pháp này dựa trên quan sát rằng các tế bào đang chết và đã chết thể hiện các thay đổi hình thái đặc trưng: co lại của tế bào, phồng màng, hạt hóa chất tế bào, mất độ bám dính giữa tế bào và nền, và tăng khúc xạ ánh sáng. Chúng tôi đã trích xuất 156 đặc trưng hình thái và kết cấu từ các tế bào được phân đoạn riêng lẻ, sau đó sử dụng lựa chọn đặc trưng (Recursive Feature Elimination với kiểm tra chéo) để xác định 35 đặc trưng dự đoán nhất, bao gồm diện tích tế bào, độ bất thường của chu vi, cường độ pixel trung bình, độ biến thiên cường độ và các mô tả kết cấu GLCM. Các mô hình hồi quy Gradient Boosting (XGBoost với 200 ước lượng, tỷ lệ học 0.1, độ sâu tối đa 6) được đào tạo trên các đặc trưng này dự đoán tỷ lệ sống sót với R²=0.87 khi so sánh với các đo lường loại trừ trypan blue tiêu chuẩn vàng trên các mẫu song song. Mô hình được đào tạo trên 12.000 cặp hình ảnh-tỷ lệ sống sót, bao phủ phạm vi tỷ lệ sống sót từ 50% đến 99% trên nhiều loại tế bào và số lần truyền. Đối với giám sát sản xuất, hệ thống xử lý hình ảnh được chụp mỗi 2-4 giờ bởi hệ thống phân tích tế bào sống IncuCyte, tạo ra dữ liệu xu hướng tỷ lệ sống sót liên tục mà không làm gián đoạn văn hóa. Sự sụt giảm đột ngột về khả năng sống sót (>10% giảm trong 12 giờ) kích hoạt cảnh báo để điều tra, trong khi xu hướng giảm dần cung cấp thông tin cho quyết định thời điểm chuyển dòng tế bào—chúng tôi thường chuyển dòng khi khả năng sống sót dự đoán >90% để duy trì sức khỏe tế bào. Giám sát khả năng sống sót không xâm lấn này đặc biệt hữu ích cho các văn hóa tế bào treo và hệ thống bioreactor, nơi lấy mẫu truyền thống gây gián đoạn nhiều hơn, cũng như cho các thí nghiệm sàng lọc, nơi việc duy trì tính toàn vẹn của văn hóa trong khi giám sát sức khỏe tế bào là thiết yếu.
Đánh giá chất lượng đa thông số
Thay vì dựa vào các chỉ số đơn lẻ, các hệ thống AI có thể tích hợp nhiều thông số được trích xuất từ hình ảnh vào các điểm số chất lượng toàn diện. Tại Cytion, chúng tôi đã phát triển các mô hình đánh giá chất lượng toàn diện kết hợp độ phủ (mục tiêu 80-90% cho việc chuyển dòng), điểm hình thái (thang điểm 0-100, >75 cho thấy hình thái bình thường), ước tính khả năng sống sót (>90% mục tiêu), rủi ro nhiễm khuẩn (<0,1 ngưỡng xác suất) và độ đồng nhất của văn hóa (hệ số biến thiên về kích thước/hình dạng tế bào, <20% mục tiêu) vào điểm số QC tổng thể bằng phương pháp tập hợp có trọng số. Tập hợp này kết hợp các dự đoán từ các mô hình chuyên biệt: U-Net mật độ tế bào (trọng số 0.25), ResNet-50 phân loại hình thái (trọng số 0.30), EfficientNet phát hiện nhiễm khuẩn (trọng số 0.25), XGBoost hồi quy khả năng sống sót (trọng số 0.15), với các trọng số được tối ưu hóa thông qua tìm kiếm lưới trên tập dữ liệu kiểm tra để tối đa hóa tương quan với quyết định QC của chuyên gia. Điểm QC cuối cùng dao động từ 0 đến 100, với các quy tắc quyết định tự động: điểm ≥85 = đạt (tiếp tục sang giai đoạn tiếp theo/thu hoạch), 70-84 = biên giới (cảnh báo để xem xét thủ công), <70 = không đạt (điều tra hoặc loại bỏ). Các đánh giá đa thông số này cung cấp tiêu chí khách quan, định lượng cho quyết định phát hành trong sản xuất — tại Cytion, các văn hóa phải đạt điểm QC ≥85 trước khi tiến hành bước tiếp theo hoặc thu hoạch cuối cùng, đảm bảo chất lượng sản phẩm nhất quán. Phân tích dữ liệu sản xuất cho thấy mối tương quan mạnh (r=0.82) giữa điểm số AI QC và các chỉ số hiệu suất nuôi cấy sau đó, bao gồm độ sống sau giai đoạn nuôi cấy và thành công mở rộng, xác nhận giá trị dự đoán của phương pháp đánh giá tích hợp. Hệ thống đánh giá tự động xử lý hình ảnh toàn bộ microplate (96 giếng) trong 8-12 phút, so với 45-60 phút cho kiểm tra vi thể thủ công, cho phép đưa ra quyết định QC thời gian thực để duy trì quy trình sản xuất hiệu quả.
Học chuyển giao và điều chỉnh mô hình
Một trong những thách thức khi triển khai AI cho phân tích nuôi cấy tế bào là nhu cầu về tập dữ liệu đào tạo lớn, đặc biệt đối với các dòng tế bào chuyên biệt hoặc hiếm. Học chuyển giao giải quyết vấn đề này bằng cách bắt đầu với các mô hình đã được đào tạo trước trên các tập dữ liệu hình ảnh chung lớn (ImageNet với 1,4 triệu hình ảnh, 1.000 danh mục), sau đó tinh chỉnh trên các hình ảnh cụ thể cho nuôi cấy tế bào. Tại Cytion, chúng tôi tận dụng học chuyển giao một cách rộng rãi: chúng tôi khởi tạo mô hình bằng trọng số được đào tạo trước trên ImageNet (ví dụ: ResNet-50, EfficientNetB4), sau đó tinh chỉnh các lớp cuối cùng hoặc toàn bộ mạng sử dụng tập dữ liệu hình ảnh tế bào của chúng tôi với yêu cầu dữ liệu đào tạo giảm đáng kể. Ví dụ, việc phát triển một trình phân loại hình thái mới từ đầu có thể yêu cầu 10.000+ hình ảnh được chú thích, trong khi học chuyển giao đạt được hiệu suất tương đương với 1.000-2.000 hình ảnh. Quy trình tinh chỉnh của chúng tôi sử dụng tỷ lệ học thấp hơn (1e-4 đến 1e-5) so với đào tạo từ đầu (1e-2 đến 1e-3), thường đào tạo trong 20-50 epoch với việc dừng sớm dựa trên sự ổn định của mất mát trên tập kiểm tra, và áp dụng tỷ lệ học phân biệt, trong đó các lớp đầu tiên (đặc trưng chung) cập nhật chậm hơn trong khi các lớp sau (đặc trưng cụ thể của tế bào) cập nhật nhanh hơn. Đối với các dòng tế bào mới được thêm vào danh mục Cells and Cell lines, chúng tôi áp dụng học liên tục, trong đó các mô hình được đào tạo lại định kỳ với hình ảnh tích lũy từ các lô sản xuất, thường cập nhật hàng quý với 500-1000 hình ảnh mới được xác thực, duy trì độ chính xác của mô hình khi danh mục dòng tế bào của chúng tôi mở rộng. Các kỹ thuật thích ứng miền như Maximum Mean Discrepancy (MMD) và huấn luyện đối kháng giúp mô hình tổng quát hóa trên các nền tảng hình ảnh - chúng tôi huấn luyện trên dữ liệu từ nhiều hệ thống kính hiển vi (IncuCyte, ImageXpress, EVOS) để đảm bảo hiệu suất ổn định bất kể phần cứng thu thập dữ liệu.
Trí tuệ nhân tạo có thể giải thích và Kiểm soát chất lượng
Mặc dù các mô hình học sâu có thể đạt được độ chính xác ấn tượng, bản chất "hộp đen" của chúng có thể gây khó khăn cho các ứng dụng kiểm soát chất lượng, nơi việc hiểu cơ sở cho các quyết định là quan trọng. Tại Cytion, chúng tôi áp dụng các kỹ thuật AI có thể giải thích (XAI) để làm cho quyết định của mô hình trở nên dễ hiểu và đáng tin cậy. Chúng tôi sử dụng Grad-CAM (Gradient-weighted Class Activation Mapping) để tạo bản đồ nhiệt chỉ ra các vùng hình ảnh ảnh hưởng lớn nhất đến quyết định phân loại — ví dụ, cho thấy rằng phát hiện ô nhiễm tập trung vào các hạt bụi và thay đổi hình thái thay vì các đặc điểm nền không liên quan. Giá trị SHAP (SHapley Additive exPlanations) định lượng đóng góp của từng đặc điểm vào các dự đoán riêng lẻ, cho thấy dự đoán sự hội tụ chủ yếu phụ thuộc vào mật độ tế bào và các chỉ số phủ sóng, trong khi dự đoán tính khả thi tập trung mạnh vào tính toàn vẹn của màng tế bào và các đặc điểm cấu trúc chất tế bào. Đối với phân loại hình thái, chúng tôi trực quan hóa các bộ lọc được học trong các lớp convolutional, cho thấy các lớp đầu tiên phát hiện cạnh và kết cấu, trong khi các lớp sâu hơn nhận diện các mẫu đặc trưng của tế bào như sự hình thành lớp biểu mô trong tế bào HeLa hoặc các quá trình tương tự thần kinh trong các loại tế bào đã biệt hóa. Các hình ảnh hóa XAI này phục vụ nhiều mục đích: xây dựng niềm tin cho nhân viên kiểm soát chất lượng (QC) có thể xác minh rằng AI đưa ra quyết định dựa trên các đặc điểm sinh học có ý nghĩa, hỗ trợ khắc phục sự cố khi có dự đoán bất thường bằng cách xác định các đặc điểm đã ảnh hưởng đến quyết định, và cung cấp tài liệu đào tạo cho nhân viên mới về các đặc điểm quan trọng cho đánh giá chất lượng. Chúng tôi duy trì một bảng điều khiển XAI hiển thị các hình ảnh giải thích cho các mẫu văn hóa bị đánh dấu hoặc nằm trong vùng biên, cho phép đánh giá nhanh chóng của chuyên gia với bối cảnh về lý do tại sao AI đưa ra đánh giá của mình. Sự minh bạch này đã là yếu tố quan trọng cho việc chấp nhận AI trong kiểm soát chất lượng theo quy định—các gói xác minh của chúng tôi cho sản xuất GMP bao gồm các hình ảnh XAI đại diện chứng minh các mô hình đưa ra quyết định dựa trên các tiêu chí khoa học hợp lý, phù hợp với các nguyên tắc đánh giá chuyên gia truyền thống.
Tích hợp Phân tích Nội dung Cao
Phân tích hình ảnh dựa trên AI tích hợp mượt mà với các nền tảng hình ảnh có nội dung cao, có khả năng ghi lại nhiều kênh huỳnh quang, thực hiện xếp chồng Z tự động và chụp ảnh toàn bộ đĩa đa giếng với robot chính xác. Tại Cytion, chúng tôi sử dụng hệ thống Molecular Devices ImageXpress Micro Confocal có khả năng thu thập lên đến 6 kênh huỳnh quang (DAPI, FITC, TRITC, Texas Red, Cy5, Cy5.5) cùng ánh sáng truyền qua, kèm theo xếp chồng Z tự động (1-50 lớp, bước 0,5-10 µm) và định vị chính xác giai đoạn XY (độ chính xác ±1 µm). Đối với các ứng dụng có nội dung cao như đánh giá hiệu suất phân hóa của tế bào gốc, chúng tôi sử dụng nhuộm huỳnh quang miễn dịch cho các dấu hiệu dòng tế bào, sau đó phân tích bằng trí tuệ nhân tạo (AI): phân đoạn tế bào dựa trên nhuộm nhân (kênh DAPI, thuật toán watershed), phân loại thành nhóm dương tính và âm tính với dấu hiệu dựa trên ngưỡng cường độ huỳnh quang (được tối ưu hóa bằng phương pháp Otsu), và định lượng hiệu suất phân hóa dưới dạng phần trăm tế bào dương tính với dấu hiệu. Phân tích đa kênh cho phép phân loại biểu hiện phức tạp — định lượng đồng thời hình thái nhân (kích thước, hình dạng, sự co lại của DNA từ DAPI), vị trí protein (nhân so với tế bào chất thông qua phân tích colocalization kênh) và trạng thái chu kỳ tế bào (dựa trên biểu đồ phân bố nội dung DNA từ cường độ DAPI tích hợp). Đối với các dòng tế bào được công trình hóa có cấu trúc báo cáo, hình ảnh có nội dung cao kết hợp với phân tích AI sàng lọc thư viện clone: thu thập huỳnh quang GFP để xác nhận biểu hiện gen chuyển, đo phân bố cường độ biểu hiện để đánh giá độ dị biệt clone (CV <25% mục tiêu), và tương quan biểu hiện với hình thái để xác định các clone biểu hiện cao ổn định. Các quy trình làm việc hình ảnh có độ phân giải cao của chúng tôi tạo ra 50-100 GB dữ liệu hình ảnh hàng ngày, đòi hỏi quản lý dữ liệu hiệu quả (nén tự động, lưu trữ đám mây trên AWS S3) và tính toán hiệu suất cao (phân tích được tăng tốc bằng GPU trên cụm NVIDIA A100 xử lý 200 hình ảnh/phút). Sự kết hợp giữa phần cứng hình ảnh có độ phân giải cao tạo ra các tập dữ liệu đa chiều phong phú và phần mềm phân tích AI trích xuất tối đa thông tin từ mỗi phiên hình ảnh cho phép chúng tôi thực hiện việc đặc trưng hóa dòng tế bào và kiểm soát chất lượng phức tạp mà không thể thực hiện được bằng phân tích thủ công.
Phân tích thời gian thực và giám sát động
Kính hiển vi thời gian thực cung cấp thông tin quý giá về hành vi của tế bào theo thời gian, bao gồm tốc độ phân chia, mô hình di chuyển và phản ứng với sự thay đổi môi trường. Tại Cytion, chúng tôi sử dụng hệ thống Sartorius IncuCyte S3 để chụp ảnh với khoảng thời gian từ 15 phút đến 2 giờ, liên tục trong tối đa 14 ngày, tạo ra các tập dữ liệu chuỗi thời gian với 100-1000 hình ảnh mỗi giếng nuôi cấy. Phân tích AI của các chuỗi thời gian này bao gồm: theo dõi tế bào đơn lẻ bằng các thuật toán như TrackMate hoặc DeepCell để theo dõi các tế bào riêng lẻ qua các khung hình, đo thời gian phân chia bằng cách phát hiện các sự kiện phân bào (tế bào tròn lại, tách rời các tế bào con sau đó), định lượng tốc độ và hướng di chuyển của tế bào (độ lệch bình phương trung bình, độ dài bền vững), và xác định các sự kiện chết tế bào (thay đổi hình thái đặc trưng, tách rời tế bào). Đối với theo dõi phân chia, chúng tôi đạt độ chính xác 87% trong phát hiện mitosis bằng mạng nơ-ron convolutional 3D (kiến trúc C3D) phân tích các đặc trưng không gian-thời gian qua các cửa sổ 5 khung hình, cho phép tính toán tự động thời gian nhân đôi dân số có tương quan mạnh (r=0.91) với đo lường đếm tế bào thủ công. Phân tích di chuyển sử dụng thuật toán dòng quang học và phân đoạn tế bào dựa trên học sâu để theo dõi tâm tế bào từ khung hình này sang khung hình khác, tính toán vận tốc (µm/giờ) và chỉ số hóa học cho các thử nghiệm di chuyển. Dữ liệu thời gian thực tiết lộ các hành vi động học không thể quan sát được trong hình ảnh tại một thời điểm: chúng tôi đã xác định các dòng tế bào có dao động nhịp sinh học trong tốc độ tăng sinh, phát hiện tốc độ phân chia không đồng nhất trong các văn hóa tế bào cho thấy cấu trúc quần thể con, và đặc trưng động học phản ứng với sự thay đổi môi trường nuôi cấy hoặc điều trị thuốc. Đối với kiểm soát chất lượng, giám sát thời gian thực cung cấp cảnh báo sớm về các vấn đề—chúng tôi phát hiện sự ngừng phát triển (không có phân chia trong >24 giờ) hoặc tỷ lệ chết tăng cao (>5% tế bào có hình thái apoptosis trong 24 giờ) nhanh hơn nhiều so với các phép đo cuối cùng. Dữ liệu thời gian phong phú cũng cho phép mô hình dự đoán: sử dụng động học tăng trưởng giai đoạn đầu (24-48 giờ đầu tiên) để dự báo sản lượng tế bào cuối cùng, được huấn luyện thông qua mạng thần kinh tái phát (kiến trúc LSTM với 128 đơn vị ẩn), đạt độ chính xác 82% trong việc dự đoán liệu các văn hóa có đạt mật độ mục tiêu vào thời điểm dự kiến hay không.
Tiêu chuẩn hóa trên các nền tảng hình ảnh
Các kính hiển vi, máy ảnh và điều kiện hình ảnh khác nhau có thể tạo ra hình ảnh với đặc điểm khác nhau, có thể gây nhầm lẫn cho các mô hình AI được đào tạo trên hình ảnh từ một nền tảng cụ thể. Tại Cytion, chúng tôi giải quyết sự biến đổi giữa các nền tảng thông qua các quy trình tiền xử lý và chuẩn hóa hình ảnh toàn diện được thực hiện bằng Python sử dụng các thư viện OpenCV và scikit-image. Quy trình chuẩn hóa của chúng tôi bao gồm: điều chỉnh trường phẳng để bù đắp cho ánh sáng không đều (chia mỗi hình ảnh cho hình ảnh trường phẳng tham chiếu, trừ đi dòng tối), chuẩn hóa màu cho hình ảnh ánh sáng trường sáng bằng cách khớp histogram hoặc chuyển đổi màu Reinhard, điều chỉnh cường độ để đạt dải động chuẩn hóa ([0,1] float hoặc [0,255] uint8), và hài hòa độ phân giải thông qua nội suy bicubic khi hình ảnh từ các hệ thống khác nhau có kích thước pixel khác nhau. Đối với hình ảnh tương phản pha, vốn đặc biệt nhạy cảm với cài đặt quang học, chúng tôi áp dụng thích ứng miền dựa trên CycleGAN để chuyển đổi hình ảnh từ giao diện của một kính hiển vi sang giao diện của kính hiển vi khác, được đào tạo trên tập dữ liệu hình ảnh không ghép đôi từ cả hai hệ thống. Quy trình tiền xử lý này đảm bảo các mô hình được đào tạo trên hình ảnh IncuCyte hoạt động hiệu quả tương đương trên hình ảnh ImageXpress hoặc EVOS sau khi chuẩn hóa. Chúng tôi xác minh hiệu quả chuẩn hóa bằng cách đo lường sự suy giảm hiệu suất mô hình khi áp dụng cho các nền tảng mới: trước khi chuẩn hóa, độ chính xác giảm 12-25% khi mô hình được đào tạo trên một hệ thống được áp dụng cho hệ thống khác; sau khi chuẩn hóa, sự suy giảm giảm xuống dưới 5%. Quy trình chuẩn hóa của chúng tôi được tự động hóa trong cơ sở hạ tầng phân tích hình ảnh, áp dụng các biến đổi phù hợp dựa trên thẻ metadata chỉ định nguồn kính hiển vi, để hình ảnh từ tất cả các nền tảng có thể đi qua các quy trình phân tích thống nhất. Khả năng tương thích đa nền tảng này là thiết yếu cho các hoạt động đa địa điểm và cho phép chia sẻ các mô hình đã được đào tạo trong cộng đồng nghiên cứu nuôi cấy tế bào, thúc đẩy sự phát triển của lĩnh vực này vượt ra ngoài các triển khai trong phòng thí nghiệm riêng lẻ.
Tích hợp với tự động hóa phòng thí nghiệm
Phân tích hình ảnh được hỗ trợ bởi AI trở nên mạnh mẽ hơn khi tích hợp với các hệ thống nuôi cấy tế bào tự động. Tại Cytion, chúng tôi đã triển khai tự động hóa vòng kín, trong đó hệ thống hình ảnh IncuCyte bên trong tủ ấp tự động (dòng Liconic STX) chụp ảnh mỗi 2 giờ, các quy trình phân tích dựa trên Python xử lý hình ảnh trong vòng 5 phút sau khi thu thập bằng dịch vụ suy luận container hóa (Docker trên Kubernetes), và kết quả phân tích được truyền vào bộ điều khiển tự động Hamilton VENUS qua API REST để kích hoạt các hành động tự động. Ví dụ, khi phân tích độ phủ tế bào cho thấy văn hóa đã đạt 85% (độ dày văn hóa tối ưu), hệ thống tự động tạo danh sách công việc trong VENUS để lên lịch cho robot xử lý chất lỏng thực hiện các thao tác chuyển văn hóa (hút môi trường, thêm trypsin, trung hòa, đếm tế bào, gieo văn hóa mới) trong khung thời gian 4 giờ tiếp theo. Xác suất phát hiện nhiễm khuẩn >0.7 sẽ ngay lập tức cách ly các văn hóa bị ảnh hưởng bằng cách di chuyển chúng đến khu vực ủ cách ly và tạo cảnh báo khẩn cấp, ngăn chặn sự lây lan của nhiễm khuẩn. Ước tính độ sống sót <80% sẽ tạm dừng xử lý tự động và đánh dấu các văn hóa để xem xét thủ công bởi chuyên gia. Tích hợp này tạo ra hệ thống quản lý văn hóa tự động duy trì sức khỏe tế bào tối ưu với can thiệp tối thiểu của con người — hệ thống tích hợp của chúng tôi thành công nuôi cấy hơn 200 dòng tế bào đồng thời, với 92% các thao tác nuôi cấy được thực hiện hoàn toàn tự động, sự tham gia của con người chỉ cần thiết cho 8% các văn hóa được đánh dấu do điều kiện đặc biệt. Hoạt động vòng kín bao gồm các cơ chế an toàn: Dự đoán AI dưới ngưỡng tin cậy (thường là 0.75) sẽ kích hoạt kiểm tra thủ công thay vì hành động tự động, và tất cả quyết định tự động đều được ghi lại kèm dữ liệu giải thích để đảm bảo tính truy xuất và cải tiến liên tục. Theo dõi hiệu suất hệ thống theo dõi các chỉ số chính bao gồm tỷ lệ dương tính giả trong phát hiện nhiễm khuẩn (mục tiêu <2%), accuracy of confluence-based passage timing (>, 90% các lần chuyển dòng diễn ra ở mật độ 80-95%), và tương quan giữa độ sống sau chuyển dòng dự đoán và đo lường (r>0.8), với các đánh giá định kỳ hàng quý đảm bảo hiệu suất nằm trong phạm vi quy định.
Sinh và Ghi chú Dữ liệu Đào tạo
Hiệu suất của các mô hình AI phụ thuộc quan trọng vào chất lượng và số lượng dữ liệu đào tạo. Tại Cytion, chúng tôi duy trì các cơ sở dữ liệu hình ảnh rộng lớn, được chú thích cẩn thận, bao phủ toàn bộ danh mục dòng tế bào của chúng tôi dưới các điều kiện và số lần truyền khác nhau, hiện tổng cộng >150.000 hình ảnh được chú thích, tương đương với >2.000 giờ nỗ lực chú thích của chuyên gia. Chiến lược chú thích của chúng tôi kết hợp nhiều phương pháp: chú thích thủ công bởi các nhà khoa học chuyên về nuôi cấy tế bào sử dụng công cụ như LabelImg và VGG Image Annotator (VIA) cho mặt nạ phân đoạn và nhãn lớp, chú thích bán tự động nơi các dự đoán ban đầu của AI được chuyên gia xem xét và chỉnh sửa (giảm thời gian chú thích 60% mà vẫn duy trì độ chính xác), và học tích cực nơi mô hình xác định các hình ảnh có độ không chắc chắn dự đoán cao để tập trung nỗ lực chú thích vào các trường hợp biên. Chúng tôi duy trì kiểm soát chất lượng chú thích nghiêm ngặt thông qua kiểm tra độ tin cậy giữa các người chú thích — ba người chú thích độc lập gắn nhãn các tập con gồm 100 hình ảnh, đạt được độ đồng thuận Cohen's kappa >0.85 cho các tác vụ phân loại và IoU >0.90 cho chú thích phân đoạn, xác nhận tính nhất quán của chú thích. Để cải tiến liên tục, chúng tôi triển khai các quy trình thu thập dữ liệu hệ thống: tất cả hình ảnh sản xuất được lưu trữ tự động kèm metadata (dòng tế bào, thế hệ, ngày, hệ thống hình ảnh, điều kiện nuôi cấy), các lô dữ liệu định kỳ được chú thích bởi chuyên gia để tăng đa dạng cho tập huấn luyện, và hình ảnh liên quan đến lỗi kiểm soát chất lượng hoặc sự kiện bất thường được ưu tiên chú thích để cải thiện xử lý trường hợp biên. Tăng cường dữ liệu mở rộng kích thước tập huấn luyện hiệu quả: xoay (0-360°), lật ngang/dọc, điều chỉnh độ sáng/độ tương phản (±20%), biến dạng đàn hồi (mô phỏng biến đổi trường kính hiển vi) và thêm nhiễu Gaussian (σ=0.1) tạo ra các biến thể tăng cường trong quá trình huấn luyện, hiệu quả nhân 10 lần dữ liệu huấn luyện đồng thời cải thiện độ bền của mô hình đối với biến đổi tự nhiên của hình ảnh. Chúng tôi cũng biên soạn các bộ dữ liệu chuyên biệt cho các thách thức cụ thể: bộ dữ liệu phát hiện ô nhiễm bao gồm hơn 5.000 hình ảnh của các mẫu nuôi cấy bị ô nhiễm bởi vi khuẩn, nấm và mycoplasma; bộ dữ liệu hình thái hiếm ghi lại các biểu hiện bất thường, mảnh vụn và hiện tượng giả; bộ dữ liệu đa chu kỳ theo dõi các dòng tế bào riêng lẻ từ P5 đến P30, ghi lại quá trình lão hóa và sự thay đổi biểu hiện. Hạ tầng dữ liệu đào tạo toàn diện và được tuyển chọn kỹ lưỡng này là nền tảng cho độ chính xác và độ tin cậy của các hệ thống kiểm soát chất lượng được hỗ trợ bởi AI của chúng tôi.
Xác thực mô hình và giám sát hiệu suất
Trước khi triển khai các mô hình AI cho quyết định kiểm soát chất lượng, việc xác thực nghiêm ngặt là cần thiết. Tại Cytion, chúng tôi tuân thủ các quy trình xác thực có cấu trúc phù hợp với hướng dẫn của FDA về xác thực phần mềm và học máy cho thiết bị y tế (nguyên tắc áp dụng cho sản xuất tế bào theo GMP): chia tập dữ liệu thành các tập huấn luyện (70%), xác thực (15%) và kiểm tra (15%) với phân lớp đảm bảo tất cả dòng tế bào và điều kiện được đại diện tỷ lệ; thực hiện xác thực chéo k-fold (k=5) trong quá trình phát triển để đánh giá khả năng tổng quát hóa của mô hình; đánh giá hiệu suất trên tập kiểm tra chưa từng được sử dụng trong quá trình đào tạo bằng các chỉ số toàn diện bao gồm độ chính xác, độ chính xác, độ nhạy, điểm F1 cho các tác vụ phân loại, R², MAE, RMSE cho các tác vụ hồi quy, và đường cong AUC-ROC cho dự đoán xác suất; so sánh dự đoán của AI với các đo lường tiêu chuẩn vàng (đánh giá thủ công của chuyên gia, phân tích dòng chảy cho độ sống, đếm lưới kính hiển vi cho độ phủ) trên các điều kiện thử nghiệm đa dạng; và thực hiện xác thực triển vọng, trong đó các mô hình chạy ở chế độ bóng song song với quy trình kiểm soát chất lượng tiêu chuẩn trong 3 tháng trước khi triển khai, so sánh dự đoán với kết quả kiểm soát chất lượng thực tế. Sau khi triển khai, chúng tôi thực hiện giám sát hiệu suất liên tục: so sánh tự động các dự đoán của AI với đánh giá định kỳ của chuyên gia (20% mẫu được đánh giá song song bởi chuyên gia), theo dõi điểm tin cậy của dự đoán theo thời gian (điểm tin cậy giảm có thể cho thấy sự thay đổi dữ liệu), phân tích tương quan giữa điểm chất lượng AI và các chỉ số hiệu suất lô sản phẩm sau đó (độ sống sót sau khi truyền, thành công mở rộng), và đánh giá xác thực định kỳ hàng quý để kiểm tra hiệu suất mô hình trên các dòng tế bào và điều kiện vận hành. Chúng tôi duy trì tài liệu xác minh chi tiết bao gồm thông số kiến trúc mô hình, đặc điểm dữ liệu đào tạo (kích thước, đa dạng, chất lượng chú thích), kết quả so sánh hiệu suất và hồ sơ kiểm soát thay đổi cho các bản cập nhật mô hình. Khi hiệu suất mô hình suy giảm dưới tiêu chuẩn chấp nhận (ví dụ: độ chính xác độ phủ giảm dưới ±5%, AUC phát hiện nhiễm bẩn <0.90), chúng tôi kích hoạt quá trình đào tạo lại hoặc hiệu chỉnh: thu thập dữ liệu đào tạo bổ sung từ các lô sản xuất gần đây, đào tạo lại mô hình với tập dữ liệu cập nhật, xác minh mô hình cập nhật trên tập dữ liệu kiểm tra mới, và triển khai có kiểm soát nơi mô hình cập nhật ban đầu chạy ở chế độ bóng trước khi triển khai đầy đủ. Khung xác minh và giám sát nghiêm ngặt này đảm bảo hệ thống QC được hỗ trợ bởi AI duy trì độ chính xác và độ tin cậy theo thời gian, bất chấp sự thay đổi của danh mục dòng tế bào, thiết bị hình ảnh và sự thay đổi tự nhiên của dữ liệu.
Phát triển tương lai trong phân tích hình ảnh AI
Lĩnh vực phân tích hình ảnh tế bào dựa trên AI tiếp tục phát triển nhanh chóng với các kỹ thuật mới hứa hẹn khả năng vượt trội hơn. Các phát triển mà chúng tôi đang theo dõi và thử nghiệm tại Cytion bao gồm: Phân tích hình ảnh 3D sử dụng mạng phân đoạn thể tích (3D U-Net) cho các văn hóa organoid và spheroid, cho phép đo lường kích thước, hình thái và cấu trúc bên trong của organoid từ hình ảnh Z-stack; Dự đoán huỳnh quang không cần nhãn, nơi các mô hình được đào tạo trên hình ảnh sáng trường/huỳnh quang ghép đôi học cách dự đoán mẫu huỳnh quang từ hình ảnh sáng trường mà không cần nhãn, có thể thay thế một số yêu cầu nhuộm màu; các kỹ thuật học tự giám sát (SimCLR, BYOL) học các biểu diễn hữu ích từ hình ảnh không có nhãn, giảm yêu cầu chú thích bằng cách học các đặc trưng hình ảnh tế bào chung mà không cần nhãn thủ công; các mô hình nền tảng cho sinh học tế bào (tương tự như GPT cho ngôn ngữ) được huấn luyện trước trên các tập dữ liệu hình ảnh tế bào đa dạng khổng lồ, có thể được tinh chỉnh cho các tác vụ cụ thể với lượng dữ liệu tối thiểu; phân tích thời gian thực trong quá trình quan sát tế bào sống với độ trễ suy luận <1 giây, cho phép phản hồi tức thì cho các thí nghiệm tự động; và các mô hình dự đoán kết quả nuôi cấy hàng giờ hoặc hàng ngày từ hình ảnh giai đoạn sớm, được đào tạo trên các tập dữ liệu theo dõi liên tục liên kết các đặc trưng hình ảnh giai đoạn sớm với chất lượng lô cuối cùng. Chúng tôi cũng đang nghiên cứu tích hợp đa mô hình kết hợp hình ảnh kính hiển vi với dữ liệu phân tích phân tử (RNA-seq, proteomics) để phát hiện các dấu hiệu hình ảnh dự đoán các biểu hiện phân tử, và các mạng thần kinh được hướng dẫn bởi vật lý tích hợp các ràng buộc sinh học (dynamic chu kỳ tế bào, động học tiêu thụ chất dinh dưỡng) để cải thiện độ chính xác dự đoán và giảm yêu cầu dữ liệu. Khi các công nghệ này phát triển, chúng tôi kỳ vọng sẽ phát hiện vấn đề sớm hơn thông qua các thay đổi tiền triệu chứng tinh vi mà các phương pháp hiện tại không thể phát hiện, đánh giá chất lượng chính xác hơn thông qua tích hợp các mô hình dữ liệu đa dạng, và hiểu sâu hơn về các yếu tố ảnh hưởng đến thành công của quá trình nuôi cấy. Những tiến bộ này sẽ giúp Cytion tiếp tục cung cấp các tế bào và dòng tế bào chất lượng cao nhất với độ nhất quán và hiệu quả cao hơn, duy trì vị thế dẫn đầu của chúng tôi về chất lượng và đổi mới.