细胞系中的 CRISPR 筛选:全基因组功能分析
CRISPR-Cas9技术为功能基因组学带来了革命性的变化,能够在培养细胞中系统地检测整个基因组的基因功能。在 Cytion,我们认识到我们的细胞和细胞系是 CRISPR 筛选应用的强大平台,可识别控制从增殖到耐药性等各种细胞过程的基因。集合式 CRISPR 筛选将包含数千到数十万个引导 RNA(sgRNA)的文库引入细胞群,形成大规模集合,每个细胞都会受到不同的遗传扰动。通过施加选择性压力并追踪哪些 sgRNA 被富集或耗尽,研究人员可以系统地鉴定出生存所必需的基因、对治疗药物产生抗性的基因或调控任何可选择表型的基因。这种无偏见的功能基因组学方法加速了癌症生物学、免疫学、传染病和基础细胞生物学的发现,将培养细胞转化为系统生物发现的引擎。
| 筛选类型 | 筛选策略 | 鉴定基因 | 关键应用 |
|---|---|---|---|
| 负向选择(脱落) | 连续培养,鉴定耗尽的 sgRNA | 必需基因、健康基因 | 治疗靶点鉴定、基因依赖性 |
| 正向选择(富集) | 药物/毒素处理,确定富集的 sgRNA | 抗性基因、生存因子 | 药物机制、抗性机制 |
| 基于 FACS 的筛选 | 根据标记表达对细胞进行分类 | 特定蛋白质/通路的调控因子 | 通路分析、生物标记调控 |
| 基于成像的筛选 | 自动显微镜+分析 | 形态调节因子、定位因子 | 细胞生物学、细胞器功能 |
| 合成致死筛选 | 特定情境的本质 | 基因相互作用、条件依赖性 | 精准肿瘤学、联合疗法 |
CRISPR 文库设计与传递
基因组规模的 CRISPR 文库包含针对基因组中每一个蛋白编码基因的 sgRNA 序列,通常每个基因有 4-10 个向导,以确保强大的覆盖范围并考虑到不同的向导效率。人类全基因组文库包含 70,000-100,000 个 sgRNA 序列,而针对激酶、表观遗传调控因子或代谢酶等子集的重点文库能以较少的构建体实现更深的覆盖。文库质量对筛选成功与否有着至关重要的影响--指导者必须有效地诱导基因敲除,同时避免脱靶效应干扰解释。
慢病毒递送仍是将 sgRNA 文库引入细胞群的标准方法。含有完整 sgRNA 文库的池化慢病毒能以较低的感染倍率(MOI)感染细胞,通常为 0.3-0.5,确保大多数感染细胞只接受一个 sgRNA 构建。这种每细胞单个扰动的要求可防止多重基因敲除细胞的干扰。转导后,通过抗生素选择清除未感染的细胞,从而得到每个细胞都带有特定基因扰乱的细胞群。对于 Cytion 细胞系,转导效率因细胞类型而异--悬浮细胞通常能高效转导,而一些粘附细胞系则需要优化病毒浓度、聚雷霉素和旋接。
文库代表性--含有每个 sgRNA 的细胞数量--对筛选质量有关键影响。全基因组筛选要求每个 sgRNA 在整个实验过程中保持 500-1000 个细胞,以防止随机取样效应造成的指导因子随机丢失。对于 100,000 个 sgRNA 文库来说,这就需要 5,000 万到 1 亿个细胞作为起始群体,并通过选择和传代来维持相应的数量。代表性不足会带来噪音,掩盖真正的命中,并因随机丢失而产生假阳性。
负选择筛选:识别重要基因
阴性选择筛选可鉴定细胞在标准培养条件下存活或增殖所需的基因。用 sgRNA 文库转导细胞,选择整合,然后连续传代 2-4 周,同时保持文库的代表性。当含有这些基因敲除的细胞无法增殖或死亡时,靶向必需基因的 sgRNA 就会耗尽。比较最终时间点与初始群体(T0)的 sgRNA 丰度,可以发现哪些基因是实验条件下的适应性所必需的。
必要基因筛选可生成细胞系特异性依赖性图谱,揭示可用于治疗干预的薄弱环节。癌症细胞系通常依赖于正常细胞不需要的癌基因或通路成分,这就是潜在的治疗靶点。例如,HeLa 细胞对支持快速增殖和基因组不稳定性管理的基因表现出特有的依赖性。癌症依赖性图谱项目在数百个癌细胞系中进行了全基因组CRISPR筛选,对基因依赖性进行了编目,并将其与基因组特征相关联,以预测特定患者的脆弱性。
针对具体情况的本质筛选则比较不同条件或细胞系的基因依赖性。在正常细胞与转化细胞或具有不同遗传背景的细胞中进行平行筛选,可确定基因缺失仅在特定情况下致死的合成致死相互作用。这些特定情况下的依赖性提供了治疗窗口--靶向癌症中必不可少但正常组织中可有可无的基因,可将毒性降到最低。对于代表不同组织来源和转化状态的 Cytion 细胞系,比较 CRISPR 筛选可以绘制出细胞依赖性的遗传结构图。
正向选择筛选:抗性和生存机制
正向选择筛选施加选择性压力,杀死大多数细胞,从而富集出具有存活或抗药性的 sgRNA。耐药性筛选是用杀死未修饰细胞浓度的治疗药物处理库感染细胞。存活下来的细胞富集了破坏药物靶点、激活耐药途径或阻断促凋亡信号转导的 sgRNA。识别这些基因可揭示药物的作用机制和临床上可能出现的潜在耐药机制。
毒素抗性筛选可确定毒素吸收、激活或下游细胞毒性所需的基因。例如,用白喉毒素进行筛选,就能筛选出针对毒素受体和毒素进入所需的膜运输元件的 sgRNA。病原体易感性筛选将细胞暴露于病毒或细菌毒素,从而确定感染所必需的宿主因子。这些筛选绘制了病原体利用的细胞机制图,揭示了阻断感染的潜在治疗靶点。
生长因子独立性筛选是在血清减少或特定生长因子缺失的情况下培养细胞,从而鉴定出基因,当这些基因被破坏时,就能实现不依赖生长因子的增殖。这些基因通常代表肿瘤抑制因子或生长信号通路的负调控因子。了解使生长因子独立的通路可以揭示癌症进展机制,并确定组合疗法的潜在靶点,从而防止抗药性的出现。
基于 FACS 的 CRISPR 筛选
荧光激活细胞分拣技术可以筛选出调控任何荧光可测量表型的基因。用 sgRNA 文库转导表达荧光报告基因的细胞,然后根据报告基因的表达进行分选。分别收集荧光报告基因表达量高和低的细胞,比较不同细胞群的 sgRNA 丰度。富集的 sgRNA 可识别阳性调控因子(敲除后富集于低表达群体)和阴性调控因子(破坏后富集于高表达群体)。
表面标记筛选根据细胞表面蛋白的抗体染色对细胞进行分类。这些筛选可识别抗原呈递调节因子、免疫检查点配体或粘附分子。在免疫疗法开发方面,基于 FACS 的筛选已确定了控制 PD-L1 表达的基因,揭示了可增强免疫疗法反应的靶向途径。根据内源性蛋白质表达而不是工程报告进行分选的能力将筛选范围扩大到任何具有合适抗体的蛋白质。
多参数 FACS 实现了复杂的表型判别。同时测量多个标记物,可识别特异性影响某些细胞群或细胞状态的基因。例如,基于大小和颗粒度的分选与活力染料相结合,可区分凋亡细胞和健康细胞,从而筛选出凋亡调节因子。主要的限制仍然是通量--与简单的存活筛选相比,基于 FACS 的筛选需要更多的细胞,而且面临着可分选细胞数量的实际限制,可能会限制文库的大小或代表性。
基于图像的 CRISPR 筛选
自动显微镜与图像分析相结合,可筛选 FACS 无法获得的形态表型。用阵列 sgRNA 文库(每孔一个或几个引导)感染的细胞会被固定并成像,提取每个细胞的数百个形态特征。机器学习对表型进行分类,确定产生特征性形态变化的引导因子。与集合筛选不同的是,阵列格式能保持扰动的空间分离,从而实现基于显微镜的读数。
细胞器形态筛选可识别调控线粒体网络、高尔基体结构、核形态或细胞骨架组织的基因。这些筛选揭示了维持细胞器功能的质量控制机制,并确定了协调细胞器动态与细胞周期进展的基因。对于形态特征良好的细胞系,基于图像的筛选可以发现其他读数所看不到的微妙表型。
活细胞成像筛选可追踪细胞分裂、迁移或钙信号传导等动态过程。对阵列基因敲除的延时成像可揭示控制分裂时间、有丝分裂纺锤体定向或迁移速度和方向的基因。成像数据的丰富性是以通量为代价的--与集合筛选相比,阵列筛选检查的扰动更少,不过针对特定基因家族的重点文库能在覆盖范围与实际限制之间取得平衡。
分析和命中验证
筛选和收集样本后,提取基因组DNA,并用包括测序适配体在内的引物通过 PCR 扩增 sgRNA 区域。深度测序可量化每个 sgRNA 的丰度,生成实验样本和对照样本之间的读数比较。MAGeCK、BAGEL 或 JACKS 等计算工具对富集或耗竭进行统计评估,并对数千个基因进行多重假设检验。
高置信度命中显示了多个独立 sgRNA 针对同一基因的一致效应。只有一个或两个引导因子显示效应的基因可能是脱靶伪影,而不是真正的命中。统计方法汇总了每个基因中不同引导因子的证据,提高了检测真阳性的能力,同时减少了单个引导因子脱靶造成的错误发现。针对已知重要基因或非靶向对照的对照向导可验证筛选结果并校准统计阈值。
验证实验使用独立的 sgRNA 或正交基因敲除方法确认筛选结果。克隆单个 sgRNA 并在筛选细胞系中进行测试,最好还能在其他细胞系中进行测试,以评估可重复性和可推广性。用缺乏 sgRNA 靶序列的 cDNA 重新表达靶基因的拯救实验可确认靶向效应。对于治疗靶点验证,在代表不同遗传背景的 Cytion 细胞系中测试命中率,以确定广泛适用性与特定环境依赖性。
变体和高级筛选方法
CRISPRi 和 CRISPRa 筛选使用与转录抑制剂或激活剂融合的催化坏死 Cas9,实现可逆基因敲除或激活,而不是永久敲除。这些方法避免了基因完全缺失造成的混淆,模拟了基因表达变化而不是基因空突变,并能筛选非蛋白编码调控元件。对于基因敲除会导致致死的重要基因,CRISPRi 部分敲除可能会揭示剂量依赖性表型和治疗窗口。
碱基编辑筛选可引入精确的点突变,而不是插入/缺失,从而实现对蛋白质结构域或调控元件的系统突变。基序编辑筛选可引入或纠正特异性突变,具有更高的精确性。这些下一代筛选将能系统地剖析蛋白质结构与功能的关系,并大规模检测与疾病相关的变异。
使用双 sgRNA 文库进行的组合筛选可系统地测试基因对,确定遗传相互作用,包括合成致死、抑制和表观遗传。由于文库复杂性的因子增加,组合筛选在技术上具有挑战性,但它能绘制基因网络图并确定组合治疗策略。以可药用基因对为目标的重点组合筛选揭示了组合疗法,与单药疗法相比,这种疗法可以防止抗药性或提高疗效。
药物发现和开发中的应用
CRISPR 筛选通过系统测试哪些基因被破坏后会产生所需的治疗表型,从而加快靶点的确定。癌症依赖性筛选可确定癌细胞中必不可少的基因,这些基因代表着潜在的治疗靶点。在患者来源细胞或同源细胞系面板中进行筛选,根据基因背景对靶点进行分层,从而实现根据患者生物标志物匹配疗法的精准医疗方法。
对未知靶点的化合物进行作用机制研究时,可使用 CRISPR 筛选来确定具有抗药性或敏感性的基因。如果破坏特定基因会产生对化合物的抗药性,则该基因很可能编码药物活性所必需的靶点或通路成分。这种方法已经阐明了既有疗法和新型疗法的机制,加速了临床开发,并为患者选择确定了生物标志物。
耐药性机制预测筛选在 CRISPR 筛选过程中用亚致死剂量的药物处理细胞,以确定破坏后产生耐药性的基因。这些基因代表了肿瘤逃避治疗的潜在机制,有助于开发阻断抗药性途径的组合策略。对于模拟各种癌症类型的 Cytion 细胞系,耐药性筛选可为临床试验设计和患者监测策略提供信息。
挑战与最佳实践
尽管 sgRNA 设计算法有所改进,但脱靶效应仍是一个令人担忧的问题。一些导向基因会裂解与靶点序列相似的非预期基因组位点,可能导致与预期基因破坏无关的表型。在每个基因上使用多个独立的导引子并对导引子进行统计聚合可减轻这一问题。用正交方法验证命中率最高的基因,可确认对目标的影响。
不完全或延迟的基因敲除动力学会影响筛选结果。有些 sgRNA 的切割效率不高,会产生部分基因敲除而非完全敲除。蛋白质的稳定性意味着 DNA/RNA 水平的基因敲除需要时间让现有蛋白质降解,然后才能表现出表型。筛选必须在选择后运行足够长的时间才能完全清除蛋白质,通常为 7-14 天,具体取决于目标蛋白质的半衰期和细胞倍增时间。
筛选质量控制包括监测文库的代表性、确认 Cas9 的活性以及验证对照指导的预期行为。对初始群体进行测序可确认文库的复杂性和代表性。在负选择筛选中,靶向已知重要基因的导引物应表现出强烈的耗竭,而非靶向对照应无明显变化。与预期对照行为的偏差表明存在技术问题,需要在解释实验结果前排除故障。
未来方向和应用拓展
Perturb-seq 将 CRISPR 筛选与单细胞 RNA 测序相结合,同时分析转录组对数千种遗传扰动的反应。这种方法能描绘基因干扰如何通过分子网络传播,揭示调控关系和通路结构。对于 Cytion 细胞系,Perturb-seq 数据集提供了全面的功能特征描述,是对传统筛选方法的补充。
体内 CRISPR 筛选将集合筛选扩展到动物模型,在生理相关的环境中鉴定控制肿瘤生长、转移或免疫疗法反应的基因。将文库感染的细胞植入小鼠体内,收获肿瘤进行 sgRNA 定量。生长肿瘤中富集的基因代表了细胞培养筛选可能遗漏的体内适应性驱动因子。这些方法是细胞系研究与临床转化之间的桥梁。
对 Cytion 和细胞培养界来说,CRISPR 筛选将细胞系从被动的实验模型转变为主动的发现引擎。通过全基因组筛选进行的系统功能检查不断揭示基础生物学和治疗机会,使培养细胞成为现代生物学研究和药物开发不可或缺的工具。