为什么CRISPR衍生提的rna有蛋白污染影响pcr结果吗和各种Cas蛋白(包括Cas9)能抵御病毒和其他异物的攻击?

关注“Being科学”微信公众号了解更多精彩内容和福利!!常见病研究的一个主要目标是确定致病基因,从而阐明生物学机制并探寻药物靶点。全基因组关联研究(GWAS)已经确定了数千种与疾病结果和疾病相关表型相关的遗传变异,但这些关联几乎总映射到非编码区域,因此难以捉摸它们的靶基因和功能,这也被称为variant-to-function(V2F)问题。最近的研究使用统计精细定位来识别可能因果GWAS变异和功能基因组学,以找到候选顺式调控组件(candidate cis-regulatory elements,cCREs)及其靶基因。其他研究则对非编码调控组件进行了基于CRISPR的沉默或诱变筛选,以确定目标基因。近日,纽约基因组中心的科研团队在《Science》上发表题为“Discovery of target genes and pathways at GWAS loci by pooled single-cell CRISPR screens”的研究文章,结合上述方法并开发出STING-seq(Systematic Targeted Inhibition of Noncoding GWAS loci coupled with single-cell sequencing),使用单细胞CRISPR筛选来识别非编码GWAS位点的靶基因。其中,研究人员发现了91个非编码血液性状GWAS位点的124个顺式靶基因。他们还使用碱基编辑STING-seq(BeeSTING-seq)插入了特定的GWAS变体,将碱基编辑与单细胞多组学相结合。总得来说,该平台能实现人类非编码变异靶基因和机制的大规模并行顺、反式表征。精细绘制多血统性状GWAS,识别候选CREs血细胞具备高多基因性,与多种常见疾病有关联,数据库中有大规模可用的基因分型个体,故被选作研究对象。研究人员检查了英国生物银行(UKBB)中29种血液性状GWAS和来自血细胞联盟(BCX)的15种性状,同时进行了多血统和个体人群分析。研究人员对29个UKBB血液性状GWAS进行统计精细定位,发现在所有BCX种群特异性GWAS中(不包括欧洲血统),每个性状有42个条件独立信号和418个精细定位变异。超过90%的精细定位变异位于基因组的非编码区域。研究人员针对来自不同GWAS的cCRES,通过将精细定位的非编码变体与增强子活性的生化标志相交。K562细胞是成熟且特征明确的血液性状模型,在其中确定了具有红细胞特异性效应的遗传变异,转录因子占用相较于人类原红细胞强烈保守,基因表达和开放染色质谱与人类红细胞祖细胞相似,Hi-C中启动子互作区域富含血液性状GWAS变异。功能基因组数据产生了大量来自UKBB和BCX GWAS的可靶向变体,究人员选择了精细定位的GWAS基因座(294个变体)或10个最可能的变体(249个变体)中概率最高的变体。此外,还优先考虑来自非欧洲血统的变体。总体而言,研究人员从BCX多血统分析(339个变体)、BCX非欧洲血统(118个变体)和UKBB欧洲血统(86个变体)中选择变体。优化的双抑制子CRISPRi系统为了扰乱选定的cCREs,研究人员设计了双抑制子KRAB-dCas9-MeCP2系统,在靶向转录起始位点(TSS)或增强子位点时,其基因抑制比单抑制子(KRAB-dCas9)系统高50-60%。研究人员使用~2,000个CRISPR引导RNA(gRNA)的汇集文库进一步表征双抑制子CRISPRi,该文库靶向与~250个必需基因的TSS不同距离的位点。研究人员发现双抑制子CRISPRi具有聚焦活性窗口,抑制最小超过1kb,并且大多数活性gRNA位于距离TSS的-400至850nt之间。大规模并行检测,扰乱CREs并探寻靶基因研究人员设计了STING-seq gRNA文库,使用双抑制子CRISPRi(KRAB-dCas9-MeCP2)靶向血性状cCRE,并对gRNAs进行了最小的脱靶活性优化。研究人员还在STING-seq文库中嵌入了几种对照gRNAs,通过流式细胞术估计每个细胞的平均扰动次数,多个gRNAs靶向编码细胞表面蛋白(CD55)的基因。在高感染复数(MOI)下,研究人员用混合文库病毒转导K562细胞,通过流式细胞术对CD55进行验证。同时,从单个细胞中捕获了四种不同的模式:CRISPR gRNAs、转录组、通过寡聚标记抗体的细胞表面蛋白质组,和单细胞混样技术(Cell hashing)。分析发现,每个细胞的gRNAs中位数为13个,每个cCRE靶向中位数为978个细胞。为了进行差异表达测试,研究人员最近开发了一种条件重采样方法(SCEPTRE),可对CRISPR单细胞数据集进行最先进的校准,以将扰动与基因和蛋白质表达的变化联系起来。使用SCEPTRE,研究人员将每个cCRE的gRNAs组合在一起,执行成对测试,每个cCRE测试的基因中位数为500kb以内的7个基因的顺式效应。研究发现,非靶向gRNAs没有效果,对照基因的表达或蛋白质水平降低,错误发现率(FDR)为5%。在大多数情况下,当同时存在H3K27ac和开放染色质峰时,GWAS变体的顺式靶基因更有可能被识别。大多数顺式靶基因也是距离变异最近的基因。接下来,研究人员描述了通过STING-seq和其他方法鉴定的顺式靶基因之间的一致性。为了识别锚定在三维空间中与H3K27ac结合的染色质的基因启动子,研究人员在K562细胞中生成了H3K27ac HiChIP文库。在134个STING-seq CREs及其124个目标基因中,观察到32个CREs中相同的基因被H3K27ac HiChIP识别,27个CREs中相同的基因通过表达数量性状位点(eQTL)定位相同的精细-映射变体,以及通过血液性状的转录组范围关联研究(TWAS)鉴定了73个CREs中相同的基因。虽然TWAS对目标基因识别的敏感性相当高(54%),但研究人员和其他人发现使用这种方法的特异性可能较低。此外,具有精细定位GWAS变体的54个CREs对增强子活性或转录因子结合具有等位基因特异性影响,表明这些变体在其各自的CREs中是因果关系。鉴定致病变异及其对基因和蛋白表达的影响在STING-seq数据集中,研究人员确定了多行正交证据汇聚的示例,以解释CREs如何调节顺式靶基因,通过实验性CREs基因作图确定了最可能的因果GWAS变异。为了解开具有多个顺式靶基因的位点,研究人员结合靶向CREs抑制和基因抑制。例如,与单核细胞计数相关的基因座处的先导变异(rs7416513),映射到CRYBG2和CD52基因体之间的基因间区域,具有最接近TSS的基因是UBXN11。鉴于此,尚不清楚这些基因中的哪些可能是目标基因。该变体也是基因座中多个基因(CD52、CRYBG2、SH3BGRL3和ZNF593)的精细定位血细胞eQTL,进一步模糊了目标基因。抑制rs7416513-CREs后,研究人员检测到CD52是最显著改变的基因,ZNF593的表达也有微弱变化,对SH3BGRL3或CRYBG2没有影响。直接靶向CD52不影响ZNF593表达,表明rs7416513-CREs对多个基因具有多效性调节作用。使用单细胞蛋白质组学,研究人员还检测到rs7416513-CREs抑制后细胞表面CD52蛋白表达显著降低,表明具有GWAS变体的CREs不仅调节顺式靶基因表达,还调节蛋白质表达。CD52蛋白可与alemtuzumab靶向,以改善骨髓增生异常综合征患者的临床结局,这可能是单核细胞计数GWAS关联的致病基因。rs7416513衍生的C等位基因与多血统meta分析中的单核细胞计数增加有关,并且还与单核细胞中CD52表达增加有关,突出了STING-seq将变异与可药物基因联系起来,并识别可能影响对alemtuzumab等药物反应的变异的能力。使用非欧洲和多血统GWAS发现靶基因大多数GWAS基因座都是使用欧洲血统个体识别的,最近使用非欧洲血统和将多个血统组合用于GWAS的努力产生了许多新的关联。研究人员从非欧洲血统的GWAS变体中鉴定了16个具有顺式靶基因的CREs。例如,研究人员将ATP1A1鉴定为仅在非洲血统中与中性粒细胞计数相关的基因座的靶基因。主要变体(rs6674304)在具有非洲血统的个体中被精细映射为似是而非的因果关系,但在具有欧洲血统的个体中则不然。尽管rs6674304没有映射到任何cCREs,但统计精细映射指定了另外三个确实映射到cCREs的变体(rs6660743、rs12087680和rs7544679)。研究人员使用STING-seq靶向所有三种变体,发现靶向rs12087680-CREs揭示了顺式靶基因ATP1A1。这表明,使用非欧洲和多祖先GWAS的STING-seq可以识别新的性状基因。APOE和APOC1基因座中的多效性CREs在少数STING-seq CREs中存在多个顺式靶基因,这些基因可能是直接调节多个基因,或间接影响单个顺式靶基因驱动的其他附近基因。如果没有额外的扰动或已知的基因调控网络,这些结果可能很难区分。例如,研究人员发现rs1065853是先导变异体,映射到APOE和APOC1基因体之间的基因间区域,APOE是最接近的基因,也与高和低密度脂蛋白水平相关。先前的研究表明,编码载脂蛋白E和C1的APOE和APOC1会影响血脂和多种疾病,包括心血管疾病和阿尔茨海默病。当抑制rs1065853-CREs后,APOE和APOC1的表达显著降低。为了区分直接和间接调节,研究人员在K562中使用了先前的全基因组扰动串行(GWPS)研究来推断APOE或APOC1是否相互调节。研究表明rs1065853-CREs可能单独靶向APOC1或同时靶向APOC1和APOE。这些基因协同调节脂质代谢,因此其共同调节是可能有助于性状关联的调节多效性。使用beeSTING-seq直接插入GWAS变体接下来,研究人员试图扩展STING-seq方法,以通过碱基编辑精确插入精细定位的GWAS变体。研究人员将胞嘧啶碱基编辑器(FNLS-BE3)融合到PAM柔性Cas9变体(SpRY),并使用旨在破坏CD46中剪接点的gRNA验证活性。当靶向不同PAM的剪接位点时,CD46敲低率高达~70%,平均敲低效率为27%,类似于之前使用碱基编辑的合并筛选。然后,研究人员进行了单细胞合并碱基编辑筛选(beeSTING-seq),目标是将46个C>T精细定位的GWAS变体映射到42个STING-seq鉴定的CREs。研究人员测试了对已知靶基因的直接影响,发现其中有32个具有至少两个一致效应的gRNAs。研究人员鉴定了三组beeSTING-seq gRNAs,它们对使用STING-seq(5% FDR)鉴定的相同靶基因具有顺式调控作用。CREs驱动、剂量依赖性转录组范围的基因表达变化为了解GWAS-CREs对整个基因组基因表达的影响,研究人员进行了转录组差异表达测试。应用严格的(1%)FDR来鉴定反式中的靶基因,并再次发现使用非靶向gRNA进行良好的校准。研究发现,在顺式中靶向转录因子(TFs)GFI1B,NFE2,IKZF1,HHEX和RUNX1以及microRNAs(miRNAs) miR-142和miR-144/451宿主基因的CREs的反式效应。这些TFs和miRNAs在造血干细胞分化中起关键作用。对于GFI1B,研究人员确定了两个具有反式效应的独立CREs。一种与单核细胞百分比和嗜碱性粒细胞计数相关的变体(rs524137)映射到GFI1B下游11.5kb的基因间CREs。另一个变体(rs73660574)与几个红细胞特征相关,映射到GFI1B内含子中的CREs。这些CREs对GFI1B表达表现出独立的剂量效应,rs524137-CREs的效应比rs73660574-CREs强约70%。研究人员发现CREs的反式调节作用之间存在线性剂量关系,这与其对顺式(GFI1B)表达的影响差异一致。在同一细胞中使用单细胞蛋白质组学,发现GFI1B网络中九个基因的蛋白质水平变化,转录物表达和蛋白质水平的变化高度相关。这些发现表明了映射到CREs的GWAS变体如何扰乱监管网络,以及RNA水平变化也会改变蛋白质表达。许多GWAS功能解释方法局限于专注附近的蛋白质编码基因,而忽略了相关的非编码RNAs。通过STING-seq,研究人员还确定了microRNA的调控网络,这些网络可以对基因调控产生广泛的影响。研究人员还使用beeSTING-seq分析了直接变异插入的反式效应。在插入分别映射到HHEX和IKZF1G WAS-CREs的rs12784232-A等位基因和rs6592965-A等位基因时,研究人员可以检测到调控网络表达在预期方向上的变化。具体来说,研究人员观察到60-70%的HHEX和IKZF1网络基因具有相反的作用方向,这表明增加表达的GWAS变体可以从CREs沉默的不一致方向上影响网络。跨调控网络中顺式靶标结合位点和GWAS基因的富集为了更好表征反式靶基因的CREs如何改变血细胞表型,研究人员检查了GFI1B,NFE2,IKZF1和RUNX1(ChIP-seq)的全基因组结合,以及miR-142和miR-144/451(TargetScan)的预测靶标。研究发现了GFI1B,NFE2,IKZF1,RUNX1和miR-142的预测靶基因富集。因此,扰动CREs可以揭示由TFs或miRNAs驱动的调节网络的二阶相互作用。一个相关的相关问题是STING-seq识别的反式调控网络中的基因是否也可能在血液性状中发挥作用,以及它们是否也具有顺式调控遗传变异。血细胞特征GWAS位点富集表明,这些基因在造血和细胞分化中的已知作用是由它们对调控网络的影响介导的。此外,使用STING-seq确定了调控网络的反式基因,其基因组中不同变异的多基因扰动似乎有助于GWAS信号。这表明网络本身的机制重要性,如果研究人员知道它们可能起作用的途径,则不需要在功能上剖析每个基因座的V2F。反式调节基因揭示性状关联的生物学机制和细胞类型鉴于反式调节基因与GWAS基因座之间的这些关系,研究人员分析了这些调节网络的结构,以更好地了解特定基因在血液性状中的机制作用。使用单细胞基因共表达和聚类,研究人员确定了每个基因座的共表达基因簇。对于反式作用基因GFI1B,他们发现在使用STING-seq抑制GFI1B CREs后,有两个基因簇(A和B)表达增加。这些簇最富集GFI1B结合位点。第三个簇(C)主要由表达减少的基因组成,这些基因没有富集GFI1B结合位点。簇A和B富含来自血小板和白细胞GWAS的基因,而簇C仅富含来自红细胞GWAS的基因。为了进一步完善和验证涉及不同共调节基因簇的单个细胞类型,研究人员将GFI1B共表达网络与来自人类细胞图谱的原代细胞集成在一起。研究发现,GFI1B不在粒细胞和淋巴细胞中表达。来自簇A的基因高度富集GFI1B结合位点,并且在抑制GFI1B时表达增加,表明这些基因在表达GFI1B的细胞中被积极抑制。接着观察到来自簇A的基因在粒细胞-单核细胞祖细胞(GMP)和分化的白细胞类型中高度表达。同质血祖细胞样细胞类型中识别这些跨调节网络,证明了STING-seq在研究CREs对靶基因的不同影响方面的实用性。总结研究人员采用非编码人类遗传变异,并集成了精细定位、汇集CRISPR筛选以及单细胞RNA和蛋白质测序,开发了一种表征GWAS基因座功能效应的方法,以识别顺式和反式的靶基因。该研究展示了STING-seq在识别与GWAS变异重叠的CREs靶基因方面的效用,并描述了CREs的复杂调控结构。STING-seq与细胞表型筛选的集成,将是将遗传变异与驱动GWAS关联的细胞机制联系起来的一个进步。STING-seq工作流程为解决V2F挑战和以高通量方式鉴定GWAS位点的靶基因提供了平台,从而能实现更深入了解人类非编码基因组功能,并将其转化为新疗法。}

我要回帖

更多关于 提的rna有蛋白污染影响pcr结果吗 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信