数据案例展示
构建一个包含靶向人全基因组的sgRNA文库,文库包含63950 条sgRNA序列。文库构建完成后Sanger及NGS检测文库错误率,覆盖度及均一性。
文库错误率低
选取一个批次构建完成后随机抽取30个克隆进行桑格测序。测序结果表明在随机挑选的克隆中,100%的sgRNA序列和理论序列完全一致。

图1. 桑格测序结果
覆盖率高、分布均一,批次间稳定性高
文库的覆盖度和分布均一性是评价文库质量的重要指标,使用NGS方法进行验证。覆盖率是指构建文库中包含目标序列的比例。理想状态下文库中不同sgRNA是均匀分布的,但因PCR过程及克隆过程会有一定的偏好性,导致一部分sgRNA reads数较低,一部分sgRNA reads数较高,因此使用均一性评价文库中序列分布的均匀程度,通常采用分布斜率Skew Ratio评价,通常认为数值<10代表为合格文库,数值越小代表均一性越好。
四个批次构建文库数据分析结果如下:
批次 |
理论gRNA多样性 |
实际gRNA多样性 |
覆盖度
(实际sgRNA多样性/理论多样性)
|
Skew Ratio |
01 |
63950 |
63950 |
100% |
2.24 |
02 |
63950 |
63940 |
99.98% |
2.39 |
03 |
63950 |
63937 |
99.98% |
2.91 |
04 |
63950 |
63943 |
99.99% |
2.29 |