(12)发明专利申请
(10)申请公布号 CN 108913753 A(43)申请公布日 2018.11.30
(21)申请号 201811245145.2(22)申请日 2018.10.25
(71)申请人 翌圣生物科技(上海)有限公司
地址 200120 上海市浦东新区天雄路166弄
1号楼402室(72)发明人 郑贤杰 朱垚 曹振 袁慧艳
宋东亮 (74)专利代理机构 上海精晟知识产权代理有限
公司 31253
代理人 冯子玲(51)Int.Cl.
C12Q 1/6811(2018.01)
权利要求书1页 说明书3页
序列表3页
(54)发明名称
一种制备二代测序接头的方法(57)摘要
本发明提供一种制备二代测序接头的方法,步骤一:合成接头序列,接头序列包含第一包括:
序列和第二序列,其中,所述第二序列包括:限制性内切酶的保护碱基、随机碱基的双链分子标签,步骤二:接头序列退火,混匀第一序列和第二序列,在退火体系中按退火程序退火形成双链,步骤三:补齐步骤二中所形成的双链的接头,步骤四:酶切回收3’-dT尾接头。本发明的制备二代测序接头的方法,具有以下优势:接头中含有更长的双链分子标签,为生信分析提供更好的信息基础;可以有效、较经济实惠地合成获得;适用于多种测序平台。CN 108913753 ACN 108913753 A
权 利 要 求 书
1/1页
1.一种制备二代测序接头的方法,其特征在于,包括:步骤一:合成接头序列,接头序列包含第一序列和第二序列,其中,所述第二序列包括:限制性内切酶的保护碱基和随机碱基的双链分子标签,步骤二:接头序列退火,混匀第一序列和第二序列,在退火体系中按退火程序退火形成双链,
步骤三:补齐步骤二中所形成的双链的接头,步骤四:酶切回收接头,第一序列的序列如下:
5-A*A*TGATACGGCGACCACCGAGATCTACACTCTTTCCCTACACGAC-GCTCTTCCGAT*C*T-3,第二序列的序列如下:
5-NNNNANNNNCCCAGTAG*A*TCGGAAGAGCACACGTCTGAACTCCAGTCACNNNN-NNNNNNNN-ATCTCGTATGCCGTCTTCTGCT*T*G-3,
第二序列中,第1至4位为限制性内切酶的保护碱基,第6位至第9位是四个随机碱基的双链分子标签,第50位至第53位是四个随机碱基的单链分子标签,第54位至第61位是6-8个碱基的样本标签。
2.如权利要求1所述的制备二代测序接头的方法,其特征在于:其中,所述第二序列中还具有随机碱基的单链分子标签。3.如权利要求1所述的制备二代测序接头的方法,其特征在于:其中,所述第二序列中还具有样本标签。
4.如权利要求1所述的制备第二代测序接头的方法,其特征在于:其中,所述第二序列中还具有限制性内切酶BmrI的酶切位点。5.如权利要求1所述的制备第二代测序接头的方法,其特征在于:步骤三中,采用T4 DNA聚合酶延伸补平步骤二中的退火产物。6.如权利要求1所述的制备第二代测序接头的方法,其特征在于:步骤四中,采用限制性内切酶BmrI酶切步骤三中的延伸产物,并采用上海翊圣生物科技有限公司的Hieff NGS™ Smarter DNA Clean Beads纯化回收接头,去除50bp以内的残余双链小片段,保留接头。
2
CN 108913753 A
说 明 书
一种制备二代测序接头的方法
1/3页
技术领域
[0001]本发明涉及一种制备二代测序接头的方法,属于分子生物学领域。
背景技术
[0002]在Illumina测序平台中,接头是二代测序建库中必要的元素,目前官方的接头包含多种类型,序列中包含了p5与p7扩增引物结合序列、read1和read2测序引物结合序列、样本标签序列、分子标签序列等,并且带有用于A/T连接的3’-dT尾。
[0003]目前常于p7端设计单链分子标签用于给建库中的目标分子添加标签,使生信分析过程可以捕获到更精细的分子信息,降低变异分析的背景噪音。[0004]另外,也可以通过双链分子标签,结合单链分子标签,通过生信将变异分析的背景噪音降得更低,使测序分析结果更加精准可靠。[0005]但是,目前没有较好的双链标签添加方法方便于文库构建。[0006]1、目前接头通常不含单链分子标签、或仅含有单链分子标签二不含双链标签,生物信息分析降噪效果有限;
2、如Capp-Seq技术中含有双链标签,但是标签数较低,对生物信息分析的改进有限。发明内容
[0007]本发明的目的在于提供一种制备二代测序接头的方法,以解决上述问题。[0008]本发明采用了如下技术方案:
一种制备二代测序接头的方法,其特征在于,包括:步骤一:合成接头序列,接头序列包含第一序列和第二序列,其中,所述第二序列包括:限制性内切酶的保护碱基和随机碱基的双链分子标签,步骤二:接头序列退火,混匀第一序列和第二序列,在退火体系中按退火程序退火形成双链,
步骤三:补齐步骤二中所形成的双链的接头,步骤四:酶切回收接头,第一序列的序列如下:
5-A*A*TGATACGGCGACCACCGAGATCTACACTCTTTCCCTACACGAC-GCTCTTCCGAT*C*T-3,第二序列的序列如下:
5-NNNNANNNNCCCAGTAG*A*TCGGAAGAGCACACGTCTGAACTCCAGTCACNNNN-NNNNNNNN-ATCTCGTATGCCGTCTTCTGCT*T*G-3,
第二序列中,第1至4位为限制性内切酶的保护碱基,第6位至第9位是四个随机碱基的双链分子标签,第50位至第53位是四个随机碱基的单链分子标签,第54位至第61位是6-8个碱基的样本标签。[0009]进一步,本发明的制备二代测序接头的方法,还具有这样的特征:其中,所述第二
3
CN 108913753 A
说 明 书
2/3页
序列中还具有随机碱基的单链分子标签。[0010]进一步,本发明的制备二代测序接头的方法,还具有这样的特征:其中,所述第二序列中还具有样本标签。[0011]进一步,本发明的制备二代测序接头的方法,还具有这样的特征:其中,所述第二序列中还具有限制性内切酶BmrI的酶切位点。[0012]进一步,本发明的制备二代测序接头的方法,还具有这样的特征:步骤三中,采用T4 DNA聚合酶延伸补平步骤二中的退火产物。[0013]进一步,本发明的制备二代测序接头的方法,还具有这样的特征:步骤四中,采用限制性内切酶BmrI酶切步骤三中的延伸产物,并采用上海翊圣生物科技有限公司的Hieff NGS™ Smarter DNA Clean Beads纯化回收接头,去除50bp以内的残余双链小片段,保留接头。
[0014]发明的有益效果
本发明的制备二代测序接头的方法,具有以下优势:1.接头中含有更长的双链分子标签,为生信分析提供更好的信息基础;而现有的产品通常不带双链分子标签、罗氏的带2bp的双链分子标签。[0015]2.可以有效、较经济实惠地合成获得;
3.适用于Illumina Hi-Seq、Mi-Seq等测序平台。具体实施方式
[0016]以下通过具体实例来说明本发明的具体实施方式。[0017]步骤一:合成接头序列。合成以下两种序列:
序列1:
5-A*A*TGATACGGCGACCACCGAGATCTACACTCTTTCCCTACACGAC-GCTCTTCCGAT*C*T-3序列2:
5-NNNN-ANNNNCCCAGT-AG*A*TCGGAAGAGC-ACACGTCTGAACTCCAGTCAC-NNNN-NNNNNNNN-ATCTCGTATGCCGTCTTCTGCT*T*G-3
序列中“*”为保护性修饰;
第1至第4位的碱基为限制性内切酶的保护碱基,在其它的实施方式中,5’端的保护性碱基,可选的碱基数为0-10个,具体碱基可变,具体根据实际案例设计而定;
第6位至第9位是四个随机碱基的双链分子标签,第50位至第53位是四个随机碱基的单链分子标签,第54位至第61位是6-8个碱基的样本标签。每次合成固定碱基的序列,次序列可变;第10位至第15位的碱基为限制性内切酶BmrI的酶切位点。[0018]步骤二:接头序列退火。[0019]步骤三:延伸补齐接头。采用T4 DNA聚合酶延伸补平步骤二中的退火产物。[0020]步骤四:酶切回收3’-dT尾接头。采用限制性内切酶BmrI酶切步骤三中的延伸产物,并采用上海翊圣生物科技有限公司的Hieff NGS™ Smarter DNA Clean Beads纯化回收接头,去除50bp以内的残余双链小片段,保留接头。[0021]双链分子标签接头制备示例:
4
CN 108913753 A
说 明 书
3/3页
1、合成接头序列:序列1:
5-A*A*TGATACGGCGACCACCGAGATCTACACTCTTTCCCTACACGAC-GCTCTTCCGAT*C*T-3序列2:
5-TTTC-ANNNNCCCAGT-AG*A*TCGGAAGAGC-ACACGTCTGAACTCCAGTCAC-NNNN-NNNNNNNN-ATCTCGTATGCCGTCTTCTGCT*T*G-3
2、接头序列退火:
1:1混匀序列1和序列2,在退火体系中按退火程序退火形成双链,形成以下结构:
3、延伸补齐接头:利用T4 DNA聚合酶延伸补齐接头序列,如下:
4、酶切回收3’-dT尾接头:
利用BmrI限制性内切酶酶切上述接头,并利用上海翊圣生物科技有限公司的Hieff NGS™ Smarter DNA Clean Beads纯化回收接头,接头如下:
本发明所提供的接头制备方法,回收效率在40%~80%。
5
CN 108913753 A
序 列 表
1/3页
序列表<110> 翌圣生物科技(上海)有限公司<120> 一种制备二代测序接头的方法<160> 6<170> SIPOSequenceListing 1.0<210> 1<211> 58<212> DNA<213> Artificial sequence<400> 1aatgatacgg cgaccaccga gatctacact ctttccctac acgacgctct tccgatct 58<210> 2<211> 85<212> DNA<213> Artificial sequence<220><221> misc_feature<222> (1)..(4)<223> n is a, c, g, or t<220><221> misc_feature<222> (6)..(9)<223> n is a, c, g, or t<220><221> misc_feature<222> (50)..(61)<223> n is a, c, g, or t<400> 2nnnnannnnc ccagtagatc ggaagagcac acgtctgaac tccagtcacn nnnnnnnnnn 60natctcgtat gccgtcttct gcttg 85<210> 3<211> 85<212> DNA<213> Artificial sequence<220><221> misc_feature<222> (6)..(9)<223> n is a, c, g, or t
6
CN 108913753 A
序 列 表
2/3页
<220><221> misc_feature<222> (50)..(61)<223> n is a, c, g, or t<400> 3tttcannnnc ccagtagatc ggaagagcac acgtctgaac tccagtcacn nnnnnnnnnn 60natctcgtat gccgtcttct gcttg 85<210> 4<211> 73<212> DNA<213> Artificial sequence<220><221> misc_feature<222> (65)..(68)<223> n is a, c, g, or t<400> 4aatgatacgg cgaccaccga gatctacact ctttccctac acgacgctct tccgatctac 60tgggnnnntg aaa 73<210> 5<211> 69<212> DNA<213> Artificial sequence<220><221> misc_feature<222> (65)..(68)<223> n is a, c, g, or t<400> 5aatgatacgg cgaccaccga gatctacact ctttccctac acgacgctct tccgatctac 60tgggnnnnt 69<210> 6<211> 78<212> DNA<213> Artificial sequence<220><221> misc_feature<222> (1)..(4)<223> n is a, c, g, or t<220><221> misc_feature
7
CN 108913753 A
序 列 表
3/3页
<222> (45)..(54)<223> n is a, c, g, or t<400> 6nnnncccagt agatcggaag agcacacgtc tgaactccag tcacnnnnnn nnnnatctcg 60tatgccgtct tctgcttg 78
8
因篇幅问题不能全部显示,请点此查看更多更全内容