如何看懂三代测序数据 第三代测序方法
qiyuwang 2024-10-10 11:25 24 浏览 0 评论
东风吹,战鼓擂,二代三代谁怕谁
小编作为生信人,还沉浸在illumina的paired-end中,突然发现,我国已成为迄今以及将来的全球最大三代测序平台拥有国,深感焦虑啊。如果不了解些三代测序的知识,将来如何在生信圈立足呢?本着好东西要和好朋友分享的态度,小编整理了最近get到的一些三代测序知识点,首先是QC篇。
1
下机数据
小编选择了一个cell的下机数据为例进行介绍,不多说,先上图:
在analysis文件夹中,下机的数据被分割为三个文件进行存储,其中以bax.h5为后缀的是原始二进制文件;以subreads.fasta/subreads.fastq 为后缀的是经一级处理得到的标准格式的碱基文件;以sts.csv/sts.xml为后缀的是记录测序过程中每个ZMW度量指标的统计文件。
在这里,小编还仔细查看了下机数据的命名,发现其中也有着固定的规律,且看小编细细道来:
这里解释一下:
1. m是movie的缩写;
2. 测序时间,格式为yymmdd_hhmmss;
3. 仪器编号;
4. SMRT Cell Barcode;
5和6无实际意义,一般是固定的。
2
数据结构
要做好数据的质控,不仅要知其然,还有知其所以然。首先小编展示的是三代数据的文库模型:
三代测序的文库模型是两端加接头的哑铃型结构,测序时会环绕着文库进行持续的进行,由此得到的测序片段称为polymerase reads,即一条含接头的测序序列,其直观的反映了三代测序的长度。目前,采用最新的P6-C4酶,最长的读长可达到60kb以上。
在这里,大家可能会有疑问,环绕测序岂不是产生了很多冗余的信息?其实,这里的polymerase reads是需要进行一定的处理才能获得用于后续分析的。这个过程首先是去除低质量序列和接头序列:
Polymerase reads 经处理后得到的序列称为subreads ,根据不同插入片段长度的文库, subreads 的类型也有所不同。
在用于基因组denovo时,通常会构建10kb/20kb的文库,对长插入片段文库的测序基本是少于2 passes的(pass即环绕测序的次数),得到的reads也称为Continuous Long Reads (CLR),这样的reads测序错误率等同于原始的测序错误率。
而对于全长转录组或全长16s测序,构建的文库插入片段较短,测序会产生多个passes,这时会对多个reads进行一致性校正,得到一个唯一的read,也称为Circular Consensus Sequencing (CCS) Reads,这样的reads测序准确率会有显著的提升。
3
数据质控
不同于二代测序的碱基质量标准Q20/Q30,三代测序由于其随机分布的碱基错误率,其单碱基的准确性不能直接用于衡量数据质量。那么,怎么判断三代测序的数据好不好呢?
最直接的方法是看长度。长度短的测序数据不一定差(与文库大小有关),但差的数据长度一定短。在上游测序,最关键的影响因素是文库的构建。高质量的文库产出的数据长度长,质量好;而低质量的文库产出的数据长度短,质量差。
其次,看比例。需要关注的是两个比例,一个是subreads与polymerase reads数据量的比例,比例过低反映测序过程中的低质量的序列较多;一个是zmw孔载入的比例,根据孔中载入的DNA片段数分为P0、P1和P2。P1比例过低反映数据产量低,P2比例过高反映上样浓度异常。
----- 结语 -----
对于测序,小编认为不管一代二代三代,还是要落实到能够解决实际问题。测序数据类型和格式会变,而数据分析背后的原理不会变。当然,纸上得来终觉浅,绝知此事要躬行,小编也欢迎大家分享关于三代测序数据处理方面的经验。
PS: 本文相关介绍均以Pacbio RSII测序平台的数据为准,与Sequel测序平台略有出入,如有举报,概不接受 ~_~
相关推荐
- 10款最出色的免费数据库管理工具(免费数据库客户端)
-
OpenKeyValOpenKeyval是一款免费、开源的键值数据库管理工具,基于Web,并且基于PHP开发,其目标是用最简单的方法来管理Web应用程序数据。用户只需要发送一个POST请求就可以存储...
- 主流数据库的不同点在哪?MySQL和SQL Server的区别介绍
-
在本教程中,树懒君介绍了两种最普遍应用的RDBMS—MySQL和MicrosoftSQLServer。通过介绍MySQL和SQLServer的几个关键区别,希望大家能在这两者之间做出最适合自己的...
- 【推荐】一个开源免费、AI 驱动的智能数据管理系统,支持多数据库
-
如果您对源码&技术感兴趣,请点赞+收藏+转发+关注,大家的支持是我分享最大的动力!!!.前言...
- MySQL原理介绍(mysql原理简述)
-
一、Mysql中有哪几种锁?1)表级锁开销小,加锁快;不会出现死锁;锁定粒度大,发生锁冲突的概率最高,并发度最低。...
- 免费的sql工具,SQLynx有哪些优势?
-
1.免费且功能全面无成本负担:对于个人用户来说,SQLynx个人版完全免费,无需支付任何使用费用或订阅费用,降低了个人开发者的经济成本。...
- 免费mysql服务器,mySQL云数据库产品优势?
-
mysql免费服务器,免费mysql服务器。云数据库MySQL(TencentDBforMySQL)是一种稳定可靠、可弹性扩展和便于管理的关系型数据库服务。云数据库MySQL提供备份恢复、监...
- 结合我们公司的需求,看了ORACLE的收费,决定弃购!
-
今天向ORACLE的销售人员,确认了他们的报价,每套ORACLE按CPU付费,一个CPU报价约26万,如果你一台服务器有4个CPU,则26*4=104万(一台服务器)。我们有10台服务器,经费不够的情...
- 一起免费考 MySQL OCP 认证啦(mysql ocp考试大纲)
-
前言:在1995年,首个MySQL版本发布,为庆祝MySQL诞辰30周年,OracleUniversity在限定期间内推出了多个MySQL的免费培训课程与认证,其中也包括My...
- Navicat推出免费数据库管理软件Premium Lite
-
IT之家6月26日消息,Navicat推出一款免费的数据库管理开发工具——NavicatPremiumLite,针对入门级用户,支持基础的数据库管理和协同合作功能。▲Navicat...
- Linux服务器配置DNS解析(linux dns配置服务器)
-
环境说明CentOS等Linux操作系统基本是一样的...
- 搭建内网的DNS服务器(搭建内网dns解析服务器)
-
1.安装dnsmasq#centosyum-yinstalldnsmasq...
- # 更换手机热点后secureCRT无法连接centOS7系统
-
#更换手机热点后secureCRT无法连接centOS7系统##一、问题描述某些情况下,我们可能使用手机共享热点而给电脑联网。本来用一个手机热点共享网络时,SecureCRT可以正常连接到Cent...
- VMware与CentOS安装配置指南(vmware workstation安装centos7)
-
以下是一份详细的VMware虚拟机安装、配置及CentOS系统安装配置的指南,适合新手逐步操作:一、VMware虚拟机安装与配置...
- CentOS7安全加固的一份整理规划建议
-
◆更新系统:及时更新CentOS7操作系统版本和安全补丁,确保系统以最新状态运行。◆关闭不必要的服务:在运行系统时,应关闭不需要的服务和端口,以减少系统暴露的攻击面。◆安装防火墙:使用iptables...
- DNS从入门到放弃系列(3)(dns f1)
-
见字如面,我是小斐,今天文章展开说明bind9中named.conf...
你 发表评论:
欢迎- 一周热门
- 最近发表
- 标签列表
-
- navicat无法连接mysql服务器 (65)
- 下横线怎么打 (71)
- flash插件怎么安装 (60)
- lol体验服怎么进 (66)
- ae插件怎么安装 (62)
- yum卸载 (75)
- .key文件 (63)
- cad一打开就致命错误是怎么回事 (61)
- rpm文件怎么安装 (66)
- linux取消挂载 (81)
- ie代理配置错误 (61)
- ajax error (67)
- centos7 重启网络 (67)
- centos6下载 (58)
- mysql 外网访问权限 (69)
- centos查看内核版本 (61)
- ps错误16 (66)
- nodejs读取json文件 (64)
- centos7 1810 (59)
- 加载com加载项时运行错误 (67)
- php打乱数组顺序 (68)
- cad安装失败怎么解决 (58)
- 因文件头错误而不能打开怎么解决 (68)
- js判断字符串为空 (62)
- centos查看端口 (64)