最近最好看的中文字幕久久,亚洲国产一区二区在线,一区中文字幕在线观看_亚洲ãv毛片一区二区久久麻豆|国产美女视频在线精品|亚洲国产成人片在线观看|无码福利免费专区|久久久国产精品麻豆_人人爱人人操人人爽_亚洲热av,国产精品人人爽

MobiVision轉(zhuǎn)錄組算法介紹

算法概覽

mobivision quantify可以用于分析MobiNova平臺(tái)下機(jī)的單細(xì)胞轉(zhuǎn)錄組數(shù)據(jù),關(guān)鍵分析步驟如下圖所示:

細(xì)胞標(biāo)簽糾正

MobiNova平臺(tái)下機(jī)的單細(xì)胞轉(zhuǎn)錄組分為3'轉(zhuǎn)錄組和5’轉(zhuǎn)錄組兩種,均可使用mobivision quantify進(jìn)行分析。

單細(xì)胞3'轉(zhuǎn)錄組Read結(jié)構(gòu)如下圖所示:

單細(xì)胞5'轉(zhuǎn)錄組Read結(jié)構(gòu)如下圖所示:

從Read結(jié)構(gòu)可知,無(wú)論是5'轉(zhuǎn)錄組還是3'轉(zhuǎn)錄組,其Read1的5’端均為細(xì)胞標(biāo)簽序列(20bp)和UMI序列(10bp)。為了確定Read1所攜帶的細(xì)胞標(biāo)簽序列是否正確,MobiVision會(huì)將測(cè)序片段中的細(xì)胞標(biāo)簽序列和已知白名單中的細(xì)胞標(biāo)簽序列進(jìn)行比對(duì)。目前MobiCube 高通量單細(xì)胞3'轉(zhuǎn)錄組v2.0試劑盒提供近3,000,000種細(xì)胞標(biāo)簽序列。符合以下條件的測(cè)序片段將被保留:

  • Read1的細(xì)胞標(biāo)簽存在于白名單中;
  • Read1的細(xì)胞標(biāo)簽不存在于白名單中,但與白名單中的細(xì)胞標(biāo)簽最小漢明距離<=2,并根據(jù)白名單中的細(xì)胞標(biāo)簽,對(duì)Read1中的細(xì)胞標(biāo)簽進(jìn)行糾正。

通過(guò)的測(cè)序片段,Read1僅保留糾正后的細(xì)胞標(biāo)簽序列和UMI序列,Read2在該步驟暫不做處理。

插入片段修剪

對(duì)于糾正細(xì)胞標(biāo)簽序列后的fastq數(shù)據(jù),理論上,Read1不再含有接頭序列,因此無(wú)需特殊處理。

  • 單細(xì)胞3'轉(zhuǎn)錄組的fastq數(shù)據(jù),Read2片段5'端可能存在30bp的TSO序列(“AAGCAGTGGTATCAACGCAGAGTACATGGG”),3’端可能存在poly A序列。而TSO序列和poly A序列的存在,會(huì)有效降低文庫(kù)的比對(duì)率,因此在比對(duì)前,需要將插入片段兩端可能存在的TSO序列和poly A序列去除。單細(xì)胞5'轉(zhuǎn)錄組的fastq序列,Read2片段的5’端可能存在poly T序列,3'端可能存在13bp的TSO反向互補(bǔ)序列(“CCCATATAAGAAA”),同樣需要在比對(duì)前去除。
  • 去除接頭序列及poly A和poly T可能導(dǎo)致保留下來(lái)的插入DNA片段過(guò)短,而過(guò)短的DNA片段會(huì)增加錯(cuò)配的概率,因此,在完成接頭序列去除后,還需要過(guò)濾除去插入DNA片段小于30bp的Read。

測(cè)序片段比對(duì)

mobivision quantify的采用STARsolo進(jìn)行比對(duì),比對(duì)注釋結(jié)果如下圖所示:

  • 當(dāng)測(cè)序片段有超過(guò)50%的長(zhǎng)度比對(duì)至外顯子區(qū)域時(shí),則認(rèn)為該片段為Exonic Read;
  • 當(dāng)測(cè)序片段有大于等于50%的長(zhǎng)度比對(duì)內(nèi)含子區(qū)域時(shí),則認(rèn)為該片段為Intronic Read;
  • 當(dāng)測(cè)序片段可比對(duì)至基因組,但既不屬于Exonic Read,又不屬于Intronic Read時(shí),則認(rèn)為該片段為Intergenic Read;
  • MobiVision v2.0及以后版本在統(tǒng)計(jì)antisense reads時(shí),默認(rèn)的操作模式是包含內(nèi)含子(--intron included)。在這種模式下,只要一個(gè)測(cè)序片段有大于或等于50%的長(zhǎng)度比對(duì)至內(nèi)含子和/或外顯子區(qū)域的反義鏈方向,該片段就被定義為反義鏈read。而如果選擇了--intron excluded模式,那么該測(cè)序片段必須要有100%的長(zhǎng)度比對(duì)至外顯子區(qū)域的反義鏈方向,才能被定義為反義鏈read。
  • MobiVision v2.0及以后版本在統(tǒng)計(jì)transcriptomic reads時(shí),默認(rèn)的操作模式是包含內(nèi)含子(--intron included)。在這種模式下,只要一個(gè)測(cè)序片段有大于等于50%的長(zhǎng)度比對(duì)至內(nèi)含子和/或外顯子區(qū)域,該片段就被定義為transcriptomic read。而如果選擇了--intron excluded模式,那么該測(cè)序片段必須要有100%的長(zhǎng)度比對(duì)至外顯子區(qū)域,才能被定義為transcriptomic read。

mobivision quantify記錄了所有比對(duì)到基因組上的測(cè)序片段,其中,當(dāng)測(cè)序片段比對(duì)質(zhì)量MAPQ=255時(shí),表示該測(cè)序片段比對(duì)至基因組唯一區(qū)域。而只有唯一比對(duì)至轉(zhuǎn)錄組區(qū)域的測(cè)序片段,才會(huì)進(jìn)入下游的UMI計(jì)數(shù)。

UMI計(jì)數(shù)

在進(jìn)入U(xiǎn)MI計(jì)數(shù)前,需要剔除Reads比對(duì)結(jié)果中,不符合條件的UMI。

  • 由相同堿基構(gòu)成的UMI需去除;
  • 含有N的UMI需去除;
  • 1個(gè)或多個(gè)相同的UMI比對(duì)到同一基因上時(shí),UMI Count記為1;多個(gè)相同的UMI比對(duì)到不同的基因上時(shí),保留比對(duì)至同一基因上UMI最多的比對(duì)情況,去除比對(duì)至其他基因的UMI,UMI Count記為1;
  • 兩個(gè)UMI之間僅相差1個(gè)堿基,且比對(duì)到相同基因,則認(rèn)為這兩個(gè)UMI相同,保留其中一個(gè)UMI,UMI Count記為1。

經(jīng)過(guò)上述過(guò)濾條件,保留下來(lái)的UMI信息和細(xì)胞標(biāo)簽序列可構(gòu)建生成raw-cell-gene-matrix矩陣。

細(xì)胞過(guò)濾

mobivision quantify目前提供兩種細(xì)胞過(guò)濾的算法,分別是CR2.2EmptyDrops (Lun等人于2019年發(fā)表在Genome biology中的算法)。如果用戶(hù)需要指定細(xì)胞數(shù)目,也可通過(guò)--cellnumber INT 來(lái)選擇含有UMI數(shù)目排列前INT個(gè)的細(xì)胞標(biāo)簽作為有效細(xì)胞。

對(duì)于來(lái)源于兩個(gè)物種的混合樣本,例如人和小鼠,mobivision quantify將細(xì)胞分成了三種情況:來(lái)源于人的細(xì)胞、來(lái)源于小鼠的細(xì)胞及人鼠混合的細(xì)胞(multiplet)。mobivision quantify認(rèn)為,單個(gè)細(xì)胞標(biāo)簽中,只有不少于90%的UMI分子來(lái)源同一物種,該細(xì)胞標(biāo)簽才會(huì)被認(rèn)為來(lái)是源于這個(gè)物種的細(xì)胞。例如,當(dāng)某個(gè)細(xì)胞標(biāo)簽中,80%的UMI來(lái)源于物種1,另外20%的UMI來(lái)源于物種2,那么mobivision quantify會(huì)判定該細(xì)胞為multiplet。雖然mobivision quantify無(wú)法直接判斷文庫(kù)中的雙胞或多胞率,但是通過(guò)multiplet的計(jì)算,我們可以間接評(píng)估文庫(kù)中雙胞或多胞的情況。若文庫(kù)中存在雙胞或多胞的情況,那么理論上,物種1+物種1的情況應(yīng)占1/4,物種2+物種2占1/4,物種1+物種2占1/2。例如,某雙物種文庫(kù)中,multiplet rate為5%,可以估算,該文庫(kù)中,雙胞或多胞率應(yīng)在10%左右。

質(zhì)控報(bào)告

mobivision quantify默認(rèn)在filtered-cell-gene-matrix細(xì)胞表達(dá)矩陣生成后,對(duì)整個(gè)文庫(kù)的原始數(shù)據(jù)及分析結(jié)果進(jìn)行統(tǒng)計(jì),生成質(zhì)控報(bào)告。該報(bào)告是對(duì)整個(gè)文庫(kù)的如實(shí)反饋,旨在幫助用戶(hù)從宏觀角度了解文庫(kù)原始數(shù)據(jù)質(zhì)量及分析結(jié)果質(zhì)量,并未作任何數(shù)據(jù)上的篩選或過(guò)濾。如有需要,用戶(hù)可根據(jù)質(zhì)控報(bào)告結(jié)果,對(duì)文庫(kù)結(jié)果進(jìn)行調(diào)整后,再開(kāi)始下游分析。

蚌埠市| 米林县| 沽源县| 延津县| 应城市| 谢通门县| 湖州市| 阿坝县| 墨玉县| 若羌县| 通辽市| 甘南县| 池州市| 额济纳旗| 瓦房店市| 孟津县| 兴山县| 芒康县| 叙永县| 金沙县| 广德县| 乌拉特后旗| 永安市| 乌海市| 陕西省| 长春市| 麻城市| 神池县| 越西县| 庆安县| 江口县| 青冈县| 荥经县| 准格尔旗| 青川县| 涿鹿县| 蛟河市| 淮南市| 奉化市| 延津县| 平度市|