最近最好看的中文字幕久久,亚洲国产一区二区在线,一区中文字幕在线观看_亚洲ãv毛片一区二区久久麻豆|国产美女视频在线精品|亚洲国产成人片在线观看|无码福利免费专区|久久久国产精品麻豆_人人爱人人操人人爽_亚洲热av,国产精品人人爽

支持中心

常見問題

MobiVision軟件無法直接判斷文庫中的雙胞或多胞情況。 雙物種樣本的html質(zhì)控報(bào)告也只能判斷,一個(gè)液滴中是否同時(shí)含有兩個(gè)物種來源的細(xì)胞。如果需要具體判斷雙胞或多胞的話,建議可根據(jù)UMI和基因數(shù)進(jìn)行篩選,UMI或基因數(shù)過多的判斷為多胞。若在細(xì)胞注釋步驟出現(xiàn)類似雙胞情況,建議可借助其他軟件進(jìn)行判斷。

1. fastq數(shù)據(jù)不可直接合并,墨卓數(shù)據(jù)與10x數(shù)據(jù)的reads結(jié)構(gòu)并不一致,barcode白名單也不相同;

2. 細(xì)胞-基因表達(dá)矩陣(filtered-cell-gene-matrix)可進(jìn)行合并,推薦使用Seurat、liger、Harmony、Scanorama等軟件進(jìn)行去批次處理。

可以被分為兩種情況:

1. 使用--intron excluede參數(shù)時(shí),一條read只有比對到一個(gè)基因的外顯子區(qū)域(read有超過50%的長度比對到了外顯子區(qū)域),才會進(jìn)入計(jì)數(shù),如果比對到內(nèi)含子區(qū)域或基因間區(qū),則不進(jìn)入計(jì)數(shù);

2. 使用--intron included參數(shù)(此為默認(rèn)參數(shù))時(shí),一條read只有比對到一個(gè)基因的外顯子或內(nèi)含子區(qū)域(read有超過50%的長度比對到內(nèi)含子和/或外顯子區(qū)域),才會進(jìn)入計(jì)數(shù),如果比對到基因間區(qū),則不進(jìn)入計(jì)數(shù)。
會進(jìn)行合并分析,分析結(jié)果名稱是testA。合并后的文件名是將所有fastq文件進(jìn)行排序后,取前兩個(gè)fastq文件的文件名作為合并后的文件名稱。
不能。
Read1長度不小于40bp, read2長度推薦150bp。
會寫一些中間文件。如果是其他用戶使用該軟件,為了避免權(quán)限問題,建議修改chmod -R 777 /path/mobivision-v3.2/mobivision/

針對不同的服務(wù)器配置及參數(shù)設(shè)置,100G數(shù)據(jù)運(yùn)行時(shí)長并不完全相同。以Hygon C86 7285H 32-core Processor (2.5GHz)處理器為例:

1. 針對10G測序量的樣本,增加線程數(shù)并不能顯著降低分析時(shí)間,但會大大增加內(nèi)存的使用量,因此10GB左右的文庫推薦2-8線程;

2. 針對100G測序量的樣本,當(dāng)線程在24以下時(shí),并不會顯著增加內(nèi)存的使用量,但可以顯著減少分析時(shí)間;當(dāng)線程設(shè)置在24以上時(shí),內(nèi)存使用量開始明顯增加,因此100GB左右的文庫推薦16-24線程;

3. 運(yùn)行的時(shí)間和內(nèi)存消耗與文庫本身大小及設(shè)置的線程數(shù)有關(guān),當(dāng)文庫大小達(dá)300GB時(shí),我們建議分析時(shí)的內(nèi)存不少于64GB。


image.png

1. 過去試劑版本的墨卓單細(xì)胞3'轉(zhuǎn)錄組試劑盒制備的文庫,都可以使用MobiVision-v3.2進(jìn)行分析。

2. MobiVision-v3.2與過去版本的MobiVision的分析結(jié)果并不完全一致。MobiVision v3.2版本在v3.0版本的基礎(chǔ)上,優(yōu)化了接頭過濾策略,從而提升比對率,分析結(jié)果會更好。 

1. 新增命令integrate,擴(kuò)展了命令集。

2. 加入了新的cutadapt序列剪切步驟,并改進(jìn)了過濾方法以確保更干凈的polyA切除。

3. 結(jié)果文件中的bam文件內(nèi)容調(diào)整,增加unmapped reads信息和新的tag,改進(jìn)了mapping info及seq saturation計(jì)算。

4. 更新了h5ad文件,改為包含完整矩陣信息。

5. 增加了cell_metrics文件及total genes detected信息,并寫出于summary.csv文件中。

6. 改進(jìn)了HTML報(bào)告的物種信息讀取及mapping information參數(shù)調(diào)整,使其更接近c(diǎn)ellranger的設(shè)置。

7. 比對率更高,分析結(jié)果更好。

測序飽和度反映了全部測序片段整體的復(fù)雜性和測序深度,可通過計(jì)算含有有效條形碼和UMI、且能對比至基因組唯一區(qū)域的測序片段的冗余度來獲得。Sequencing Saturation = 1 - non-duplicated_unique_mapped_reads / total_unique_mapped_reads。對于通過mobivision quantify獲得的bam文件而言, MAPQ=255代表能比對至基因組唯一比區(qū)域的測序片段。所以,total_unique_mapped_reads可通過計(jì)算MAPQ=255的測序片段中,UMI和Barcode通過糾正的測序片段數(shù)獲得; non-duplicated_unique_mapped_reads可通過計(jì)算MAPQ=255的測序片段中,UMI和Barcode不重復(fù)的測序片段數(shù)獲得; 代碼如下:

samtools view -q 255 Aligned.bam | gawk '{if (NF==16) {total_reads+=1; !umi[$19,$20]++}} END {printf("%%s,%%s\\n", total_reads, length(umi))}'

mobivision mkindex命令可用于構(gòu)建reference參考基因組,且指定不同的-m參數(shù),使用不同來源的參考基因組,均會導(dǎo)致構(gòu)建的reference參考基因組大小并不一致,-m指定值越大,構(gòu)建的參考基因組也越大,且分析速度也會更快。-m默認(rèn)值為16,若使用默認(rèn)參數(shù)構(gòu)建人的reference,其參考基因組文件夾大小約為19G,構(gòu)建reference代碼如下:

mobivision mkindex -n GRCh38\
-f GRCh38.primary_assembly.genome.fa\
-g gencode.v38.primary_assembly.annotation.gtf\
-r human-gencode-v1.0

mobivision quantify目前提供兩種細(xì)胞過濾的算法,分別是CR2.2和EmptyDrops (Lun等人于2019年發(fā)表在Genome biology中的算法)。如果用戶需要指定細(xì)胞數(shù)目,也可通過--cellnumber INT 來選擇含有UMI數(shù)目排列前INT個(gè)的細(xì)胞標(biāo)簽作為有效細(xì)胞。

 

image.png

 

CR2.2算法(見上圖左Panel):首先將barcode按UMI數(shù)從大到小排序,設(shè)N為期望細(xì)胞數(shù),該值默認(rèn)為3000, m 為期望細(xì)胞數(shù)的99分位barcode所對應(yīng)的 UMI 數(shù)。所有 UMI 值超過 m/10 的barcode都被稱識別為細(xì)胞。(例如,當(dāng)N=3000時(shí),99分位的barcode為第30個(gè)barcode,其UMI值記為m,當(dāng)m=20000時(shí),m/10=2000,那么所有UMI值超過2000的barcode會被識別為細(xì)胞,圖示細(xì)胞數(shù)為9000)。

EmptyDrops算法(見上圖右Panel): 參考Lun等人于2019年發(fā)表在Genome biology中的算法(EmptyDrops: distinguishing cells from empty droplets in droplet-based single-cell RNA sequencing data)。該算法是在 CR 2.2 的基礎(chǔ)上進(jìn)一步識別低RNA含量的細(xì)胞,步驟如下:
1. 初步細(xì)胞鑒定:與 CR 2.2 一致,使用基于每個(gè)barcode的總UMI數(shù)量的閾值來確定高RNA含量的細(xì)胞。
- 根據(jù)墨卓單細(xì)胞3'/5RNA的細(xì)胞捕獲率,預(yù)估細(xì)胞數(shù)量N
- 根據(jù)每個(gè)barcode的UMI數(shù)量降序排列,計(jì)算前N個(gè)barcode的UI數(shù)量的99分位數(shù),記為m。
- 如果barcode的UMI總數(shù)超過m的10%,則該barcode被視為含有細(xì)胞。

2. 細(xì)胞鑒定的細(xì)化:
- 選擇具有低UMI計(jì)數(shù)的barcode,即第一步未被鑒定為細(xì)胞的barcodes。
- 針對這些barcodes的RNA圖譜,基于采用基于基因的多項(xiàng)式分布,創(chuàng)建背景模型,并通過Simple Good-Turing平滑技術(shù)為未觀察到的基因提供非零的模型估計(jì)。
- 將每個(gè)未在第一步鑒定中被識別為細(xì)胞的barcode的RNA圖譜與背景模型進(jìn)行比較,那些與背景模型明顯不符的barcode被識別為細(xì)胞。

V(D)J分析的主要目的是從原始測序數(shù)據(jù)中提取B細(xì)胞或T細(xì)胞的V(D)J基因序列與克隆型。這個(gè)過程通常可以適應(yīng)不同的測序平臺和數(shù)據(jù)格式。因此,V(D)J分析流程支持多個(gè)測序平臺的FASTQ文件。

例如,在數(shù)據(jù)分析層面,V(D)J分析軟件IgBlast可以處理來自多個(gè)測序平臺的FASTQ文件,包括Illumina、華大和Ion Torrent。當(dāng)然,MobiVision分析軟件也可以處理來自不同測序平臺的FASTQ文件。然而,由于每種測序平臺的讀長和質(zhì)量特征都不同,因此在進(jìn)行V(D)J分析時(shí)可能需要考慮這些因素的影響。

V(D)J分析流程通??梢灾С謫味说膔eads,包括只有一端reads包含有V(D)J基因信息的情況。不過,這取決于所使用的V(D)J分析軟件和具體的實(shí)驗(yàn)設(shè)計(jì)。

對于單端的reads,V(D)J分析軟件通常會對reads進(jìn)行一些額外的預(yù)處理和過濾,以提高V(D)J重排和克隆型識別的準(zhǔn)確性。MobiVision可以處理單端或雙端的FASTQ文件,指定V(D)J基因在reads的哪個(gè)位置上,并且可以識別測序的reads來自哪些Barcodes,并確定V(D)J基因的重鏈與輕鏈,從而進(jìn)行有效的V(D)J分析。

需要注意的是,對于只包含V(D)J基因信息的單端reads,由于缺少一些其他的序列信息如UMI,可能會影響單細(xì)胞V(D)J分析的準(zhǔn)確性和可靠性。因此,在進(jìn)行實(shí)驗(yàn)設(shè)計(jì)時(shí),應(yīng)該盡量選擇適當(dāng)?shù)臏y序方案,以保證能夠獲取充分的序列信息來支持VDJ分析。

對于特別不常見的物種,構(gòu)建一個(gè)參考基因組序列文件可能是一個(gè)具有挑戰(zhàn)性的任務(wù),因?yàn)槿狈捎玫膮⒖蓟蚪M或基因組注釋數(shù)據(jù)。以下是一些可能有用的方法:

  1. 基于已知的近緣物種: 可以基于已知的近緣物種的基因組序列,利用基因組序列比對和組裝技術(shù)來構(gòu)建目標(biāo)物種的參考基因組序列。這種方法需要有足夠相似的基因組序列和足夠的比對深度。
  2. RNA-Seq數(shù)據(jù)拼接: 如果目標(biāo)物種的RNA-Seq數(shù)據(jù)可用,可以利用RNA-Seq reads拼接出轉(zhuǎn)錄組序列,再利用轉(zhuǎn)錄組序列和相關(guān)的比對工具如BLAST和STAR等進(jìn)行基因組組裝和注釋。這種方法適用于不需要完整的基因組序列的情況下。
  3. 亞基因組注釋: 如果沒有可用的基因組數(shù)據(jù),可以考慮使用亞基因組注釋的方法。即先利用相關(guān)的比對工具如BLAST和HMMER等將已知物種的基因組注釋信息映射到目標(biāo)物種的基因組上,并據(jù)此推斷目標(biāo)物種的基因組組成和結(jié)構(gòu)。
  4. 三代測序輔助裝配: 可以考慮使用更快速和更精確的三代測序輔助裝配技術(shù),如Oxford Nanopore和PacBio SMRT等單分子測序技術(shù)。這些技術(shù)可以產(chǎn)生長讀長的測序數(shù)據(jù),有助于更好的基因組組裝和注釋。
但是,對于已經(jīng)收集到基因組fa文件與基因組注釋文件gtf或gff的物種,可以直接使用mk_vdj_ref進(jìn)行構(gòu)建,具體構(gòu)建方法請見(提供相應(yīng)頁面的軟鏈)。

在進(jìn)行原始FASTQ文件的分析之前,通常需要對文件進(jìn)行命名。雖然不同的實(shí)驗(yàn)室和分析流程可能有不同的命名規(guī)則,但通常應(yīng)該滿足以下一些基本要求:

  1. 文件名應(yīng)該能夠清晰地反映樣本來源,包括樣本編號、組織來源、處理方式等信息。這些信息可以用下劃線或短橫線等字符分隔,例如:
    Sample1_Blood_RNAseq_R1.fastq(.gz)與Sample1_Blood_RNAseq_R2.fastq(.gz)。
  2. 文件名應(yīng)該包含一些關(guān)鍵的實(shí)驗(yàn)信息,例如測序類型與測序平臺等信息。這些信息可以用下劃線或短橫線等字符分隔,例如:Sample1_Blood_RNAseq_Illumina_PE.fastq(.gz)。
  3. 文件名應(yīng)該能夠唯一標(biāo)識每個(gè)FASTQ文件,避免重復(fù)命名或覆蓋已有數(shù)據(jù)。可以使用獨(dú)特的文件名或帶有時(shí)間戳的命名方式,例如:Sample1_Blood_RNAseq_Illumina_PE_20220331.fastq(.gz)。
需要注意的是,命名規(guī)則應(yīng)該保持一致,并且盡可能遵守一些通用的命名約定,以便于數(shù)據(jù)管理和共享。此外,一些分析軟件和工具可能需要特定的文件名格式,因此在進(jìn)行分析前應(yīng)該查看相應(yīng)軟件的文檔,以確定文件名的具體要求。墨卓的單細(xì)胞V(D)J輸入文件命名方式詳見第8個(gè)問題。

單細(xì)胞VDJ測序數(shù)據(jù)量的合適大小取決于多種因素,包括樣本復(fù)雜度、測序深度、實(shí)驗(yàn)設(shè)計(jì)等。

一般來說,單細(xì)胞V(D)J測序的目的是獲得盡可能完整的克隆型信息,因此需要足夠的測序深度來支持高質(zhì)量的重排和克隆型識別。根據(jù)經(jīng)驗(yàn),每個(gè)單細(xì)胞至少需要測序到4000條reads,以保證高質(zhì)量的VDJ分析結(jié)果。

需要注意的是,對于不同的實(shí)驗(yàn)設(shè)計(jì)和研究問題,需要根據(jù)實(shí)際情況來選擇合適的測序數(shù)據(jù)量。對于一些研究問題,可能需要更深的測序深度,而對于一些其他問題,可能只需要較少的測序數(shù)據(jù)量。因此,在進(jìn)行實(shí)驗(yàn)設(shè)計(jì)和數(shù)據(jù)分析時(shí),應(yīng)該綜合考慮多種因素,并根據(jù)實(shí)際需要來選擇合適的測序數(shù)據(jù)量。

Fraction Reads in Cells是單細(xì)胞測序數(shù)據(jù)分析中的一個(gè)關(guān)鍵指標(biāo),用于評估測序數(shù)據(jù)的質(zhì)量和單細(xì)胞捕獲的效率。它表示在所有測序數(shù)據(jù)中,能夠被分配到單個(gè)細(xì)胞的reads所占的比例。通常來說,F(xiàn)raction Reads in Cells越高,代表單細(xì)胞測序的效果越好,樣本中的單個(gè)細(xì)胞被捕獲的概率越高。

當(dāng)Fraction Reads in Cells比例比較低時(shí),可能意味著以下一些情況:

  1. 單細(xì)胞捕獲效率較低:可能是由于實(shí)驗(yàn)操作或測序技術(shù)等因素導(dǎo)致單細(xì)胞捕獲效率較低,需要進(jìn)一步優(yōu)化實(shí)驗(yàn)條件和測序參數(shù)。
  2. 樣本質(zhì)量不佳:可能是由于樣本的RNA降解與細(xì)胞質(zhì)破裂等因素導(dǎo)致的單細(xì)胞的RNA質(zhì)量不佳,進(jìn)而影響單細(xì)胞測序的效果。
  3. 數(shù)據(jù)質(zhì)量不佳:可能是由于低質(zhì)量的reads、低覆蓋度等因素導(dǎo)致無法將reads分配到單個(gè)細(xì)胞中,這需要進(jìn)行更嚴(yán)格的數(shù)據(jù)質(zhì)量控制和過濾。

值得注意的是,F(xiàn)raction Reads in Cells的理想值是依賴于實(shí)驗(yàn)設(shè)計(jì)和測序技術(shù)等因素,并不存在一個(gè)固定的閾值。在進(jìn)行單細(xì)胞測序數(shù)據(jù)分析時(shí),需要結(jié)合其他指標(biāo)和分析結(jié)果來綜合評估數(shù)據(jù)質(zhì)量和單細(xì)胞捕獲效率。

Paired Clonotype Diversity是單細(xì)胞VDJ測序數(shù)據(jù)中用來評估克隆型多樣性的一個(gè)指標(biāo)。它基于同一細(xì)胞中的配對的重鏈和輕鏈VDJ重排信息,計(jì)算出同一細(xì)胞中的克隆型數(shù)量,并對不同細(xì)胞的克隆型進(jìn)行聚類,得到每個(gè)聚類中包含的不同克隆型數(shù)量。Paired Clonotype Diversity指標(biāo)即為不同聚類中克隆型數(shù)量的平均值,通常用來描述單個(gè)細(xì)胞內(nèi)的克隆型多樣性。

Paired Clonotype Diversity計(jì)算的具體過程如下:

  1. 對每個(gè)細(xì)胞中的重鏈和輕鏈VDJ序列進(jìn)行拼接,得到一個(gè)全長的VDJ序列。。
  2. 利用VDJ分析軟件對全長VDJ序列進(jìn)行克隆型分析,得到同一細(xì)胞中的克隆型信息。
  3. 對同一細(xì)胞中的克隆型進(jìn)行聚類分析,得到不同聚類中包含的克隆型數(shù)量。。
  4. 計(jì)算所有克隆型的細(xì)胞數(shù)的逆辛普森指數(shù),得到PairedClonotype Diversity指標(biāo)。
Paired Clonotype Diversity的值越高,代表單細(xì)胞內(nèi)克隆型的多樣性越高,單個(gè)細(xì)胞中包含的不同克隆型數(shù)量越多。該指標(biāo)可以用來比較不同細(xì)胞類型、不同實(shí)驗(yàn)條件和不同處理方式對單細(xì)胞內(nèi)克隆型多樣性的影響。需要注意的是,Paired Clonotype Diversity能反映樣品內(nèi)的克隆型多樣性。在墨卓的websummary.html質(zhì)控結(jié)果的VDJ注釋部分,含有Paired Clonotype Diversity的結(jié)果值,可以為克隆型多樣性提供參考。

image.png

MobiVisoion vdj的命名無需固定一種方式命名。從上述的命名規(guī)則中,我們可以看到其ReadType有四種命名形式,Suffix也有4種命名形式,目前MobiVision可以支持16種命名形式。用戶在二代測序結(jié)束下機(jī)后獲取的的fastq文件,只要命名合理,一定程度可以直接進(jìn)行MobiVision vdj分析,無需對樣本名改名。

MobiVision TCR/BCR建議每次TCR/BCR測序測30Mreads;9G數(shù)據(jù)。在16核,64GB的運(yùn)行情況下,大約一個(gè)小時(shí)就能完成,若改變線程數(shù)與調(diào)整內(nèi)存數(shù),運(yùn)行時(shí)間可能發(fā)生變化。MobiVision v1.6.1運(yùn)行設(shè)置的默認(rèn)線程數(shù)是8,若沒有特殊的要求,可以按照此線程數(shù)運(yùn)行。
針對30M reads左右的樣本,當(dāng)線程數(shù)在8以下時(shí),增加線程數(shù)可以顯著的減少分析時(shí)間,并且不會顯著增加分析內(nèi)容 ; 針對30M reads左右的樣本,當(dāng)線程數(shù)在8以上時(shí),增加線程數(shù)不會顯著減少分析時(shí)間,但會大大增加內(nèi)存的使用量 。因此針對30M reads左右的文庫,推薦8個(gè)線程。如果資源較豐富,可以使用16線程。 內(nèi)存的使用量和運(yùn)行的時(shí)間與文庫本身大小及設(shè)置的線程數(shù)有關(guān),當(dāng)文庫大小達(dá)30M reads時(shí),我們建議分析時(shí)的內(nèi)存為16GB即可
MobiVision vdj運(yùn)行默認(rèn)情況下,為auto參數(shù),可以自動識別TCR與BCR。但是,當(dāng)數(shù)據(jù)質(zhì)量不是很好,流程無法識別TCR與BCR模式時(shí),可能需要手動指定TCR或者BCR類型。
單細(xì)胞5’轉(zhuǎn)錄組與V(D)J聯(lián)合分析時(shí),細(xì)胞數(shù)目相差較大,一般會出現(xiàn)在兩種情況下。一種是V(D)J細(xì)胞數(shù)量遠(yuǎn)小于GEX細(xì)胞數(shù)量,常見于TCR,由于TCR基因的常低表達(dá),有時(shí)候不能拼接全長,丟失了一些真實(shí)的基因,造成假陰性的結(jié)果;另一種是VDJ細(xì)胞數(shù)量遠(yuǎn)高于GEX細(xì)胞數(shù)量,常見于BCR,由于BCR基因的常高表達(dá),特別是含有漿細(xì)胞時(shí),會有較多的背景mRNA,導(dǎo)致空液滴也會被計(jì)算在內(nèi),造成假陽性的結(jié)果。因此,將VDJ結(jié)果與5'轉(zhuǎn)錄組數(shù)據(jù)的聯(lián)合分析會提高分析結(jié)果的準(zhǔn)確性。
當(dāng)然不可以,單細(xì)胞轉(zhuǎn)錄組和單細(xì)胞V(D)J的參考基因組在很大程度上是不同的,雖然它們都針對同一個(gè)物種。然而,在分析和處理數(shù)據(jù)時(shí),它們的關(guān)注點(diǎn)和應(yīng)用場景有所不同,單細(xì)胞免疫組庫主要關(guān)注免疫受體的V(D)J重組和克隆型,以了解免疫細(xì)胞的多樣性、克隆擴(kuò)張和免疫應(yīng)答。因此,在構(gòu)建針對單細(xì)胞免疫組庫的參考基因組時(shí),需要特別關(guān)注免疫受體相關(guān)基因,如V、D、J基因的注釋和數(shù)據(jù)庫。單細(xì)胞轉(zhuǎn)錄組研究則關(guān)注整個(gè)基因組范圍內(nèi)的基因表達(dá),以揭示不同細(xì)胞類型和狀態(tài)的轉(zhuǎn)錄特征。因此,在構(gòu)建單細(xì)胞轉(zhuǎn)錄組的參考基因組時(shí),需要考慮全基因組范圍內(nèi)的基因注釋和數(shù)據(jù)庫。
依兰县| 罗甸县| 广平县| 宜兰市| 郯城县| 资源县| 铜山县| 元氏县| 台江县| 安溪县| 偏关县| 留坝县| 长寿区| 南投市| 布尔津县| 嵊州市| 金沙县| 文昌市| 驻马店市| 古丈县| 海南省| 腾冲县| 奎屯市| 页游| 阿坝| 浪卡子县| 班戈县| 甘谷县| 资源县| 新野县| 石狮市| 金坛市| 高台县| 织金县| 木兰县| 乌苏市| 开平市| 抚宁县| 鹤壁市| 呼和浩特市| 平和县|