成品视频91久久,亚洲黄色一本久道中文字幕,青草伊人久久综合,女同精品区视频,精品久日韩一区高清.,色天使久久,欧美日本美女在线一区二区,久久久久色网在线,日韩精品亚视频国产无破

MobiVision轉(zhuǎn)錄組算法介紹

算法概覽

mobivision quantify可以用于分析MobiNova平臺(tái)下機(jī)的單細(xì)胞轉(zhuǎn)錄組數(shù)據(jù),關(guān)鍵分析步驟如下圖所示:

細(xì)胞標(biāo)簽糾正

MobiNova平臺(tái)下機(jī)的單細(xì)胞轉(zhuǎn)錄組分為3'轉(zhuǎn)錄組和5’轉(zhuǎn)錄組兩種,均可使用mobivision quantify進(jìn)行分析。

單細(xì)胞3'轉(zhuǎn)錄組Read結(jié)構(gòu)如下圖所示:

單細(xì)胞5'轉(zhuǎn)錄組Read結(jié)構(gòu)如下圖所示:

從Read結(jié)構(gòu)可知,無(wú)論是5'轉(zhuǎn)錄組還是3'轉(zhuǎn)錄組,其Read1的5’端均為細(xì)胞標(biāo)簽序列(20bp)和UMI序列(10bp)。為了確定Read1所攜帶的細(xì)胞標(biāo)簽序列是否正確,MobiVision會(huì)將測(cè)序片段中的細(xì)胞標(biāo)簽序列和已知白名單中的細(xì)胞標(biāo)簽序列進(jìn)行比對(duì)。目前MobiCube 高通量單細(xì)胞3'轉(zhuǎn)錄組v2.0試劑盒提供近3,000,000種細(xì)胞標(biāo)簽序列。符合以下條件的測(cè)序片段將被保留:

  • Read1的細(xì)胞標(biāo)簽存在于白名單中;
  • Read1的細(xì)胞標(biāo)簽不存在于白名單中,但與白名單中的細(xì)胞標(biāo)簽最小漢明距離<=2,并根據(jù)白名單中的細(xì)胞標(biāo)簽,對(duì)Read1中的細(xì)胞標(biāo)簽進(jìn)行糾正。

通過(guò)的測(cè)序片段,Read1僅保留糾正后的細(xì)胞標(biāo)簽序列和UMI序列,Read2在該步驟暫不做處理。

插入片段修剪

對(duì)于糾正細(xì)胞標(biāo)簽序列后的fastq數(shù)據(jù),理論上,Read1不再含有接頭序列,因此無(wú)需特殊處理。

  • 單細(xì)胞3'轉(zhuǎn)錄組的fastq數(shù)據(jù),Read2片段5'端可能存在30bp的TSO序列(“AAGCAGTGGTATCAACGCAGAGTACATGGG”),3’端可能存在poly A序列。而TSO序列和poly A序列的存在,會(huì)有效降低文庫(kù)的比對(duì)率,因此在比對(duì)前,需要將插入片段兩端可能存在的TSO序列和poly A序列去除。單細(xì)胞5'轉(zhuǎn)錄組的fastq序列,Read2片段的5’端可能存在poly T序列,3'端可能存在13bp的TSO反向互補(bǔ)序列(“CCCATATAAGAAA”),同樣需要在比對(duì)前去除。
  • 去除接頭序列及poly A和poly T可能導(dǎo)致保留下來(lái)的插入DNA片段過(guò)短,而過(guò)短的DNA片段會(huì)增加錯(cuò)配的概率,因此,在完成接頭序列去除后,還需要過(guò)濾除去插入DNA片段小于30bp的Read。

測(cè)序片段比對(duì)

mobivision quantify的采用STARsolo進(jìn)行比對(duì),比對(duì)注釋結(jié)果如下圖所示:

  • 當(dāng)測(cè)序片段有超過(guò)50%的長(zhǎng)度比對(duì)至外顯子區(qū)域時(shí),則認(rèn)為該片段為Exonic Read;
  • 當(dāng)測(cè)序片段有大于等于50%的長(zhǎng)度比對(duì)內(nèi)含子區(qū)域時(shí),則認(rèn)為該片段為Intronic Read;
  • 當(dāng)測(cè)序片段可比對(duì)至基因組,但既不屬于Exonic Read,又不屬于Intronic Read時(shí),則認(rèn)為該片段為Intergenic Read;
  • MobiVision v2.0及以后版本在統(tǒng)計(jì)antisense reads時(shí),默認(rèn)的操作模式是包含內(nèi)含子(--intron included)。在這種模式下,只要一個(gè)測(cè)序片段有大于或等于50%的長(zhǎng)度比對(duì)至內(nèi)含子和/或外顯子區(qū)域的反義鏈方向,該片段就被定義為反義鏈read。而如果選擇了--intron excluded模式,那么該測(cè)序片段必須要有100%的長(zhǎng)度比對(duì)至外顯子區(qū)域的反義鏈方向,才能被定義為反義鏈read。
  • MobiVision v2.0及以后版本在統(tǒng)計(jì)transcriptomic reads時(shí),默認(rèn)的操作模式是包含內(nèi)含子(--intron included)。在這種模式下,只要一個(gè)測(cè)序片段有大于等于50%的長(zhǎng)度比對(duì)至內(nèi)含子和/或外顯子區(qū)域,該片段就被定義為transcriptomic read。而如果選擇了--intron excluded模式,那么該測(cè)序片段必須要有100%的長(zhǎng)度比對(duì)至外顯子區(qū)域,才能被定義為transcriptomic read。

mobivision quantify記錄了所有比對(duì)到基因組上的測(cè)序片段,其中,當(dāng)測(cè)序片段比對(duì)質(zhì)量MAPQ=255時(shí),表示該測(cè)序片段比對(duì)至基因組唯一區(qū)域。而只有唯一比對(duì)至轉(zhuǎn)錄組區(qū)域的測(cè)序片段,才會(huì)進(jìn)入下游的UMI計(jì)數(shù)。

UMI計(jì)數(shù)

在進(jìn)入U(xiǎn)MI計(jì)數(shù)前,需要剔除Reads比對(duì)結(jié)果中,不符合條件的UMI。

  • 由相同堿基構(gòu)成的UMI需去除;
  • 含有N的UMI需去除;
  • 1個(gè)或多個(gè)相同的UMI比對(duì)到同一基因上時(shí),UMI Count記為1;多個(gè)相同的UMI比對(duì)到不同的基因上時(shí),保留比對(duì)至同一基因上UMI最多的比對(duì)情況,去除比對(duì)至其他基因的UMI,UMI Count記為1;
  • 兩個(gè)UMI之間僅相差1個(gè)堿基,且比對(duì)到相同基因,則認(rèn)為這兩個(gè)UMI相同,保留其中一個(gè)UMI,UMI Count記為1。

經(jīng)過(guò)上述過(guò)濾條件,保留下來(lái)的UMI信息和細(xì)胞標(biāo)簽序列可構(gòu)建生成raw-cell-gene-matrix矩陣。

細(xì)胞過(guò)濾

mobivision quantify目前提供兩種細(xì)胞過(guò)濾的算法,分別是CR2.2EmptyDrops (Lun等人于2019年發(fā)表在Genome biology中的算法)。如果用戶需要指定細(xì)胞數(shù)目,也可通過(guò)--cellnumber INT 來(lái)選擇含有UMI數(shù)目排列前INT個(gè)的細(xì)胞標(biāo)簽作為有效細(xì)胞。

對(duì)于來(lái)源于兩個(gè)物種的混合樣本,例如人和小鼠,mobivision quantify將細(xì)胞分成了三種情況:來(lái)源于人的細(xì)胞、來(lái)源于小鼠的細(xì)胞及人鼠混合的細(xì)胞(multiplet)。mobivision quantify認(rèn)為,單個(gè)細(xì)胞標(biāo)簽中,只有不少于90%的UMI分子來(lái)源同一物種,該細(xì)胞標(biāo)簽才會(huì)被認(rèn)為來(lái)是源于這個(gè)物種的細(xì)胞。例如,當(dāng)某個(gè)細(xì)胞標(biāo)簽中,80%的UMI來(lái)源于物種1,另外20%的UMI來(lái)源于物種2,那么mobivision quantify會(huì)判定該細(xì)胞為multiplet。雖然mobivision quantify無(wú)法直接判斷文庫(kù)中的雙胞或多胞率,但是通過(guò)multiplet的計(jì)算,我們可以間接評(píng)估文庫(kù)中雙胞或多胞的情況。若文庫(kù)中存在雙胞或多胞的情況,那么理論上,物種1+物種1的情況應(yīng)占1/4,物種2+物種2占1/4,物種1+物種2占1/2。例如,某雙物種文庫(kù)中,multiplet rate為5%,可以估算,該文庫(kù)中,雙胞或多胞率應(yīng)在10%左右。

質(zhì)控報(bào)告

mobivision quantify默認(rèn)在filtered-cell-gene-matrix細(xì)胞表達(dá)矩陣生成后,對(duì)整個(gè)文庫(kù)的原始數(shù)據(jù)及分析結(jié)果進(jìn)行統(tǒng)計(jì),生成質(zhì)控報(bào)告。該報(bào)告是對(duì)整個(gè)文庫(kù)的如實(shí)反饋,旨在幫助用戶從宏觀角度了解文庫(kù)原始數(shù)據(jù)質(zhì)量及分析結(jié)果質(zhì)量,并未作任何數(shù)據(jù)上的篩選或過(guò)濾。如有需要,用戶可根據(jù)質(zhì)控報(bào)告結(jié)果,對(duì)文庫(kù)結(jié)果進(jìn)行調(diào)整后,再開始下游分析。

宁乡县| 巩留县| 曲阳县| 许昌市| 仙桃市| 青岛市| 平凉市| 三都| 壤塘县| 比如县| 内丘县| 金湖县| 丁青县| 米林县| 玉环县| 九江县| 保康县| 广州市| 宿迁市| 翁牛特旗| 新巴尔虎左旗| 双江| 珲春市| 绥化市| 平果县| 江陵县| 辽宁省| 海林市| 闽侯县| 孟连| 潮安县| 公安县| 中方县| 河北省| 嘉禾县| 和田县| 贵德县| 宜城市| 得荣县| 上虞市| 武平县|