問:擴增子測序能滿足的測序長度是多少?
答:Miseq PE300平臺測序長度為600bp,但其測序質量較差,質控需要過濾掉超過100bp質量較差的序列;Hiseq2500 PE250平臺測序質量較好,但測序總長度為500bp,去掉12bp的barcode和部分質量較差的序列之后只剩460bp左右。所以保守起見,擴增子片段長度不能超過460bp,否則雙端測序結果將無法進行拼接,在引物選擇時應引起注意。
問:DGGE技術與高通量測序技術在環境微生物群落多樣性研究中有什么區別?
答:DGGE等分子指紋圖譜技術,在其實驗結果中往往只含有數十條條帶,只能反映出樣品中的優勢種群,需要標準菌株,且受到凝膠電泳特性的局限,無法檢測到稀有菌群的種類,因此其重復性和分辨率都不甚理想。而高通量測序技術能同時對樣品中的優勢種群及微量菌進行檢測,獲得樣品中的微生物群落組成,并將其含量進行數字化。
問:擴增子測序與宏基因組測序的區別?
答:擴增子主要分為16S、18S、ITS等測序,關注環境樣本中的物種組成,該技術物美價廉,實用性高。宏基因組關注環境樣本中的物種組成、功能組成及代謝通路等信息,該技術深入挖掘環境樣本功能層面的信息。
問:若關注環境中的真核微生物多樣性,18S測序和ITS測序哪個更好?
答:ITS測序主要是針對真菌多樣性的研究,注釋準確度高;18S測序針對的是真核微生物,注釋到的范圍廣,但是就真菌來說精確度相對較低;可根據研究目的合理選擇測序方案。
問:是否需要生物學重復,多少個合適?
答:為了數據質量、結果產出及順利投稿,必須注意生物學重復問題??紤]到個體差異,后期組間統計學分析以及偏離樣本,自然環境至少3個生物學重復,推薦5個;若是人類的腸道、糞便等樣品,由于個體特異性高,建議10個以上的重復。從科學的角度來講,最好能夠整批樣品同時測序分析,既可以減少不同批次間的系統誤差,還能節省項目周期。若樣品準備有困難,也可以分批次啟動,但由此可能帶來系統誤差問題。
問:擴增子測序和宏基因組測序的對象主要是環境微生物,請問針對此類樣本推薦的DNA提取方法是什么?
答:針對環境樣本推薦老師采用常規的CTAB法或SDS法;其中人和動物組織樣本使用SDS方法,其他樣本采用CTAB法。另外,針對一些較難提取的樣本或您希望提高樣品DNA的提取效果,推薦使用Mobio公司專門的環境樣本DNA提取試劑盒。
問:OTU進化樹說明了什么問題?怎么看待其中的數字描述?
答:OTU進化樹是選取豐度排在前50且有屬分類信息的OTU的代表性序列所構建的系統發育樹。每個分支末尾的名稱由屬名和對應的OTU編號組成,若屬名相同則使用同種顏色進行標記。該圖可以看出相對豐度較高的屬主要是哪些。此外,也包含了物種之間的進化分類關系,即不同的分支結構。但由于分析中針對的序列為16S等的部分區間,其中所含的信息并不完成,因此該圖中的系統進化分支的信息可能并不完整或準確。各分支節點上的數值為bootstrap值,即置信度,該值的大小表征對應分支節點結構的準確性等,該值越大準確性越高。
問:GeoChip與常規的核酸檢測方法相比有什么優勢?
答:常規的核酸檢測方法包括基因克隆文庫、變性梯度凝膠電泳DGGE、溫度梯度凝膠電泳TGGE、末端限制性片段長度多態性(T-RFLP)、定量PCR和原位雜交等,盡管這些技術有一定價值,但它們的的缺點是信息量太小,不能充分反映復雜的環境微生物多樣性和分布?;蚩寺∥膸鞓嫿ê蜋z測的工作量大,且自然界中99%的微生物在實驗室都沒有辦法純化培養,從培養基上挑取克隆菌株,搖菌轉化測序,效率低下。DGGE法曾經廣泛應用于檢測微生物群落結構或功能的多態性,但是需要標準菌株,且受到凝膠電泳特性的局限,無法檢測到稀有菌群的種類,因此其重復性和分辨率都不甚理想。GeoChip涵蓋了多個功能類別,同時,這些相關功能基因涉及了細菌、古菌、真菌、原生生物、病毒等多種生物類群,較常規的研究方法更加簡便、經濟、快捷,能在短時間內獲得更多更準確的信息。
問:GeoChip與擴增子測序技術和PhyloChip相比有什么優勢?
答:擴增子測序以及PhyloChip都能揭示群落的系統發育信息,適用于16S rRNA基因的檢測,但是這些技術都依賴于PCR的擴增以及保守性引物。而擴增子測序也適用于部分功能基因的檢測,然而大部分的功能基因仍不能設計出足夠保守的PCR引物,也就是說除了GeoChip以外目前只有極少數的功能基因能通過測序的辦法檢測。不僅如此,這些基于傳統PCR擴增的測序技術由于擴增偏好性的客觀因素仍很難實現準確定量,且這些技術對系統的隨機誤差極其敏感。盡管通過獲得系統中絕大部分物種的序列信息能在很大程度上消除這些誤差,但是依據目前的測序技術需要付出巨大的成本。相比之下,基于芯片的雜交技術對隨機誤差并不敏感,而只需關注芯片中明確的基因,且GeoChip技術對物種的分辨率也高于基于16S rRNA基因的擴增子測序。但是,基于測序的檢測技術能有助于我們發現新的基因和功能信息,因此,綜合利用多種高通量的檢測手段能更全面地揭示微生物群落的系統發育以及功能結構,最終更好地回答我們的科學問題和假設。美格基因與很多公司和機構一樣提供擴增子測序服務。此技術需要較為少量的環境樣品DNA,通過基于保守引物的PCR擴增來或者群落的系統發育基因(如16S rRNA基因)或功能基因(amoA基因)。擴增子測序一般可以對多個樣品進行混樣后進行。
問:能否保證定位到的候選區域的大小和候選基因的個數?
答:候選區域的大小和候選基因個數的多少,與群體的大小、親本材料差異的大小、目標性狀特點、測序深度的多少、分析物種的基因組水平等多項因素相關,因此不能給出統一的標準,但可以參考已完成的項目經驗進行估計。
問:沒有參考基因組的物種能否做BSA性狀定位?
答:沒有參考基因組的物種可以進行SNP頻率差異分析,可以找到候選區段,但是無參定位效果較差,并且缺少注釋文件,獲得的結果少。無參物種一般情況不推薦做BSA性狀定位,建議嘗試遺傳圖譜等方案。
問:GeoChip和宏基因組應如何選擇?
答:GeoChip是根據微生物相關的各類功能基因獨立設計特異性的探針,能極大地降低特殊樣品中動植物宿主基因組對微生物群落功能檢測的影響,且具有平行樣品間結果高重現性高和高靈敏度的等特點,適用于探索已知基因及物種的未知規律。宏基因組技術直接針對微生物群落總的DNA進行測序,其數據量巨大。盡管宏基因組測序可以發現新的基因,然而我們能獲得序列片段和信息更多只能來源于高豐度的物種或多拷貝的基因。同時,對如此大量的數據進行深入分析是個十分巨大的挑戰。GeoChip和宏基因組都關注環境樣本中的物種組成、功能組成及代謝通路等信息,均可用于挖掘環境樣本功能層面的信息。
問:GeoChip、HuMiChip、PathoChip和StressChip有什么聯系和區別?
答:HuMiChip是針對人類相關微生物重新設計的芯片,涵蓋的探針與GeoChip沒有重復,PathoChip病原芯片和StressChip抗性芯片有部分探針來自GeoChip。
問:GeoChip檢測結果能否跟宏基因組測序結果進行比較?
答:GeoChip與宏基因組測序相比,在技術原理、定量方法、定量性能、對未知物種探查能力等多方面有顯著差別,各有優劣,其結果可互為補充,但是無法直接比較。
問:簡化基因組BSA比全基因組BSA價格便宜?
答:簡化基因組技術,捕獲的基因組信息占基因組大小約1%~10%,全基因組技術,對整個基因組測序,獲得的變異信息更全面,性價比更高,數據量單價便宜至少25倍。
問:DNA樣品如何混池?先混樣再提DNA?還是先提DNA再等量混合?
答:先提DNA再等量混合,可以減少系統誤差,近年發表的多數文獻都是先提DNA再等量混合。
問:能否保證定位到的候選區域的大小和候選基因的個數?
答:候選區域的大小和候選基因個數的多少,與群體的大小、親本材料差異的大小、目標性狀特點、測序深度的多少、分析物種的基因組水平等多項因素相關,因此不能給出統一的標準,但可以參考已完成的項目經驗進行估計。
問:沒有參考基因組的物種能否做BSA性狀定位?
答:沒有參考基因組的物種可以進行SNP頻率差異分析,可以找到候選區段,但是無參定位效果較差,并且缺少注釋文件,獲得的結果少。無參物種一般情況不推薦做BSA性狀定位,建議嘗試遺傳圖譜等方案。
問:多倍體物種可以進行BSA性狀定位嗎?
答:已經組裝的多倍體參考基因組物種,例如:“油菜、煙草、棉花”,可以用BSA進行性狀定位。
問:人工誘變只能是EMS誘變嗎?其他誘變方式得到的性狀可否采用BSA性狀定位?
答:BSA性狀定位是基于SNP,通過比較SNP頻率差異進行分析的,EMS誘發的是點突變,所以EMS誘發的突變適合這種分析方式;其他的誘變方式誘發的大部分是結構變異,在SNP水平上可能找不到導致目標性狀差異的區域,所以不適合SNP頻率分析的方法。
問:2013年,Henke等總結了全基因組BSA相比轉錄組(RNAseq)進行性狀定位的優點。
答:1. 覆蓋范圍:全基因組BSA可以覆蓋整個基因組,而RNAseq只對編碼區進行測序。
2. 基因檢測的偏好性:全基因組BSA對基因的檢測較均勻,無偏好性,不受時間或者組織的影響。RNAseq偏向于在特定時間或者組織中高表達的基因。
3. 區域偏好性:基因分布不均勻,若一些區域基因密度低,用RNAseq可能漏掉。
4. 多態性:基因組的多態性多數位于非編碼區,采用RNAseq檢測到的多態性較低,只有少數與突變位點連鎖的多態性標記能被RNAseq檢測到。因此,采用全基因組BSA更容易檢測到與目標基因連鎖的多態性標記。