小葉苔屬 (提燈苔科,苔類植物門) 的 生物地理學以及綜合分類法---材料與方法
前情提要
這篇研究就是要透過小葉苔屬 (Epipterygium) 的形態與分子資料分析,以推斷其各種間親緣關係,重建小葉苔屬的生物地理歷史以及驗證其間斷分布 (disjunction) 的假說,並解決當中的紫色小葉苔複合群 (E. tozeri complex) 的問題。
-------------------------------------------------------------------------------------------------
材料與方法簡述
通常系統分類研究的材料與方法,會稍微複雜一些,所以就先簡單講一下,首先這裡會提到材料的來源以及份數,後分別進行形態測量和DNA之萃取 (Extraction) 與定序 (Sequencing),定序完成後的序列,再經過校準後,即可進行親緣關係 分析,後續進行分子定年 (molecular dating) 以及祖區重建 (ancestral area reconstructions),以重建小葉苔屬的生物地理歷史以及驗證其間斷分布 (disjunction) 的假說;最後進行物種劃分 (delimitation) 以及驗證 (validation) ,以解決紫色小葉苔複合群的問題。
進入狀況後,再來詳細介紹材料方法步驟吧
材料與方法—材料
- 研究材料為小葉苔屬物種
- 材料來源於野外以及植物標本館
- 野外的新鮮標本有13份紫色小葉苔標本採於11 月和12 月在馬卡羅尼西亞 (Macaronesia) 地區的加那利群島 (Canary Island)。
- 173份7種小葉苔屬植物標本來自於,植物標本館 BSM、DR、E、LG、LISU、M、MO ,NY、S、TUM (植物標本館代號詳見:https://zh.wikipedia.org/wiki/植物標本館列表) 和 A. Schäfer-Verwimp 的私人館藏(德國,黑爾德萬根-舍納)。
- 共186 份小葉苔屬標本,包括 142 個紫色小葉苔標本,這些標本來自全球除了台灣以外。從 GenBank下載的2個姐妹屬 Pohlia序列以作為外群。
材料與方法—形態分析
在講形態分析之前,要先說明一下,在這邊有什麼樣的特徵要被測量,首先是特徵方面有莖長 (Stem length)、背側葉 (尺寸較小並生於背側之葉) 之長與寬 (Dorsal leaf length & width)、側邊葉 (Lateral leaf length & width) 之長與寬、中勒長 (Costa length)、中間細胞之長與寬 (Median cell length & width)、邊緣細胞之長與寬 (Marginal cell length & width) 等10個連續性特徵 (Continuous characters) ;同時有長與寬的構造,如背側葉、側邊葉、中間細胞與邊緣細胞等,就會有長寬比的特徵,因此本次總共選取14個形態特徵 (10個連續性特徵與4個比例特徵)。
蒐集完的特徵就會做成矩陣,如下
為了探索紫色小葉苔由形態學證明的各類群內親緣關係的變異,首先先從每一個演化支 (Clade) (以地理區域為單位) 任意選取一份或兩份標本,再從每一份標本隨機選取5個配子體收集進行形態測量,全部共有 55 個配子體。
講人話就是,一樣叫紫色小葉苔的東西在不同地理地區,有沒有形態上的差異
在分析方面,全部的統計分析都在 R v.3.6.1 中進行,先進行主成分分析 (PCA) 以探索對於我們資料集 (data set) 中未知的初級結構。用 R 套件usdm v.1.1-18 最小化方差擴大 (variance inflation),排除了所有與另一個特徵強烈相關的特徵 (Naimi & al., 2014)。檢測在變量中的共線性 (collinearity),並計算方差擴大因子 (VIF) 且排除 VIF > 10 的所有變量。排除變量有中間細胞長度、側邊葉長度和邊緣細胞寬度。用修飾過的資料集,再使用區別函數分析(Discriminant function analysis,DFA)對預設地理區域的統計支持度進行測試,以允許研究繼續使用地理區域進行描述性統計作為分組變量。單變量方差分析 (ANOVA) 和使用 Tukey-Test 進行事後分析在變量上比較方差的同質性並推斷地理區域間的變異水準。
材料與方法—DNA萃取與定序
上面就是DNA萃取與定序過程,那這邊就不再贅述 (其實是現在有點懶,以後再補上)。
材料與方法—親緣關係分析
萃取109 份標本的DNA序列,經過校準 (alignment),再進行親緣關係分析
1.分析方法主要使用兩種:
最大概似 (Maximum Likelihood,ML) 和貝葉斯方法 (Bayesian)
貝葉斯樹推論是使用 MrBayes v.3.4.6進行,最大概似分析使用 IQ-TREE v.1.6.10 。
2.不同基因以及不同位點 (site) 的突變速率不同,會對所推論的演化樹之穩定性有很大的影響。所以,在多基因建立演化樹過程中,設置分隔模型就顯得很重要。然而RAxML、MrBayes、BEAST等常用親緣分析軟體都支持分隔模型,但不能確定最佳的分隔方案。針對上述問題,PartitionFinder的作者從理論上解決了以上的問題,並通過Python語言實現了相應的算法
3.各DNA區域最合適的模型分別是 ITS 的 HKY+Γ、trnT-psbD 的 GTR+Γ 和 trnG 的 HKY+Γ。對於編碼過的得失位 (indel),選擇了 GTR2+ASC 模型
4.首先個別分析葉綠體和核 DNA 區域,並比較 ITS ML 樹和葉綠體 ML 樹中所有高支持度的演化支,以檢測網狀圖 (topology) 中可能存在的主要衝突。
5.由於無法檢測到得到良好支持的(>75% bootstrap [BS])網狀圖衝突,因此將所有 DNA 區域和編碼的得失位連接起來。使用該資料集,並計算了具有 5000 個超快自助重抽複製量 (ultrafast-bootstrap replicates,UFBS) 的 ML 樹,並將UFBS的結果上傳到 RogueNaRok 網頁 (https://rnr.h-its.org) 來篩選樹中任何放置不明確的樣本,這些樣本應該從數據集中排除。
材料與方法—分子定年
1.對7 個物種的 107 份標本之簡化組合資料集 (不包含編碼得失位) 進行分子定年分析。本研究進一步篩選相同序列的資料集,以便在單倍體水準上進行分析。使用了 R 套件 seqinr v.3.4修剪相同的序列 (Charif & Lobry, 2007)。
2.等距演化樹 ( Ultrametric tree) 是通過 BEAST v.1.10 (Suchard & al., 2018) 使用嚴格分子鐘和不相關的對數常態寬鬆分子鐘模型 (uncorrelated lognormal relaxed clock model) 推斷出來的。對於每個先驗的分子鐘模型,在一次運行中使用了兩種不同的絕對核苷酸替代率:
- 兩個葉綠體DNA區域的置換率 (substitution rate) 設置為 4.453e-4 ± 1.773e-6 substitutions/site/million years
- 核 ITS 區域的置換率設置為 0.00135 ± 0.005 置換/位點/百萬年,具有常態先驗分佈,並截斷上限和下限為 0.4e-3 和 8.3e-3 substitutions/site/million years
3.通過貝葉斯因子分析程序模型比較 Yule 模型、出生-死亡模型以及具穩定族群量的聚合模型之表現進行比較,每個模型都在嚴格與寬鬆的分子鐘下進行。
1.去除外群後,使用最大演化支可信度樹 (maximum clade credibility tree) 進行祖先面積估計分析。標本的分佈資料由植物標本館標籤彙整而成,每個單倍體被分配到所考慮的八個地理區域中的一個或幾個:Macaronesia (A)、歐洲 (B)、中東 (C)、亞洲 (D)、非洲 (E) )、南美洲 (F)、中美洲/加勒比海 (G) 和北美洲 (H)。
2. 使用 R套件 BioGeoBEARS v1.1.1 (Matzke, 2014) 進行了祖先區域估計。在 Bio-GeoBEARS 中,可以實現 Lagrange DEC 模型(dispersal-extinction cladogenesis),其中包括散佈(d)和滅絕(e)作為自由參數,以及一個模型(DEC+J),它包括一個附加參數 J將物種形成考慮在內(參見 Matzke, 2014 )。
3.本研究使用到DEC、DIVALIKE、BAYAREALIKE的3個生物地理模型。此3個模型是在最大概似框架中估計的,並根據它們使用的AIC對小樣本量進行校正的數據合適程度進行比較,結果是 DIVALIKE 作為本研究的最佳合適模型資料集。
材料與方法—物種劃分與驗證
劃分
R-package bgmyc v.1.0.2 (Reid & Carstens, 2012) 中提供的廣義混合耶魯聚合模型 (general mixed Yule-coalescent model) 的貝葉斯程序 (bGMYC) 與 mPTP 網頁上提供的多速率泊松樹過程 (mPTP) (https://mptp.h-its.org) (Kapli & al., 2017) 作為獲得初步物種的假設。
PTP 模型 (Zhang & al., 2013) 和 GMYC-Model (Pons & al., 2006) 是基於可能性的嘗試,將基因樹中的分支分為種內或種間。 GMYC 模型的貝葉斯程序減少了系統發育估計中的潛在誤差和模型參數的不確定性,並使用一組等距演化樹作為輸入。 PTP 模型的多速率實現允許每個假定的物種有不同的演化速率,並使用單個 ML 樹作為輸入。
此外,本研究為分類處理 (H1) 建立了一個替代假設,該假設整合了兩個模型的描述概念、地理起源和我們的形態特徵調查結果,同時避免了 E. tozeri 複合群的過度劃分。在本處理中,基於形態、分子和分佈屬性的整合,來自馬卡羅尼西亞、歐洲大陸、北美和亞洲的演化支被視為不同的分類群。來自伊朗和雲南的標本因其分子和地理的獨特性而被稱為單例模式 (singletons)。該屬中的其餘物種也進行了同樣的處理,總共產生了六個額外的分類實體。
驗證
遵循 Grummer 等人 (2014) 的框架,使用貝葉斯因子分析測試了三種不同的物種定界方案。這種方法比較了通過在競爭模型 (為每個模型生成物種樹的邊際似然估計) 中聚合與拆分不同譜系 (lineage) 獲得的替代分群。









留言
發佈留言