摘要:雙單倍體(DH)技術在玉米育種中得到了有效的應用。該技術在時間和純合度方面均優于傳統玉米育種。 DH技術的重要過程之一是單倍體種子的選擇。選擇單倍體的最常用方法是 R1-nj(納瓦霍)顏色標記。這種顏色標記出現在種子胚乳和胚胎中。僅選擇胚乳有色種子并持續到發芽階段。這種選擇通常是手動完成的。單倍體種子選擇的自動化將增加成功率并減少勞動力和時間。在這項研究中,我們使用了 87 個單倍體和 326 個二倍體玉米種子作為數據集。使用了玉米種子胚的質地特征。這些特征是從灰度共生矩陣中獲得的。特征向量使用決策樹、k-最近鄰和人工神經網絡進行分類。機器學習技術的分類性能通過使用 10 折交叉驗證方法進行測試。測試結果表明,決策樹的性能最好,分類成功率為84.48%。
關鍵詞:玉米;單倍體識別;紋理特征;GLCM;決策樹;kNN;ANN
在這項研究中,使用了為之前的工作創建的數據集。該數據集包括 413 粒玉米種子,共 87 個單倍體和 326 個二倍體。 所有樣品均作為玉米研究所2016年“國家玉米育種研究”項目的一部分收獲。所有樣品均來自RWS、RWK-76和“RWSxRWK-76”母源單倍體誘導劑150個基因型的雜交結果。樣品的選擇在胚胎和胚乳中具有不同的R1-nj表達(淺深色,無密色)。 根據 R1-nj 顏色標記手動完成樣本的類別標簽分配。 圖 1 給出了數據集中單倍體和二倍體玉米種子的樣本圖像。
圖1.(I)單倍體和(II)二倍體玉米種子的樣本圖像
確定在對數據集中隨機選擇的80粒玉米種子進行的測量中,統計學上的35像素半徑代表胚孔。圖2顯示了二倍體玉米種子樣本的種子質心和特征提取區域。
圖2.樣品種子、種子的質心和分割的胚區
單倍體和二倍體玉米種子在結構上彼此不同。紋理特征經常用于解決許多不同的模式識別問題。在這項研究中,紋理特征用于分離單倍體和二倍體玉米種子。從數據集中,樣品單倍體和二倍體玉米種子胚的圖像已在圖3中給出。
圖3.(I)單倍體和(II)二倍體玉米種子的胚胎圖像
總共使用了48個紋理特征來表示數據集中的每個圖像。帶有邊緣直方圖的數據集中樣本的分布如圖4所示。單倍體樣本用藍色強調,而二倍體樣本用橙色突出顯示。可以看出,單倍體和二倍體標本是交織在一起的。這意味著將解決具有挑戰性的分類任務。
圖4.考慮總共48個紋理特征的記錄分布