美國麻省理工學院、密歇根大學和東北大學聯(lián)合團隊在最新《自然·方法》雜志上發(fā)表論文,介紹了一種名為“MultiCell”的幾何深度學習模型。該模型首次實現(xiàn)了在單細胞分辨率下,預測果蠅胚胎發(fā)育過程中,每個細胞在每分鐘的行為變化。未來可在此基礎上設計出通用的多細胞發(fā)育預測模型,構建“數(shù)字胚胎”,用于藥物篩選甚至指導人工組織設計。
一個胚胎如何從一團細胞變成有頭有尾、有器官的完整生命體,是發(fā)育生物學領域持續(xù)百年的核心謎題。雖然科學家早已知道細胞會分裂、移動、折疊,但具體到某一個細胞在下一分鐘會有什么動態(tài)行為,卻一直難以預測。
模型采用四維全胚胎數(shù)據(jù)進行訓練和測試,這些數(shù)據(jù)具有亞微米級分辨率和較高的幀率,每個胚胎包含約5000個被標注邊界和細胞核的細胞。在測試中,模型不僅能判斷細胞是否會發(fā)生特定行為,還能精確預測行為發(fā)生的時間是幾分鐘后。團隊將這一方法與“阿爾法折疊”預測的蛋白質結構相類比:阿爾法折疊是從氨基酸序列推斷蛋白質三維結構,“MultiCell”則是從細胞群落的幾何特征,預測多細胞系統(tǒng)的自組織過程。不過,由于胚胎發(fā)育是持續(xù)演變的動態(tài)過程,后者遠比前者復雜。
團隊將該方法應用于果蠅早期胚胎發(fā)育的關鍵階段——原腸胚形成。模型在3個胚胎視頻上訓練后,被用于預測第4個新胚胎的演化過程。結果顯示,模型在預測細胞連接丟失方面的準確率約90%;在預測細胞內陷、分裂或重排行為時,也表現(xiàn)了較高的準確率。
團隊表示,“MultiCell”是首個能在多細胞自組裝過程中,實現(xiàn)各類細胞行為單細胞精度預測的算法。鑒于其可捕捉細胞動力學上存在的微妙差異,未來將助力早期診斷或藥物篩選。
不過,該方法仍面臨一些問題,包括數(shù)據(jù)稀缺,以及當前模型僅基于幾何信息,未整合基因表達、蛋白質定位等。之后加入這些維度,有望更全面揭示物理與生物信息的互動。
【總編輯圈點】
預測單個細胞行為,其實也是解析整個生命體的第一步,在探索生命奧秘的道路上人類又取得了一大進展?茖W家現(xiàn)在能高精確預測每個細胞在下一分鐘會做什么,而最令人興奮的地方則是其應用前景:臨床診斷中,醫(yī)生可能通過分析細胞行為的微小異常,在疾病癥狀出現(xiàn)前就作出早期預警;藥物研發(fā)領域,這種技術可以作為平臺來模擬藥物效果,大幅提升研發(fā)效率。更長遠看,它甚至可能助力人工組織設計和器官再生。
(責任編輯:華康)