一、慶功宴后的野心火苗
論文見(jiàn)刊那天,302實(shí)驗室罕見(jiàn)地提前下了班。林卷卷抱著(zhù)剛打印出來(lái)的論文單行本,非要拉著(zhù)江硯去學(xué)校門(mén)口的麻辣燙店“慶功”。
“江博士,你看這紅湯多像我們飆升的影響因子!”林卷卷舉著(zhù)筷子,把一串魚(yú)丸浸在滾燙的紅油里,“二區頂刊只是開(kāi)胃菜,下次我們直接上CNS豪華套餐!”
江硯看著(zhù)她被辣得通紅的鼻尖,默默遞過(guò)一杯冰可樂(lè ):“先吃你的魚(yú)丸?!彼焐喜懖惑@,指尖卻在桌下摩挲著(zhù)手機——屏幕上是Nature最新一期的目錄,其中一篇關(guān)于單細胞空間轉錄組的論文,被他標了三個(gè)醒目的紅圈。
“說(shuō)真的,”林卷卷吸溜著(zhù)面條,突然正經(jīng)起來(lái),“Dragon-Seq 2.0雖然牛,但總覺(jué)得還差口氣。就像打游戲通關(guān)了普通難度,不試試地獄模式怎么甘心?”
江硯抬眼,眼底閃過(guò)一絲笑意:“如果我說(shuō),有個(gè)方向可能打敗現有單細胞分析的范式,難度系數堪比同時(shí)解十道NP難題,你敢不敢接?”
“接!”林卷卷想都沒(méi)想就拍了桌子,麻辣燙的湯汁濺到白大褂上也毫不在意,“只要能發(fā)Nature,別說(shuō)NP難題,讓我給測序儀唱《征服》都行!”
那天晚上,兩人踩著(zhù)月光走回實(shí)驗室。林卷卷拿著(zhù)根樹(shù)枝當劍,邊比劃邊喊:“Nature副本,我林卷卷來(lái)啦!小怪們接招!”江硯跟在她身后,聽(tīng)著(zhù)她把頂級期刊比作游戲副本,突然覺(jué)得那座遙不可及的學(xué)術(shù)高峰,似乎也沒(méi)那么陡峭了。
二、實(shí)驗室黑板上的狂想曲
第二天一早,林卷卷剛沖進(jìn)實(shí)驗室,就被黑板上的內容驚得差點(diǎn)咬掉舌頭。
原本干凈的黑板上,被江硯用白色粉筆寫(xiě)滿(mǎn)了公式和示意圖:從單細胞測序數據的時(shí)間序列建模,到空間位置信息的整合算法,再到與蛋白質(zhì)互作網(wǎng)絡(luò )的動(dòng)態(tài)關(guān)聯(lián)……最后用紅色粉筆圈出三個(gè)大字:時(shí)空圖譜。
“這、這是……”林卷卷指著(zhù)黑板,結結巴巴地說(shuō)不出話(huà)。
“單細胞時(shí)空動(dòng)態(tài)圖譜?!苯幉亮瞬潦稚系姆酃P灰,語(yǔ)氣平靜得像在說(shuō)今天的天氣,“現有技術(shù)能測單細胞的基因表達,能看空間位置,卻沒(méi)法把時(shí)間維度加進(jìn)去——細胞是怎么從胚胎干細胞分化成神經(jīng)細胞的?腫瘤細胞在體內遷移時(shí)基因表達如何變化?這些動(dòng)態(tài)過(guò)程,我們現在只能靠推測?!?/p>
他拿起粉筆,在“時(shí)空圖譜”旁邊畫(huà)了個(gè)簡(jiǎn)單的坐標軸:“橫軸是空間位置,縱軸是基因表達,第三軸是時(shí)間。我們要做的,就是用算法給細胞‘拍電影’,讓它的每一個(gè)變化都無(wú)所遁形?!?/p>
林卷卷的眼睛越睜越大,手里的早餐面包“啪嗒”掉在地上:“這、這要是做出來(lái),豈不是能直接看到細胞的‘前世今生’?”
“不止?!苯幍闹讣恻c(diǎn)在黑板上的一個(gè)節點(diǎn),“如果能實(shí)現,癌癥轉移機制、胚胎發(fā)育奧秘、甚至神經(jīng)退行性疾病的病程進(jìn)展,都可能被重新定義?!?/p>
林卷卷突然撲到黑板前,拿起紅色粉筆在“時(shí)空圖譜”下方畫(huà)了個(gè)大大的游戲手柄,旁邊寫(xiě)著(zhù):SCI大富翁之Nature副本開(kāi)荒計劃——主線(xiàn)任務(wù):解鎖細胞時(shí)空密碼。
“江博士,”她轉過(guò)身,眼睛亮得像藏了整片星空,“這副本,我跟你刷了!”
江硯看著(zhù)黑板上嚴肅的科學(xué)構想和幼稚的游戲涂鴉奇妙共存,嘴角的弧度再也藏不住。他拿起黑板擦,卻沒(méi)有擦掉那個(gè)游戲手柄,只是輕聲說(shuō):“先說(shuō)好,這個(gè)副本的BOSS比你想象的難打?!?/p>
三、第一關(guān):數據海嘯與代碼防線(xiàn)
開(kāi)荒計劃啟動(dòng)的第一周,林卷卷就體會(huì )到了“Nature副本”的下馬威——數據量。
為了構建時(shí)空圖譜,他們需要整合三種數據:?jiǎn)渭毎麥y序的基因表達矩陣(動(dòng)輒幾十GB)、空間轉錄組的位置信息(三維坐標點(diǎn)云數據)、以及顯微鏡拍攝的時(shí)間序列影像(每小時(shí)產(chǎn)生200GB原始數據)。
“這哪是數據啊,這是海嘯!”林卷卷盯著(zhù)服務(wù)器的存儲容量報警界面,哀嚎著(zhù)癱在椅子上,“我們現有的算力,處理這些數據就像用算盤(pán)解微積分!”
江硯正在調試新到的超算節點(diǎn),聞言回頭:“我申請了學(xué)校的GPU集群資源,但調度優(yōu)先級不夠。需要優(yōu)化算法,把數據壓縮到現有算力能啃得動(dòng)的程度?!?/p>
“壓縮?”林卷卷突然坐直,眼睛一轉,“有了!我可以用Transformer模型做特征提取,就像給數據‘脫水’!保留精華,丟掉雜質(zhì)!”
她撲到電腦前,手指在鍵盤(pán)上翻飛,屏幕上跳出一行行代碼:“你看,把基因表達矩陣當成‘文本’,空間位置當‘上下文’,時(shí)間序列當‘語(yǔ)序’……說(shuō)不定能訓練出個(gè)‘細胞語(yǔ)言翻譯器’!”
江硯湊過(guò)去看,發(fā)現她竟把自然語(yǔ)言處理的思路嫁接到了生物數據上。那些原本雜亂無(wú)章的數據,在她的算法里被賦予了“語(yǔ)義”,冗余信息被精準剔除,數據量瞬間壓縮到原來(lái)的1/5。
“邏輯……居然能自洽?!苯庪y得沒(méi)吐槽,指尖輕輕點(diǎn)在屏幕上的一個(gè)函數,“這里加個(gè)注意力掩碼,讓模型更關(guān)注時(shí)間維度的變化?!?/p>
林卷卷立刻照做,代碼運行的進(jìn)度條飛速推進(jìn)。當最終的壓縮率顯示為19.7%時(shí),兩人對視一眼,都從對方眼里看到了興奮。
“第一關(guān),通關(guān)!”林卷卷比了個(gè)勝利手勢,突然想起什么,“對了,這模型叫什么名字好?‘細胞壓縮餅干’?還是‘時(shí)空脫水機’?”
江硯:“……叫‘Temporal-Seq’?!?/p>
四、閻王爺的冷嘲與內部的熱望
他們要沖擊Nature的消息,不知怎么傳到了閻正明耳朵里。某天組會(huì )結束,閻正明特意路過(guò)302實(shí)驗室,陰陽(yáng)怪氣地敲了敲門(mén)框。
“小江啊,有志向是好的,但也別好高騖遠?!彼沉搜酆诎迳系摹皶r(shí)空圖譜”,嘴角撇出一絲嘲諷,“Nature可不是二區期刊,不是靠點(diǎn)小聰明就能混進(jìn)去的?!?/p>
趙宇跟在后面,假惺惺地附和:“就是啊江師弟,聽(tīng)說(shuō)你們連超算資源都申請不到?要不我跟閻老師說(shuō)說(shuō),把我們組淘汰的舊服務(wù)器借給你們?”
林卷卷正調試著(zhù)算法,聞言直接懟回去:“舊服務(wù)器就留給趙師兄當游戲機吧,我們的代碼怕它跑起來(lái)自燃?!?/p>
江硯按住想沖上去理論的林卷卷,對閻正明說(shuō):“多謝導師關(guān)心,我們會(huì )按計劃推進(jìn)?!?/p>
閻正明見(jiàn)沒(méi)討到便宜,悻悻地走了。林卷卷氣得直跺腳:“他分明就是怕我們超過(guò)他!”
“所以才要更努力?!苯幋蜷_(kāi)數據文件夾,“你看,張院士把他珍藏的小鼠胚胎發(fā)育數據集借給我們了?!?/p>
林卷卷湊過(guò)去,看到文件夾里的實(shí)驗記錄密密麻麻,標注著(zhù)“2010-2023”:“張院士也太給力了吧!”
“他說(shuō),”江硯頓了頓,語(yǔ)氣里帶著(zhù)不易察覺(jué)的鄭重,“龍騰大學(xué)該有篇能讓世界記住的Nature了?!?/p>
那天下午,計算機系的教授聽(tīng)說(shuō)了他們的計劃,主動(dòng)派來(lái)兩個(gè)博士生幫忙優(yōu)化代碼;生科院的技術(shù)員偷偷塞給林卷卷一把細胞房的備用鑰匙:“凌晨三點(diǎn)的顯微鏡沒(méi)人搶?zhuān)銈儽M管用?!?/p>
實(shí)驗室的黑板上,除了“時(shí)空圖譜”,漸漸多了些歪歪扭扭的留言:
“加油!等你們上Nature封面!”(來(lái)自隔壁實(shí)驗室的師妹)
“代碼有bug可以找我,免費!”(計算機系學(xué)霸)
“這是我珍藏的咖啡因片,熬夜必備!”(某不知名的熱心同學(xué))
林卷卷看著(zhù)那些暖心的字跡,突然覺(jué)得,這場(chǎng)Nature副本的開(kāi)荒,他們不是孤軍奮戰。
五、深夜的泡面與星空
為了趕在國際單細胞大會(huì )前拿出初步成果,兩人幾乎住在了實(shí)驗室。凌晨三點(diǎn)的302,永遠亮著(zhù)兩盞燈:江硯那邊是顯微鏡的冷光,林卷卷這邊是電腦屏幕的藍光。
某個(gè)深夜,林卷卷的代碼突然跑出一組奇怪的結果——小鼠胚胎干細胞在分化過(guò)程中,某個(gè)基因的表達模式呈現出周期性波動(dòng),像一串神秘的密碼。
“江博士!你快看這個(gè)!”她舉著(zhù)電腦沖到細胞房,江硯正在給樣本染色,聞言立刻放下移液槍。
屏幕上的折線(xiàn)圖像跳動(dòng)的心臟,在時(shí)間軸上畫(huà)出優(yōu)美的正弦曲線(xiàn)。江硯的呼吸瞬間屏?。骸斑@是……生物鐘基因?在單細胞水平上居然能觀(guān)測到這么規律的波動(dòng)?”
“不止呢!”林卷卷調出空間分布圖,“你看它的表達位置,隨著(zhù)時(shí)間推移在細胞內移動(dòng),像在跳某種舞蹈!”
兩人對著(zhù)那組數據研究了整整三個(gè)小時(shí),直到窗外泛起魚(yú)肚白才意識到餓。林卷卷從抽屜里翻出最后兩桶泡面,用燒杯煮了開(kāi)水。
“江博士,你說(shuō)我們能成功嗎?”她吸著(zhù)泡面,突然有點(diǎn)忐忑,“Nature那么難,萬(wàn)一……”
“沒(méi)有萬(wàn)一?!苯幋驍嗨?,把自己碗里的雞蛋夾給她,“你的代碼能跑,我的實(shí)驗數據可靠,剩下的交給科學(xué)本身?!?/p>
林卷卷看著(zhù)他認真的側臉,突然笑了:“對!代碼能跑就是勝利!就算這次不行,我們再改再試,總有一天能把‘時(shí)空圖譜’敲進(jìn)Nature的接收列表!”
那天清晨,他們并肩站在實(shí)驗室的窗邊,看著(zhù)第一縷陽(yáng)光照在“時(shí)空圖譜”的黑板上。林卷卷掏出手機,拍下這一幕,設成了屏保。
“Nature副本開(kāi)荒日志,Day 15?!彼谂笥讶?xiě)下這句話(huà),配了張泡面和黑板的合影,“BOSS很兇,但我們的裝備也在升級。沖!”
江硯刷到這條朋友圈時(shí),正在調試顯微鏡。他猶豫了幾秒,點(diǎn)了個(gè)贊,然后把自己的手機屏保,換成了那張林卷卷趴在桌上睡顏的照片。
Nature之路注定布滿(mǎn)荊棘,但此刻的302實(shí)驗室里,野心與信任正在悄悄發(fā)酵,像培養基里悄然生長(cháng)的細胞,終將綻放出驚人的力量。