【文章解讀】

一:生命科學(xué)與生物醫(yī)藥領(lǐng)域:隨著基因測序技術(shù)、高通量生物實(shí)驗(yàn)、傳感器等技術(shù)的發(fā)展,生命科學(xué)與生物醫(yī)藥領(lǐng)域正在步入數(shù)字化3.0時(shí)代,數(shù)字化、自動(dòng)化進(jìn)程加速。健康計(jì)算作為一種新型智能科學(xué)計(jì)算模式,是以人工智能和數(shù)據(jù)驅(qū)動(dòng)為核心的第四研究范式。它將極大助力人類探索并解決生命健康問題;                             

二:自動(dòng)駕駛領(lǐng)域:建設(shè)高等級(jí)智能網(wǎng)聯(lián)道路是智能駕駛及智能交通的一大趨勢,既保證了智能車量產(chǎn)的可能性,又保障了高級(jí)別自動(dòng)駕駛基于場景驅(qū)動(dòng)落地的可行性;中國版自動(dòng)駕駛-汽車駕駛自動(dòng)化:《汽車駕駛自動(dòng)化分級(jí)》是我國智能網(wǎng)聯(lián)汽車標(biāo)準(zhǔn)體系的基礎(chǔ)類標(biāo)準(zhǔn)之一,由工業(yè)和信息化部于2020年3月9日?qǐng)?bào)批公示,2021年1月1日正式實(shí)施。


市場監(jiān)管總局(標(biāo)準(zhǔn)委)針對(duì)自動(dòng)駕駛功能正式出臺(tái)《汽車駕駛自動(dòng)化分級(jí)》國家推薦標(biāo)準(zhǔn)(GB/T 40429-2021)。新標(biāo)準(zhǔn)2022年3月1日起正式實(shí)施。

 

 

 

張亞勤:生命科學(xué)與生物醫(yī)藥領(lǐng)域數(shù)字化、自動(dòng)化進(jìn)程加速

 

 

生命科學(xué)與生物醫(yī)藥領(lǐng)域正在步入數(shù)字化3.0時(shí)代,AI正在加速生命健康與生物醫(yī)藥領(lǐng)域向著更快速、更精準(zhǔn)、更安全、更經(jīng)濟(jì)、更普惠的方向穩(wěn)步發(fā)展。

——張亞勤

 

9月26日下午,2021年世界互聯(lián)網(wǎng)大會(huì)在烏鎮(zhèn)召開。在數(shù)據(jù)與算法論壇上,清華大學(xué)智能產(chǎn)業(yè)研究院(AIR)院長張亞勤院士圍繞“人工智能賦能生命科學(xué)”這一主題,介紹生物世界發(fā)生的數(shù)字化和智能化新變革,并分享清華大學(xué)智能產(chǎn)業(yè)研究院(AIR)在人工智能與生命健康交叉學(xué)科發(fā)展上的新布局。本次報(bào)告由張亞勤院長及團(tuán)隊(duì)成員馬維英、蘭艷艷、黃婷婷共同完成。

 

(攝影/浙江日?qǐng)?bào)記者 李震宇)

 

隨著基因測序技術(shù)、高通量生物實(shí)驗(yàn)、傳感器等技術(shù)的發(fā)展,生命科學(xué)與生物醫(yī)藥領(lǐng)域正在步入數(shù)字化3.0時(shí)代,數(shù)字化、自動(dòng)化進(jìn)程加速。健康計(jì)算作為一種新型智能科學(xué)計(jì)算模式,是以人工智能和數(shù)據(jù)驅(qū)動(dòng)為核心的第四研究范式。它將極大助力人類探索并解決生命健康問題。

 

image.png

 

人工智能從上世紀(jì)五十年代發(fā)展到今天,產(chǎn)生了很多不同的算法,尤其是以早期的RNN、LSTM和CNN為代表的深度學(xué)習(xí)技術(shù),及過去這兩年的GAN、transformer- d (BERT和GPT-3模型), 預(yù)訓(xùn)練模型等等,可以說從我們感知方面語音識(shí)別、人臉識(shí)別、物體的分類,已經(jīng)和人達(dá)到同樣的水平。但在自然語言理解,知識(shí)推理,和視頻語義和泛化能力方面還有很多差距。另外在算法透明性,可解釋性,因果性,安全,隱私和倫理等方面還存在較大挑戰(zhàn)。

 

image.png

 

在可信AI計(jì)算方面最近又很多進(jìn)展, 一個(gè)例子是聯(lián)邦學(xué)習(xí),這也是清華大學(xué)智能產(chǎn)業(yè)研究院的一個(gè)重要研究課題。聯(lián)邦學(xué)習(xí)主要有兩種方案,一種是橫向聯(lián)邦學(xué)習(xí),它主要面向不同來源特征和模型相同的場景,能夠保證相同模態(tài)不同來源數(shù)據(jù)之間的隱私性。另一種叫做縱向聯(lián)邦學(xué)習(xí),它可以處理不同來源的特征和模型不同的情況,能夠保證多模態(tài)數(shù)據(jù)之間的隱私性。

 

image.png

 

我們已經(jīng)看到,AI正在加速生命健康與生物醫(yī)藥領(lǐng)域向著更快速、更精準(zhǔn)、更安全、更經(jīng)濟(jì)、更普惠的方向穩(wěn)步發(fā)展。具體體現(xiàn)在,人工智能在蛋白質(zhì)結(jié)構(gòu)預(yù)測、CRISPR基因編輯技術(shù)、抗體/TCR/個(gè)性化的疫苗研發(fā)、精準(zhǔn)醫(yī)療、AI輔助藥物設(shè)計(jì)等方面的研究已成為國際前沿戰(zhàn)略性研究熱點(diǎn)。

 

image.png

 

考慮到這樣的學(xué)科發(fā)展趨勢和產(chǎn)業(yè)背景,清華大學(xué)智能產(chǎn)業(yè)研究院(AIR)在“AI+生命健康方向”做了四個(gè)研究方向的布局,聚焦在研究“AI增強(qiáng)個(gè)人健康管理與公共衛(wèi)生”、“AI+醫(yī)療與生命科學(xué)”、“AI輔助藥物研發(fā)”與“AI+基因分析與編輯”方向。

 

image.png

 

作為交叉領(lǐng)域研究與應(yīng)用,AIR認(rèn)識(shí)到人工智能與生命科學(xué)、生物醫(yī)藥領(lǐng)域存在較大的知識(shí)鴻溝,缺乏面向生物計(jì)算的數(shù)據(jù)集、AI平臺(tái)、核心算法、計(jì)算引擎,同時(shí)跨界人才也非常稀缺。針對(duì)以上挑戰(zhàn),AIR提出“AI+生命科學(xué)破壁計(jì)劃”,目標(biāo)是定義AI+生命科學(xué)領(lǐng)域的核心前沿研究任務(wù),跨越生命健康領(lǐng)域與人工智能的領(lǐng)域鴻溝,打破壁壘,促進(jìn)AI與生命科學(xué)的深度交叉融合,加速科學(xué)發(fā)現(xiàn)。

 

image.png

 

為此,我們需要構(gòu)建面向生命科學(xué)領(lǐng)域的人工智能基礎(chǔ)設(shè)施、數(shù)據(jù)平臺(tái)、核心算法引擎,支撐生命科學(xué)前沿研究任務(wù)。同時(shí)通過打造旗艦公開數(shù)據(jù)集,組織算法挑戰(zhàn)競賽,構(gòu)建AI+生命科學(xué)的眾智平臺(tái),培養(yǎng)跨界人才,構(gòu)建產(chǎn)業(yè)生態(tài)。

 

image.png

 

AlphaFold2是AI+生命科學(xué)的一個(gè)典型成功案例。它的成功因素來自于兩方面,首先,是任務(wù)的特殊性,蛋白質(zhì)結(jié)構(gòu)預(yù)測就可以看作從序列到三維結(jié)構(gòu)的一個(gè)一一映射問題,因此它是一個(gè)well define的AI問題。這就是破壁計(jì)劃的目標(biāo),要找到生命科學(xué)中意義重大,但同時(shí)又能抽象為適合AI的研究任務(wù)。第二,是模型的優(yōu)越性。一方面,長時(shí)間的生命科學(xué)領(lǐng)域的研究積累了大規(guī)模的蛋白質(zhì)結(jié)構(gòu)數(shù)據(jù),而AlphaFold2的整個(gè)模型架構(gòu)則充分利用了數(shù)據(jù)驅(qū)動(dòng)的端到端深度學(xué)習(xí)模型,大數(shù)據(jù)與深度模型的結(jié)合恰恰是第四范式的典型特點(diǎn)。因此,AlphaFold2帶給我們的啟示就是在AI+生命科學(xué)的研究中,要注重破壁和第四范式的重要性。

 

image.png

 

顯然,AlphaFold2僅僅是一個(gè)開始,它的成功正在開啟一個(gè)新的模式。蛋白質(zhì)結(jié)構(gòu)的精準(zhǔn)預(yù)測為生命科學(xué)家提供了高效的計(jì)算工具,也為基于AI的重大生命科學(xué)發(fā)現(xiàn)提供了可能。未來,抗體、抗原的表位預(yù)測,腫瘤的精準(zhǔn)療法,TCR/個(gè)性化疫苗的設(shè)計(jì)與優(yōu)化等方向?qū)⒊蔀橹匾难芯繜狳c(diǎn),并在AI驅(qū)動(dòng)的新計(jì)算模式下取得突破性進(jìn)展,AI+大分子制藥的黃金時(shí)代將正式到來。

 

image.png

 

其中,還會(huì)產(chǎn)生很多新的科學(xué)挑戰(zhàn),也預(yù)示著將產(chǎn)生新的計(jì)算范式,例如,干濕融合的閉環(huán)式計(jì)算框架。一方面人工智能模型通過高通量、多輪濕實(shí)驗(yàn)的閉環(huán)驗(yàn)證和數(shù)據(jù)補(bǔ)充將變得更為智能。另一方面,通過主動(dòng)學(xué)習(xí)或強(qiáng)化學(xué)習(xí)的方式, AI將主動(dòng)規(guī)劃濕實(shí)驗(yàn)的自動(dòng)化進(jìn)行,形成干濕閉環(huán)驗(yàn)證、迭代加速生命科學(xué)發(fā)現(xiàn)與產(chǎn)業(yè)應(yīng)用。我們預(yù)見到,通過干濕閉環(huán)打通,生命科學(xué)研究與生物醫(yī)藥產(chǎn)業(yè)將迎來新的研究范式與產(chǎn)業(yè)模式。

 

image.png

 

AIR目前在基因數(shù)據(jù)的表達(dá)和預(yù)測方面已經(jīng)取得了一些初步進(jìn)展。最近,由我們清華大學(xué)智能產(chǎn)業(yè)研究院(AIR)的蘭艷艷教授帶領(lǐng)GeneBert團(tuán)隊(duì)設(shè)計(jì)了一個(gè)新穎的基因預(yù)訓(xùn)練模型,通過構(gòu)建序列與轉(zhuǎn)錄因子之間的二維矩陣,實(shí)現(xiàn)了一個(gè)多模態(tài)的基因預(yù)訓(xùn)練模型,獲取了基因數(shù)據(jù)的有效表示,尤其是挖掘了非編碼區(qū)的數(shù)據(jù)價(jià)值,在下游的啟動(dòng)子、轉(zhuǎn)錄子結(jié)合位點(diǎn)的預(yù)測,先天性巨結(jié)腸疾病的基因篩選任務(wù)上都大幅提高了性能。我們相信,類似預(yù)訓(xùn)練這樣的前沿AI技術(shù)在基因數(shù)據(jù)上的持續(xù)深入應(yīng)用,將進(jìn)一步挖掘基因數(shù)據(jù)的價(jià)值,幫助我們破解人類的密碼,在癌癥的精準(zhǔn)治療等重要問題上發(fā)揮作用。

 

image.png

 

總結(jié)來看,我們認(rèn)為,生物世界正處于數(shù)字化、自動(dòng)化和智能科學(xué)計(jì)算的新變革中,用計(jì)算的方法,即人工智能和數(shù)據(jù)驅(qū)動(dòng)的第四研究范式來輔助人們探索并解決生命健康的問題成為一個(gè)重要的研究方向。未來,需要學(xué)術(shù)界和產(chǎn)業(yè)界共同推動(dòng)生命科學(xué)、生物醫(yī)藥、基因工程、個(gè)人健康各領(lǐng)域從孤立、開環(huán)向協(xié)同、閉環(huán)發(fā)展,實(shí)現(xiàn)更快速、更精準(zhǔn)、更安全、更經(jīng)濟(jì)、更普惠的生命科學(xué)與生物醫(yī)藥創(chuàng)新,這代表著下個(gè)十年巨大的科學(xué)發(fā)展與產(chǎn)業(yè)創(chuàng)新的新機(jī)會(huì)。

 

image.png

 

我們熱切呼吁更多的人來關(guān)注、支持或投身于這個(gè)新興交叉學(xué)科的發(fā)展。

 

撰文排版 /  冼曉晴

校對(duì)責(zé)編 / 黃妍

 

 


 

張亞勤:建設(shè)高等級(jí)智能網(wǎng)聯(lián)道路是智能駕駛及智能交通的一大趨勢

 

2月24日,全球首個(gè)車路協(xié)同自動(dòng)駕駛數(shù)據(jù)集DAIR-V2X正式發(fā)布,向境內(nèi)用戶提供下載使用。該數(shù)據(jù)集由清華大學(xué)智能產(chǎn)業(yè)研究院(AIR)聯(lián)合北京市高級(jí)別自動(dòng)駕駛示范區(qū)、北京車網(wǎng)科技發(fā)展有限公司、百度Apollo、北京智源人工智能研究院共同發(fā)布。

  此次發(fā)布的數(shù)據(jù)集首次實(shí)現(xiàn)在相同時(shí)空下,車端與路端聯(lián)合視角的2D、3D標(biāo)注方法創(chuàng)新,作為業(yè)界、學(xué)界首個(gè)開源車路協(xié)同數(shù)據(jù)集,將大力服務(wù)科研、產(chǎn)業(yè)、政府機(jī)構(gòu),有效協(xié)同各方進(jìn)行車路協(xié)同的學(xué)術(shù)研究和產(chǎn)業(yè)落地,促進(jìn)我國車路協(xié)同發(fā)展。

數(shù)據(jù)集正式發(fā)布

  2020年2月,國家發(fā)改委聯(lián)合相關(guān)部委出臺(tái)《智能汽車創(chuàng)新發(fā)展戰(zhàn)略》,將“推進(jìn)智能化道路基礎(chǔ)設(shè)置規(guī)劃建設(shè)”作為重要的國家戰(zhàn)略任務(wù),明確了“單車智能+車路協(xié)同”的中國特色自動(dòng)駕駛路線,車路協(xié)同成為各界研究重點(diǎn)。

面向?qū)W界業(yè)界痛點(diǎn) 架起研究與落地橋梁

  北京經(jīng)濟(jì)技術(shù)開發(fā)區(qū)管委會(huì)副主任、北京市高級(jí)別自動(dòng)駕駛示范區(qū)工作辦公室主任孔磊表示,未來將及時(shí)利用數(shù)據(jù)轉(zhuǎn)化制定一批車路協(xié)同數(shù)據(jù)標(biāo)準(zhǔn),推動(dòng)行業(yè)數(shù)據(jù)要素、接口、格式等標(biāo)準(zhǔn)統(tǒng)一,為示范區(qū)建設(shè)和行業(yè)發(fā)展提供參考和指導(dǎo);通過數(shù)據(jù)開放,為高校和科研機(jī)構(gòu)提供基礎(chǔ)數(shù)據(jù),為企業(yè)產(chǎn)品研發(fā)測試提供支持,有效加速產(chǎn)學(xué)研用協(xié)同,同時(shí)繼續(xù)開展數(shù)據(jù)開放和共享服務(wù)模式探索,推動(dòng)數(shù)字經(jīng)濟(jì)發(fā)展。

DAIR-V2X數(shù)據(jù)集整體特征

DAIR-V2X學(xué)業(yè)界及產(chǎn)業(yè)界效益

張亞勤發(fā)言

  清華大學(xué)智能產(chǎn)業(yè)研究院(AIR)院長張亞勤教授認(rèn)為,建設(shè)高等級(jí)智能網(wǎng)聯(lián)道路是智能駕駛及智能交通的一大趨勢,既保證了智能車量產(chǎn)的可能性,又保障了高級(jí)別自動(dòng)駕駛基于場景驅(qū)動(dòng)落地的可行性。在智能交通領(lǐng)域,AIR已與多家企業(yè)開展校企合作,包括車路協(xié)同自動(dòng)駕駛、垂直行業(yè)、小車物流、Robotaxi等應(yīng)用場景。面對(duì)相關(guān)數(shù)據(jù)集的缺乏,不能滿足各界實(shí)現(xiàn)數(shù)據(jù)驅(qū)動(dòng)車路協(xié)同的現(xiàn)實(shí)問題,AIR發(fā)起數(shù)據(jù)集建設(shè),并將數(shù)據(jù)集對(duì)高校、科研院所、產(chǎn)業(yè)用戶開放,可以更好地支撐科研機(jī)構(gòu)進(jìn)行科學(xué)研究。

DAIR-V2X數(shù)據(jù)集全球首次發(fā)布

  此次發(fā)布的全球首個(gè)車路協(xié)同自動(dòng)駕駛數(shù)據(jù)集DAIR-V2X,對(duì)于促進(jìn)我國高級(jí)別自動(dòng)駕駛技術(shù)的研發(fā)具有重要意義。在新基建、交通強(qiáng)國戰(zhàn)略指引下,“單車智能+車路協(xié)同”的中國特色自動(dòng)駕駛路線以其領(lǐng)先性,逐步得到國際認(rèn)可。未來,在產(chǎn)學(xué)研各界基于車路協(xié)同自動(dòng)駕駛數(shù)據(jù)集的有效協(xié)作下,將繼續(xù)推動(dòng)車路協(xié)同自動(dòng)駕駛的應(yīng)用落地,助力我國自動(dòng)駕駛和智能交通產(chǎn)業(yè)的快速發(fā)展。