隨著時(shí)代的發(fā)展,制藥業(yè)正在經(jīng)歷翻天覆地的變化。2018年,一部現(xiàn)實(shí)主義電影《我不是藥神》讓仿制藥的話題引起了人們的關(guān)注。讓我們來(lái)看看一組原始的研究數(shù)據(jù),根據(jù)PharmaIntelligence根據(jù)公司在2021年提供的報(bào)告,在過(guò)去的十年里,只有不到10%的藥物能夠順利完成臨床實(shí)踐I,II,III期間實(shí)驗(yàn),并在NDA/BLA后來(lái)獲準(zhǔn)上市。
那么,作為仿制藥的對(duì)象,原研究藥物的重點(diǎn)是什么呢?原研發(fā)工作風(fēng)險(xiǎn)巨大,投資時(shí)間長(zhǎng),投資成本高,所以所謂的行業(yè)流傳“雙十定律”也就是說(shuō),制藥企業(yè)在開(kāi)發(fā)創(chuàng)新藥物時(shí),通常需要花費(fèi)超過(guò)10億$,開(kāi)發(fā)周期往往需要十年甚至更長(zhǎng)的時(shí)間,從藥物設(shè)計(jì)到臨床實(shí)驗(yàn),再到申請(qǐng)上市。
也正因此,大量制藥企業(yè)正在期待利用計(jì)算機(jī)輔助藥物設(shè)計(jì),降低研發(fā)成本、縮短研發(fā)周期,并最終提高成功率。
數(shù)字技術(shù)加速新藥研發(fā)
藥物的研發(fā)一般起始于藥物探索與發(fā)現(xiàn),隨后進(jìn)行臨床前研究與臨床實(shí)驗(yàn),在成功后進(jìn)行相關(guān)審批,通過(guò)審批的藥物則可以進(jìn)入商業(yè)化生產(chǎn)與藥物銷(xiāo)售流通環(huán)節(jié)。在藥物探索階段,靶點(diǎn)的發(fā)現(xiàn)可謂至關(guān)重要,如果靶點(diǎn)不是創(chuàng)新的,這便不能被稱(chēng)作一款真正意義上的創(chuàng)新藥。為此,很多制藥企業(yè)選擇與國(guó)內(nèi)知名的轉(zhuǎn)化醫(yī)學(xué)中心進(jìn)行合作,進(jìn)行臨床數(shù)據(jù)挖掘與生物信息分析。
早在2017年,瑞金醫(yī)院國(guó)家轉(zhuǎn)化醫(yī)學(xué)研究中心已經(jīng)開(kāi)始著手打造一個(gè)集存、傳、算、用(即:數(shù)據(jù)存儲(chǔ)、數(shù)據(jù)傳輸、數(shù)據(jù)分析計(jì)算和數(shù)據(jù)的整合應(yīng)用)為一體的定制化高密度計(jì)算平臺(tái)——ASTRA。
ASTRA擁有4000個(gè)CPU計(jì)算核心,存儲(chǔ)系統(tǒng)為總?cè)萘?0PB的高性能并行文件存儲(chǔ)系統(tǒng),同時(shí)配備了200GB的HDR IB網(wǎng)卡以及15 PetaFLOPS的AI計(jì)算能力。其采用的第三代英特爾® 至強(qiáng)® 可擴(kuò)展處理器更適用于需要兼顧生產(chǎn)和科研的平臺(tái),能夠靈活滿足相關(guān)需求。同時(shí),借助英特爾開(kāi)發(fā)的DAOS(Distributed Asynchronos Object Storage,分布式異步對(duì)象存儲(chǔ))開(kāi)源文件系統(tǒng),使得瑞金醫(yī)院的ASTRA系統(tǒng)能夠突破存儲(chǔ)瓶頸,充分發(fā)揮性能,滿足實(shí)時(shí)、高頻和高效的數(shù)據(jù)訪問(wèn)和處理需求。
借助這一平臺(tái),瑞金醫(yī)院針對(duì)某基因組的變異分析耗時(shí)和某腫瘤全基因組分析的時(shí)長(zhǎng)都大大降低。通過(guò)這樣的提升,此前的很多醫(yī)學(xué)設(shè)想也得以照進(jìn)現(xiàn)實(shí)。
在瑞金醫(yī)院的技術(shù)應(yīng)用實(shí)踐之外,借助AlphaFold2與GROMACS,科學(xué)計(jì)算在轉(zhuǎn)化醫(yī)學(xué)和新藥研發(fā)等領(lǐng)域的關(guān)鍵性驅(qū)動(dòng)作用也愈發(fā)明顯。前者是DeepMind提出的深度神經(jīng)網(wǎng)絡(luò)蛋白質(zhì)形態(tài)預(yù)測(cè)方法,也被稱(chēng)為迄今為止準(zhǔn)確度最高的蛋白質(zhì)三維結(jié)構(gòu)預(yù)測(cè)模型;后者則是一個(gè)分子動(dòng)力學(xué)軟件包,用于模擬設(shè)計(jì)新藥物的蛋白質(zhì)、脂質(zhì)和核酸。這些模擬為研究人員提供了所需的生物大分子結(jié)構(gòu)信息,以了解結(jié)構(gòu)與功能關(guān)系,用于指導(dǎo)藥物研發(fā)和設(shè)計(jì)過(guò)程?;陲@著提升了人工智能與深度學(xué)習(xí)性能的第三代英特爾® 至強(qiáng)® 可擴(kuò)展處理器,輔以英特爾AI套件的轉(zhuǎn)換與優(yōu)化,上述工具突破性地實(shí)現(xiàn)了23倍的性能提升,每日可預(yù)測(cè)的蛋白質(zhì)長(zhǎng)度從4.56大幅提升至105.35,這也意味著藥物研發(fā)的試錯(cuò)過(guò)程能夠被顯著縮短。因此,這一進(jìn)步也在醫(yī)藥行業(yè)大分子藥物研究領(lǐng)域產(chǎn)生了不小的震動(dòng)。
而在小分子藥物的發(fā)現(xiàn)中,以晶泰科技為代表的本土研發(fā)團(tuán)隊(duì)則更有發(fā)言權(quán)——借助阿里云第七代云服務(wù)器ECS的計(jì)算單元,以及英特爾® oneAPI提供的編譯器數(shù)學(xué)庫(kù)和優(yōu)化能力,包括GATK,NAMD,LAMMPS,RELION和GROMACS在內(nèi)的諸多生命科學(xué)領(lǐng)域的前沿應(yīng)用運(yùn)行速度大幅度提升,部分增長(zhǎng)高達(dá)60%以上,結(jié)構(gòu)晶體預(yù)測(cè)與碳化合物構(gòu)成的研究變得更加容易。對(duì)于晶泰科技們而言,這有助于研究人員更有效地設(shè)計(jì)和評(píng)估新藥,并能夠顯著節(jié)約資源。
化解隱私安全疑慮
當(dāng)一種藥物的靶點(diǎn)和化合物,包括化合物優(yōu)化完成后,新藥就已具雛形。不過(guò)距離來(lái)到患者手中,它還要經(jīng)歷六到七年的臨床試驗(yàn)階段。在臨床藥物試驗(yàn)過(guò)程中,第三代英特爾® 至強(qiáng)® 可擴(kuò)展處理器的一種獨(dú)特安全技術(shù)——英特爾® 軟件防護(hù)擴(kuò)展(SGX)——也在簡(jiǎn)化和加速流程方面發(fā)揮著重要作用。
英特爾® 軟件防護(hù)擴(kuò)展(SGX)的核心是一組指令,可提高應(yīng)用代碼和數(shù)據(jù)的安全性,從而為它們提供更好的保護(hù),以防止泄露或修改。
2020年7月,國(guó)家藥品監(jiān)督管理局發(fā)布了《新冠肺炎疫情期間藥物臨床試驗(yàn)管理指導(dǎo)原則(試行) 》,這意味著通過(guò)遠(yuǎn)程智能的臨床實(shí)驗(yàn),患者可以足不出戶,通過(guò)冷鏈配送獲取藥物,同時(shí)利用可穿戴設(shè)備完成數(shù)據(jù)的采集與上傳。在這種情況下,保護(hù)患者隱私與數(shù)據(jù)安全就可能形成一個(gè)巨大的技術(shù)挑戰(zhàn)。
但現(xiàn)在,情況出現(xiàn)了轉(zhuǎn)機(jī)。英特爾® 軟件防護(hù)擴(kuò)展(SGX)能在CPU的支持下,在內(nèi)存等特定硬件環(huán)境中構(gòu)建出一個(gè)可信安全的飛地。這種飛地獨(dú)立于操作系統(tǒng)、虛擬機(jī)以及BIOS系統(tǒng)之外,也就是說(shuō),即便這些比客戶應(yīng)用程序更底層的基礎(chǔ)軟件或系統(tǒng)在惡意攻擊中淪陷,由英特爾® 軟件防護(hù)擴(kuò)展(SGX)技術(shù)生成的飛地也可以通過(guò)基于硬件的、增強(qiáng)型的安全防護(hù)更有效地阻斷這些攻擊,盡力避免其中的數(shù)據(jù)或代碼被竊取或篡改。這有助于確保數(shù)據(jù)完整性和隱私,提供了在各方之間安全共享私有信息的工具,并創(chuàng)建一個(gè)協(xié)作、實(shí)時(shí)的臨床信息系統(tǒng)。而基于這一加密計(jì)算能力,阿里云ECS安全增強(qiáng)通用型g7t服務(wù)器持信息以更快、更安全的方式進(jìn)行共享和驗(yàn)證,相關(guān)治療方法可以更快地提供給有需求的人。
算力加速新藥落地
多年之后,終于來(lái)到新藥上市前的生產(chǎn)與流通環(huán)節(jié),算力也在持續(xù)提供著加速。
如今,制藥企業(yè)可以利用機(jī)器視覺(jué)替代檢測(cè)人員,不僅減少了在整個(gè)生產(chǎn)環(huán)節(jié)的人工成本,更提升了檢測(cè)的準(zhǔn)確率與效率。目前,通過(guò)阿里云與英特爾等公司的合作,此類(lèi)應(yīng)用已經(jīng)在部分企業(yè)率先落地。經(jīng)過(guò)簡(jiǎn)單模型與復(fù)雜特征的多重訓(xùn)練后,機(jī)器視覺(jué)與人工標(biāo)注的一致率已經(jīng)高達(dá)98.879%。
而在最終的藥物流通上,數(shù)據(jù)仍然蘊(yùn)含著大量亟待挖掘的價(jià)值。因此,大量的AI算法應(yīng)運(yùn)而生,藥物需求的預(yù)測(cè)正在成為可能。憑借第三代英特爾® 至強(qiáng)® 可擴(kuò)展處理器強(qiáng)大的AI加速能力,以及英特爾在邊緣計(jì)算上的全面布局,藥物流通行業(yè)的參與者們也得以乘上數(shù)字化轉(zhuǎn)型的東風(fēng),通過(guò)邊緣實(shí)時(shí)的計(jì)算進(jìn)行更精準(zhǔn)的預(yù)測(cè),從而制訂更科學(xué)合理的藥物銷(xiāo)售與存儲(chǔ)策略。
工具的極大豐富與快速迭代使醫(yī)療機(jī)構(gòu)與制藥企業(yè)從數(shù)字技術(shù)中獲得強(qiáng)大的助推力。借助算力與算法誕生的顆顆新藥,也正在為人類(lèi)的健康提供更堅(jiān)實(shí)的守衛(wèi)。