不可否認(rèn),在當(dāng)今世界,人類的信息數(shù)據(jù)已經(jīng)隨著研究領(lǐng)域的擴(kuò)展進(jìn)入了指數(shù)級(jí)增長(zhǎng)的時(shí)代,傳統(tǒng)的信息處理方式存儲(chǔ)量小且反應(yīng)速度慢,大數(shù)據(jù)分析體系便應(yīng)運(yùn)而生。在當(dāng)下的科學(xué)技術(shù)逐漸成熟的今天,如何將數(shù)據(jù)分析應(yīng)用于各個(gè)領(lǐng)域,實(shí)現(xiàn)效率的跨越式提升和產(chǎn)業(yè)的升級(jí)轉(zhuǎn)型,是目前各個(gè)行業(yè)都在研究的問題。而作為研究與人類疾病、基因、微生物等相關(guān)的生命科學(xué),更是亟待有工作高效、體量更大的數(shù)據(jù)分析體系協(xié)助進(jìn)行深入的研究創(chuàng)新。
大數(shù)據(jù)邂逅生命科學(xué),創(chuàng)新轉(zhuǎn)型的契機(jī)
將數(shù)據(jù)分析運(yùn)用于生命科學(xué)的領(lǐng)域,其實(shí)已經(jīng)在世界級(jí)科技巨頭公司投入應(yīng)用并成為了大公司業(yè)務(wù)運(yùn)行的得力助手。比如微軟公司所開發(fā)的Azure Machine Learning,就是是微軟云平臺(tái)上的一款托管式機(jī)器學(xué)習(xí)服務(wù),可以幫助研究人員輕松創(chuàng)建、部署和管理監(jiān)督式和非監(jiān)督式機(jī)器學(xué)習(xí)模型。研究人員可以使用Azure Machine Learning快速實(shí)現(xiàn)生物序列分析、衛(wèi)星圖像分析、情感分析等
多個(gè)應(yīng)用場(chǎng)景,從而提高研究和分析的效率。
早在2011年,麥肯錫就在報(bào)告《大數(shù)據(jù)的下一個(gè)前沿:創(chuàng)新、競(jìng)爭(zhēng)和生產(chǎn)力》中預(yù)估,數(shù)據(jù)分析在醫(yī)療領(lǐng)域每年能夠產(chǎn)生3000億美元的潛在價(jià)值,年生產(chǎn)增長(zhǎng)率為0.7%,而且先進(jìn)的分析方法可以將標(biāo)準(zhǔn)化的疾病治療轉(zhuǎn)化為個(gè)性化的風(fēng)險(xiǎn)評(píng)估、診斷、治療和監(jiān)測(cè),個(gè)性化醫(yī)療的到來將可能改變整個(gè)系統(tǒng)利益相關(guān)者的命運(yùn)。在個(gè)性化醫(yī)療過程中,數(shù)據(jù)分析將會(huì)對(duì)醫(yī)療服務(wù)方、支付方、制藥企業(yè)和醫(yī)療設(shè)備企業(yè)等各方產(chǎn)生深遠(yuǎn)甚至是決定性的影響。
而在當(dāng)下,數(shù)據(jù)分析已經(jīng)廣泛應(yīng)用在生命科學(xué)領(lǐng)域,實(shí)現(xiàn)了數(shù)據(jù)分析個(gè)性化、海量信息的構(gòu)建、醫(yī)療服務(wù)的個(gè)性化等各種超前的服務(wù)。在數(shù)字化服務(wù)的幫助之下,生命科學(xué)開啟了以患者為中心,通過醫(yī)藥生產(chǎn)、流通、服務(wù)向產(chǎn)業(yè)鏈上下游以及高附加值服務(wù)領(lǐng)域發(fā)展。
大數(shù)據(jù)分析在生命科學(xué)領(lǐng)域的應(yīng)用
在當(dāng)下,數(shù)據(jù)分析在生命科學(xué)領(lǐng)域的實(shí)際應(yīng)用,主要體現(xiàn)在信息歸攏、糾正偏差、提高效率等方面。
合零為整
大數(shù)據(jù)分析的合零為整功能,主要體現(xiàn)在大數(shù)據(jù)分析系統(tǒng)可以自動(dòng)識(shí)別不同數(shù)據(jù)表格之間的聯(lián)系,允許客戶以查詢數(shù)據(jù)庫的方式直接操作這些表格,還可以對(duì)訪問系統(tǒng)的用戶進(jìn)行信息采集、建檔和歸類,組建一個(gè)有序的新數(shù)據(jù)庫,為進(jìn)行客戶的精準(zhǔn)需求分析和個(gè)性化醫(yī)療提供統(tǒng)一且全面的標(biāo)準(zhǔn)和依據(jù)。
比如在協(xié)和醫(yī)院所引進(jìn)的SAS數(shù)據(jù)分析軟件,就是以此來做信息庫的統(tǒng)計(jì)分析研究和具體的統(tǒng)計(jì)分析工作,包括臨床研究的數(shù)據(jù)管理和藥理中心比較分散的數(shù)據(jù)分析管理等等,大大提升了信息管理的效率和精準(zhǔn)度。
提高效率
生物科學(xué)高性能計(jì)算需要海量的計(jì)算資源,存儲(chǔ)量和計(jì)算周期都在增加;與此同時(shí),生命科學(xué)的數(shù)據(jù)分析計(jì)算往往比較復(fù)雜,對(duì)速度要求越來越高,傳統(tǒng)的手動(dòng)統(tǒng)計(jì)和區(qū)域網(wǎng)絡(luò)已經(jīng)難以滿足這種需求。因此大數(shù)據(jù)的分析系統(tǒng)的存儲(chǔ)量和效率的優(yōu)勢(shì),得以顯現(xiàn),通過強(qiáng)大的數(shù)據(jù)整合能力和大體量的數(shù)據(jù)庫儲(chǔ)存,對(duì)于用戶的指令做出快速及時(shí)的反應(yīng),簡(jiǎn)化運(yùn)算流程,降低手工運(yùn)作的復(fù)雜性。
比如金賽藥業(yè)所采用的SAS數(shù)據(jù)分析體系,在提升新藥品上市等工作中發(fā)揮了重要作用。金賽藥業(yè)相關(guān)工作人員介紹說,在SAS、CACHE等服務(wù)器所組建的軟硬件設(shè)備基礎(chǔ)上進(jìn)行的智能開發(fā),讓工作人員在同等條件下效率提升了200%,在2022年搶占新冠藥品上市的過程中,數(shù)據(jù)分析系統(tǒng)在4個(gè)小時(shí)之內(nèi)完成了top line的結(jié)果提交,12個(gè)小時(shí)成功提交所有的package,保證了新藥品搶占市場(chǎng)先機(jī)。
糾正偏差
隨著信息科技的發(fā)展,生命科學(xué)領(lǐng)域的數(shù)據(jù)庫體量將會(huì)越來越大,內(nèi)容也會(huì)越來越復(fù)雜,更需要通過精準(zhǔn)的運(yùn)作和計(jì)算糾正偏差,保障數(shù)據(jù)無誤。大數(shù)據(jù)分析系統(tǒng)的運(yùn)算過程是由特定的引擎進(jìn)行判斷和驅(qū)動(dòng),幾乎不需要人工干預(yù)人工干預(yù)度低,可以快速實(shí)現(xiàn)計(jì)算的自動(dòng)化和流程化,在這個(gè)過程中出現(xiàn)的操作異常會(huì)自動(dòng)提示,進(jìn)行人工修正或者干預(yù)。此外,大數(shù)據(jù)分析系統(tǒng)還有提前預(yù)測(cè)功能,從根本上減少出現(xiàn)錯(cuò)誤的概率,實(shí)現(xiàn)信息的準(zhǔn)確傳達(dá)和運(yùn)算。
比如在疫情期間,美國(guó)克利夫蘭醫(yī)學(xué)中心就在SAS的協(xié)助下合作創(chuàng)建了創(chuàng)新性分析模型,幫助醫(yī)院準(zhǔn)確預(yù)測(cè)患者人數(shù)、所需床位和呼吸機(jī)數(shù)量等關(guān)鍵信息,根據(jù)這些預(yù)測(cè)的實(shí)時(shí)變化,醫(yī)院和衛(wèi)生部門及時(shí)調(diào)整醫(yī)療資源分配,為新冠及其他患者提供更好的醫(yī)療服務(wù)。
大數(shù)據(jù)分析系統(tǒng),生命科學(xué)的未來“神輔助”
在信息化擴(kuò)展至全球的時(shí)代,大數(shù)據(jù)分析系統(tǒng)對(duì)于生命科學(xué)研究來說,起著越來越重要的作用。那么在醫(yī)療、醫(yī)藥、康養(yǎng)等相關(guān)行業(yè)如何能把握住時(shí)代契機(jī),通過人工智能技術(shù)實(shí)現(xiàn)產(chǎn)業(yè)技術(shù)升級(jí)和效率的再度飛躍?
SAS中國(guó)生命科學(xué)行業(yè)首席顧問顧天倫先生認(rèn)為,未來生命科學(xué)領(lǐng)域?qū)?huì)從以藥品為中心向以患者為中心轉(zhuǎn)移,讓患者更好地參與到臨床試驗(yàn)當(dāng)中去進(jìn)一步優(yōu)化設(shè)計(jì)和實(shí)施。因此,隨著數(shù)據(jù)標(biāo)準(zhǔn)不斷地完善復(fù)雜,越來越多的相關(guān)企業(yè)希望能有標(biāo)準(zhǔn)統(tǒng)一的rest API接口共大數(shù)據(jù)分析系統(tǒng)的程序員或者醫(yī)學(xué)工作者來
簡(jiǎn)化流程,提高效率。在創(chuàng)新層面來說,未來,基于臨床線、基于風(fēng)險(xiǎn)的質(zhì)量管理、醫(yī)學(xué)監(jiān)察的可視化的審核,以及藥物警戒信號(hào)的可視化管理等一系列的可視化分析都會(huì)不斷搭建,可以助力行業(yè)內(nèi)部更快的發(fā)現(xiàn)藥物安全性信號(hào),以最快的速度排查臨床試驗(yàn)運(yùn)營(yíng)過程中不合規(guī)的部分,讓臨床數(shù)字創(chuàng)新帶給患者最大的益處。這也是未來大數(shù)據(jù)分析體系在生命科學(xué)領(lǐng)域發(fā)展的主要潮流。