
編者按:2016年6月8日國務院總理李克強主持召開國務院常務會議,確定發展和規范健康醫療大數據應用的措施,通過互聯網+醫療更好滿足群眾需求。2016年6月21日,經李克強總理簽批,國務院辦公廳日前印發《關于促進和規范健康醫療大數據應用發展的指導意見》(國辦發〔2016〕47號文件)。醫療大數據產業或將迎來史上最重要的一次爆發機遇。當然,機遇與挑戰永遠并存,現實的障礙和困惑著實令人有些無從下口之感。
“我希望能和互聯網創新公司合作,來打造一個‘臨床遺傳機器醫生’,解決罕見遺傳病的診斷難題,當然這還需要基因測序公司和臨床遺傳學家的參與。只要你輸入收集到的各種基因型和表型,‘臨床遺傳機器醫生’就可以馬上幫你做出準確的診斷,并為下一步的處理給出最合理的建議和提示。”
今年年初,上海市第一婦嬰保健院院長段濤在他的個人微信訂閱號“段濤大夫”里面,發布了一篇院長日記《令人失望的互聯網創新》。上面那段話是這篇文章的結尾,也是段濤提出的一個挑戰,希望那些有創新基因的公司能夠完成這個挑戰。
春雨醫生CEO張銳也曾在自己的朋友圈里表態:“段院長的挑戰,春雨來接!”張銳認為:“未來三年,是AR和生物醫學工程聚合、裂變的大好時機。技術的創新才是源創新,春雨一直在做‘人腦訓練電腦’的淺層醫學人工智能,應用在我們的用戶自診和智能分診兩個板塊,每年節約我們的人力成本不低于1000萬,現在是時候朝著更專業的醫療縱深挺進了!”

這場隔空對話,展示了醫療領域中最先進的頭腦對醫療大數據未來應用的想象。
確實,當AlphaGo大放異彩時,人工智能確實帶給各個領域太多想象空間。尤其是在醫療領域,當Watson機器人在疾病診斷領域的能力已經可以媲美普通醫生,它也許值得人們付出更多的金錢、精力以及激情去做更多探索。
故 事
版 本 一
醫療人工智能的基礎,是醫療大數據的挖掘和應用。有關醫療大數據,這是這幾年互聯網醫療領域流傳最廣的故事。雖然每一家創業公司的模式千差萬別,但無一例外都會有一條:對大數據的挖掘和應用,雖然關于如何實現的部分往往語焉不詳。這充分反映了兩個問題:所有人都意識到了醫療大數據開發的價值,但開發的路徑卻難度很高。
于是,我們聽到的第一代醫療大數據的故事就變成了以下這個樣子:
▍有關數據來源
中國互聯網醫療可以說是白手起家,至今為止仍然不受傳統醫療體系待見。所以,早期的醫療大數據基本上都只能來自互聯網醫療公司自身的積累。這里的“早期”既指時間上的早期,又包括開發思路上的早期。那么,早期的數據來源大概有這么幾類(歡迎補充):
在線咨詢類公司——這類公司既有綜合型的,又有垂直型的。數據積累的方式上主要是通過醫患在線問診的方式,建立患者個人的電子健康檔案;
智能硬件類公司——純粹的智能硬件在醫療領域的應用日漸式微,但越來越多的醫療服務開始結合智能硬件,比如血糖、血壓、體溫、心律等,數據積累方式主要是對用戶體征數據的檢測;
基因檢測類公司——基因檢測在近兩年日趨火爆,主要是受到檢測成本降低和精準醫療的推動,門檻大大降低,使得越來越多的普通用戶能夠消費基因檢測。
科研工具類公司——雖然與醫患資源類公司一樣是收集患者的疾病數據,但科研類公司收集數據的形式、應用明顯不同,科研機構在數據積累過程中發揮了主導作用。
▍有關數據應用
在醫療大數據版本一的故事里面,之所以是早期,主要還是因為開發利用方式的早期。在這個階段,雖然關于醫療大數據、人工智能已經有了概念,但在此時能接受這樣故事的人畢竟還太少,也太遙遠。于是,版本一里面應用醫療大數據的方式基本有這么積累:
服務于醫療本身——長期以來,患者個人是不掌握自己的醫療數據的。互聯網醫療出現后,用戶可以通過手機來收集自己的健康數據,幫助醫生更好的了解自身的健康歷史;
服務于醫藥企業——藥企對數據的需求既強烈又多元,包括市場營銷需求、新藥研發需求、應用反饋需求等。因此,鑒于藥企買單欲望強烈,很多數據應用商都主動向藥企考慮;
服務于保險公司——這一點中美有些差異,美國保險公司對數據的應用主要是對醫療服務質量和費用的控制,而在我國,保險公司對數據的應用則主要是設計新的保險產品。

▍有關應用現狀?
其實在版本一的故事里,已經有一些有了很好的應用效果,比如藥物警戒,用醫療數據來彌補臨床數據的缺陷,及時反饋藥品不良反應、治療效果等;再比如保險控費,用醫療大數據控制服務質量和費用,控制和減少保險欺詐行為等。這些領域之所有比較好的應用,主要是因為藥企和保險公司的商業驅動力更強。當然,這也僅是在美國。
雖然我們前面羅列了不少有關醫療數據的來源和積累,但實際當中,這些案例都或多或少存在著問題。甚至由于這些問題的存在,版本一里面這些比較淺層次的數據應用都還處于非常遙遠的階段。
數據的完整和有效性——互聯網醫療畢竟是新興事物,用戶有接受程度和使用習慣的問題,而且硬件設備也存在功能和精準度的問題。這使得數據收集面臨著不完整且缺乏連續性的問題,而且大多數硬件設備沒有取得醫療資質,采集的數據也無法做醫療級應用。
數據處于割裂的狀態——互聯網醫療產品主要收集的是患者在醫院的健康數據,而對醫院內的數據鞭長莫及。加上醫院與互聯網醫療無法打通,這導致了醫療數據在院內院外割裂存在的狀況。而且由于醫院本身信息孤島的問題,患者在不同醫院求醫的數據也是碎片化存在。
數據規模仍然非常小——作為大數據應用,目前的醫療數據采集規模根本達不到“大”的程度。一個是很多創業公司的數據都是從頭積累,再一個是市場認知度仍然有限,最典型的就是基因檢測,很多公司的樣本量還處在幾十個、幾百個的水平。這使得目前的醫療數據基本無法實現商業化。
當然還有一個問題,段院長在他的文章里也指出了,就是醫療大數據并沒有被認真對待,或者說掛羊頭賣狗肉。我國的大多數互聯網醫療公司打的仍然是醫院號源的主意,仍然是一種快速變現的心態,也無怪乎令人感嘆,“我們多數的移動醫療創新公司還在拼命的靠補貼靠地推在拉用戶,在做掛號黃牛的生意,真的令人很失望。”
故 事
版 本 二
關于醫療大數據,最令人興奮的應用無疑還是在臨床方面。比如時下最熱門的精準醫療幾乎火到沒朋友。但精準醫療因為相對初級還跟數據應用關系不大,主要是取決于兩點:要么是技術上取得特別重大的突破,要么是概念上找到特別唬人的方法。另外一個醫療大數據在臨床上的應用,則是臨床輔助診斷,或者更遙遠一點,人工智能醫生。

在臨床上發揮機器的作用,首先需要對臨床數據的有效挖掘利用。傳統的公立醫院在這一點上是完全指望不上的,根本原因在于沒有任何激勵機制的存在。而早期醫療大數據的應用之所以對醫院敬而遠之,主要是開發難度太高。
受限于信息化程度,醫院往往處于信息孤島的封閉狀態,內部信息系統紛繁復雜標準不一,而且有大量的病例數據以紙質狀態存在。數據清洗要實現標準化、結構化的難度非常大,而且還需要打通院內院外數據的流動。
當然,這里還必須提到數據安全。美國已經不止一次爆出醫療數據泄露或受到攻擊的案例。而來自Ponemon推出的一份報告《2013年數據泄露成本研究》顯示,醫療行業的數據泄露成本最高,平均每個患者的醫療信息泄露帶來的信息安全管理成本高達233美元,遠高于零售業的78美元。而當大量商業公司在明目張膽的打著靠數據賺錢旗號的時候,臨床數據的開發確實需要非常謹慎。
▍新數據來源??
不過臨床數據開發的遲滯,仍然是造成我們的醫療大數據推進緩慢的一個重要因素。所以,在版本二的故事里,我們看到了已經有創業公司努力在臨床數據上進行探索。(歡迎補充)
臨床數據的聚合?——醫院內的醫療數據也是分散的,HIS、LIS、PACS等系統里都儲存不同類型的病例數據。因為這些系統來自不同廠商,數據標準不一,醫院內部也缺乏完整、連續的數據資料。所以,在醫院實現數據聚合成為臨床數據開發的一個小前提。已經有創業公司在這方面探索,并得到了資本市場的認可。
臨床數據的開放——當然還不是公立醫院數據的開放,而且公立醫院目前的信息系統也很難支持開放。不過,已經有很多創業公司在嘗試臨床數據開放,甚至直接開辦醫院、診所來重構底層信息系統。再加上很多SaaS模式的診所管理系統的出現,就為醫療數據的共享以及與智能硬件設備的對接創造了條件。
臨床數據去中心——很多人相信,醫院只是時代的產物,會逐漸消失,所以醫療數據也未必一定要在醫療機構內產生。隨著新技術和數據采集方式的進步,包括診療數據、研發數據等,都在逐漸突破醫療機構的邊界,進入人們的客廳、日常生活。這種數據采集的量和周期,都是醫院內數據采集所無法比擬的。

▍應用和問題??
這些在臨床數據開發方面的努力,為未來人工智能的研發創造了可能。恐怕也還只是限于可能,距離真正的應用還有一段距離。當然,在AlphaGo完勝李世石以后,人工智能所展示出的進步速度讓所有人驚艷。說不定五年后,機器人醫生就真的出現在社區診所了。但是眼下的問題恐怕還是必須要克服:
數據解讀——圍棋棋盤的可能性畢竟是可以窮盡的,但目前的人工智能還無法解決未知因素的問題。尤其是在醫療領域,不僅是未知因素的問題,甚至還有無知因素的問題。很多因素不僅醫療數據的采集范圍之外,更是在人類的認知范圍之外。不要說癌癥這種人類尚未攻克的疾病,絕大多數疾病都存在著相當多的未知因素。
數據規模——醫療數據的應用前提條件是數據規模要足夠大。其實,這一點中國的情況要比美國好多了。比如說,中國一家三甲醫院的數據量幾乎抵得上美國一個州的量。但問題是,有能力、有條件、有機會開發應用這些數據的機會太少。財大氣粗的保險公司在醫院面前都毫無談判能力,遑論弱小的互聯網醫療公司。恐怕只能指望高瞻遠矚的醫院院長,發揮鯰魚效應。

數據監管——對于政府監管來說,醫療數據的應用是個新問題。起碼至今,究竟醫療數據歸誰所有的問題都沒有明確。而一旦醫療數據被濫用,危害是極大的。一個非常簡單的道理,你的銀行卡密碼可以修改,但你的基因信息能修改么?雖然現在對基因的解讀能力有限,但是只要樣本成功采集一次,就可以無限檢測。所以如果你的基因數據泄露了,后果會是怎樣呢?
最后,可能還是野心的問題。如果已經收集到了一批數據,馬上就能商業變現,就能掙大錢,有幾個人還愿意去搞什么人工智能呢?
作者:匿名
本文已獲原作者授權

ABOUT FIRESTONE
關于火石
火石創造運用機器學習、人工智能、大數據等技術,并通過和全球頂尖研究機構、行業專家、投資機構的數據合作,構建全球首個以疾病為中心的醫健創新創業地圖——HSMAP。以此解決全球醫健領域政策、技術、人才、市場等資源的信息不對稱問題,形成全產業鏈協同的創新創業支撐平臺。

您也可以關注我們的官方微信公眾號(ID:ctoutiao),給您更多好看的內容。
2023-05-30 火石創造發布了 《火石創造攜產業大腦亮相工信智庫聯盟2023年年會暨新型工業化專題研討會》的文章
2023-05-30 火石創造發布了 《廣東省委統戰部考察團來訪火石創造》的文章
2022-08-25 火石創造發布了 《火石創造受邀參加“生物醫藥渤海論壇”,解讀CBIB 2.0及原料藥發展態勢》的文章
2022-08-22 火石創造發布了 《在一起,戰未來!火石創造7周年慶暨產業大腦3.0線上發布會成功舉辦》的文章
2022-08-19 火石創造發布了 《7年建全球產業數據中心,火石創造為60+城市、150+園區提供產業大腦服務》的文章