農林漁牧網

您現在的位置是:首頁 > 林業

虧損十年,沃森醫生終棄療

2022-08-22由 澎湃新聞客戶端 發表于 林業

病理報告準確率是多少

原創 趙泓維 動脈網

虧損十年,沃森醫生終棄療

2月18日,華爾街日報傳出訊息,國際商業機器公司(International Business Machines Corp。)正在思考如何幫助IBM脫手Watson Health。接下來,Watson可能被出售給私募股權公司、醫療行業企業,或與一家特殊目的收購公司(SPAC)合併。行至此處,IBM實屬無奈。

簡述Watson Health的發展史,最早可追溯至2011年。那年,擁有一定自然語義分析能力的IBM 將醫療作為人工智慧科研轉化的核心,開啟了Watson Health的漫漫旅程。整個AI的訓練過程中,Watson先後師從紀念斯隆-凱特琳癌症中心(MSK)、妙佑醫療國際(Mayo Clinic)、奎斯特診斷公司(Quest Diagnostics)等全球知名醫學研究機構。放在國內,這稱得上是帝皇級的待遇。但直到故事結尾,Watson還是沒有成為一介名醫。

2017年與德克薩斯大學MD安德森腫瘤中心合作破裂是整個夢想幻滅的關鍵轉折:為了培養IBM想象中的虛擬醫生,MD中心全額支付了IBM 6210萬美元的研發費用,待海量資金燒盡之後,Watson仍然無法有效應用於臨床,而本已存在資金問題的MD中心更是深陷財務泥沼。

至那以後,受挫Watson便啟動了多次大規模裁員,在衰落的道路上一去不復返。今日再談起Watson,國內一名涉足於此的經銷商不願多言,只是透露道:“這兒的每個人都認為,這是一個失敗的產品。”

從舉世矚目到黯然消亡,Watson生存於醫療領域的十年是醫療AI發展的縮影。燒掉數百億美元,Watson到底為我們買來了怎樣的教訓?

十年耕耘,Watson到底做出了什麼?

回到Watson進入醫療領域那一年,當IBM 為其立下遠大前程後,它接觸的第一個老師便是大名鼎鼎的紀念斯隆-凱特琳癌症中心。老師的專業決定了學生的能力,以腫瘤治療著稱的MSK自然主導了Watson的風格;加之IBM自身轉變為“認知解決方案雲平臺公司”,Watson被要求成為一名“用下一代 AI認知技術應用於癌症治療”的虛擬醫生。

順著這一圖景,IBM Watson Health先後開發了三個獨特的癌症治療解決方案,輔助全球各地的醫生對患者進行診治,分別是Watson腫瘤解決方案(Watson for Oncolgy);Watson臨床實驗匹配解決方案(Watson for Clinical Trial Matching)與Watson基因解決方案(Watson for Genomics)

三個方案名字諱莫如深,但內容理解起來很簡單。第一個Watson for Oncology是IBM賣得最好的產品,意在為患者提供多種治療方案,並可擴充腫瘤專家自身的專業知識;第二個Watson for Clinical Trial Matching 用於幫助藥物臨床試驗尋求合適的患者;第三個Watson for Genomics 則是用基因測序技術,對腫瘤進行精準治療。

IBM對於AI的洞察力毋庸置疑,即便放在今天,這三個目標仍然是AI應用的主要方向,也依然極具挑戰。因此,問題還是出在產品本身。

AI之內:有限的市場與缺失的邏輯

先談最為重要的Watson for Oncology,這是一個類似於單病種CDSS的產品,意在給定患者文字及影像資訊,結合Watson已經學會的知識(包括乳腺癌、肺癌、直腸癌等13個癌種)進行多輪判斷,最終輸出結果,其具體處理邏輯如下。

虧損十年,沃森醫生終棄療

在實際之中,Watson的診斷流程大致可分為四步,分別是:

1。 輸入醫療記錄,將患者多個時間節點的診斷資料輸入系統,包括結構化資料(電子病歷等)和非結構化資料(影像等);

2。分析醫療資料,檢索已有知識圖譜,並對輸入的醫療資料進行查詢與分析,最終為每一位患者提供多種可能有效的治療方案;

3。 方案排序,按照可信度指標為各種治療方案排序。

4。 輸出結果,最終患者拿到手的,是一本內容豐富的癌症治療方案建議報告。其中,包括幾種推薦方案、考慮方案和不推薦方案,並註明採用此方案的生存率、不良反應發生率、藥物相互作用這些相關資訊,幫助醫生、患者瞭解該方案的療效與風險。

Watson透過不斷調整其內部處理程式來“學習”,以便在某些問題上得到高機率的正確答案,例如放射影象揭示癌症。正確的答案必須是已知的,這樣系統才能被告知,何時做對了什麼,何時做錯了什麼。系統能夠處理的訓練問題越多,命中率就越高。

但是,假若資料本身具有一定問題,Watson基於問題知識的診斷自然也會存在問題。

對於依賴於知識圖譜的AI而言,知識的廣度與準確度決定的AI本身判斷的精準程度,但若沒有對知識進行充分描述,訓練出的AI便會出問題。舉個例子,如果知識A告訴Watson長時間住院容易產生深靜脈血栓,知識B告訴Watson住院不是產品深靜脈血栓的根本原因,人能夠很容易分清兩句話的邏輯,但AI不行。此類具有邏輯矛盾的描述一旦多了起來,AI輔助診斷的準確率便會下降。

另一種問題來源於資料本身的錯誤。如果我們發現一個患者的診斷結論為卵巢癌,而患者性別為男,還會用這個資料做進一步的臨床研究嗎?如果我們發現病理報告彙總中當天來檢查的二十多個患者的生日全部是同一天,這得是多麼大的“緣分”?在所有的NLP技術模型構建之前,必須要解決這些與正常的醫學邏輯、常識邏輯相違背的問題 。

第三個問題是缺乏尋找隱藏在已有資料外的知識的能力,舉個例子,在患者的“一述五史”中,研究人員需要提取一個欄位名稱叫做“是否有吸菸史”,因此他們需要標註的結論是“是”或者“否”,而這兩個字在病歷中是不直接出現的,那就需要拆解邏輯,要明確從病例中識別出什麼,最終判斷這個是否吸菸的結論。

Watson對於上述三個問題並沒有給出很好的解決答案。相反,IBM耗費40億巨資收購了Explorys、Phytel、Merge Healthcare等資料公司,合作多個著名醫療機構……重重努力有力擴充了Watson的知識量,卻沒有有效提升Watson的邏輯能力。

此外,Watson的根“資料”出於MSK。雖然IBM意在全球,但是MSK的診斷風格或許不能適用於每一區域。以中國為例,生活、飲食習慣乃至基因差異決定了診斷的差異,本土化不足的Watson很難適應這樣的變化,給出準確的診斷結果。

不僅如此,從Watson的推理過程看來,其分析過程需要結合結構化的病歷資料與非結構化的影像資料,需要AI處理異構資料。這在國內一般被分為AI的兩個階段,每個階段均有各自的AI負責運算,Watson有些操之過急。因此,即便擁有影像AI公司Merge Healthcare的助力,至少在國內的醫生看來,Watson沒有交出一張好的成績表,只能在診斷中給出標準的、醫生能力範圍內的建議。

不過,儘管缺乏有效的AI邏輯、缺乏自動化的資料質量問題發現演算法,Watson的知識圖譜仍具備很高的價值。Watson顯然看到了這一點,用於幫助藥物臨床試驗尋求合適患者的Watson for Clinical Trial Matching 與用基因測序技術對腫瘤進行精準治療Watson for Genomics便是Watson價值的證明。

相對於偏向醫生端的輔助診斷,這兩個產品對邏輯推理的要求較低,更注重文獻、資料的豐富程度,Watson完全能夠滿足這樣的條件。但問題也在於此,如果條件太低,企業便無法構建充分的競爭力。這裡的問題在於市場有限,且資料庫是醫療大資料公司的基礎,競爭對手眾多。國內的HLT、浪潮健康都有提供與Watson for Clinical Trial Matching一致的業務,而Watson for Genomics所處的市場則對AI要求不高,位於上游的測序機構更具備話語權。

AI之外:過度的包裝與存疑的商業模式

過度的包裝導致醫療AI常常被人詬病,在這一方面,Watson算是開了一個糟糕的開頭。從2011年美國智力競猜節目《危險邊緣》中擊敗兩位歷史上最優秀的選手後,IBM放出了“人類將會被取代”的豪言,乃至到了2019年,還有不少醫療人工智慧企業家,仍在強調自己做的AI,“不是要取代醫生,而是要賦能醫生”。

這個錯誤包含兩方面的問題,一是給了投資人、醫生乃至醫院過高的期待,加大了產品存在缺陷時採購者的心理落差;二是產品沒有遵循“以人為本”的設計理念,難以進入實際臨床流程,不能實際為醫生減壓賦能。

其次是營收問題。根據本次華爾街日報給出的資料,Watson年營收為10億美元,這一數字多少有些奪人眼球。

我們不妨借用2019年資料簡單計算一下。目前醫療AI 頭部創業公司的營業收入在一個億人民幣左右,AI獨角獸雲知聲年收入2。19億元,依圖科技年收入7。17億元,衛寧健康營收19億元……眾多公司加起來才能湊夠IBM Watson Health全球65億元的營收。

再看一組資料,《華爾街日報》曾透露,Watson Health產品組合中最大的AI產品是Watson for Oncology,IBM通常向每位患者收費200至1000美元,在某些情況下還需要諮詢費;據《數智物語》報道,2017年百洋醫藥集團董事長付鋼在接受記者採訪時曾表示,使用Watson腫瘤解決方案均自費,價格是4500元/例。而IBM給出的資料是,至2018年6月底,使用Watson for Oncology的患者數量為84000名,以20%的患者增長率計算,Watson for Oncology的患者端大概能夠為IBM帶來5。5億元的總共收入,遠低於每年10億美元這一數字。

2018年11月,處於衰退狀態的Watson在國內的落地情況是43個城市近80家醫院,略低於頭部AI公司,按照這一數字計算,Watson帶來的收入距離其百億級的投入,還有很長距離。

還有一個問題不容忽視:為什麼患者會想要一個昂貴的虛擬醫生,而非平價的主任醫生進行診斷呢?

百億美金燒出了什麼教訓?

內外之下,我們大致可以將Watson存在的問題歸納於4點。

一、在大規模的收購過程中,Watson的人員嚴重冗雜。在MSK事件後,Watson事業部裁員50%至70%,被裁員工主要來自收購的三家公司Phytel、Explorys和Truven。

二、診斷準確性、安全性存疑。2018年,IBM內部檔案流出,多個案例均暗示Watson Health缺乏準確與安全。實際上,綿綿十年,Watson也沒有透過FDA的審批,IBM也未發表任何科學論文,證明該技術如何影響醫生和患者。

三、資料集存在問題。資料集存在認知偏見,缺乏有效的邏輯推理,缺乏質控、缺乏本土化最佳化。

四、虛擬診斷為偽需求,“燒錢的醫生”不掙錢。

如今戰略轉向AI與混合雲,IBM拋棄Watson這一棋子已成為必然。但是,Watson的沒落並非AI的沒落,起伏十年,我們能從中看到許多有價值的東西。

首先是對於AI的定義。習慣了“網際網路+”的我們常常用“AI+”來定義其醫療應用,但網際網路本身便是一個場景,而目前的AI,僅是某一醫療場景中的某一應用,是服務於該場景的技術,更為準確的說法為“+AI”。換句話說,我們應該根據具體的醫療場景定製需求,而非做好一個AI演算法,強行將其置於某一AI流程之中。

這樣的好處顯而易見。從資訊化的產業發展可知,醫療需要AI,但又沒有那麼需要AI。從現在的資訊化政策來看,各類評級強調了資料的收集、整理、清洗、上報、分析、質控,很多過程依靠人力難以實現(尤其是分析、質控),必須利用基於NLP的知識圖譜的資料進行處理。這些領域之中,我們通常不談AI,但AI卻已成為新一代資訊系統不可或缺的一部分。

再談知識圖譜。大規模臨床電子病歷要真的發揮其價值並不能如Watson一樣進行簡單的堆疊許欸小,而是需要解決很多問題。在這之中,資料質量治理問題、資料結構化資訊提取問題、資料歸一標準化問題都非常難以處理。這些問題的解決單純靠人工是無法規模化的,必須用自然語言處理技術作為支撐。這裡不僅需要自然語言處理的演算法技術、計算技巧和工程能力,更需要很強的醫學背景知識。因此,要實現有效的診斷,必須一一解決上述問題,構造出有效的邏輯。

*封面圖片來源於IBM官網

原標題:《虧損十年,沃森醫生終棄療》