導讀:考慮到人工智能往往通過處理和分析大量數(shù)據(jù)來訓練自身,一切都可以被歸結(jié)為數(shù)據(jù)。但它們得到的數(shù)據(jù)是由人類產(chǎn)生的,而人類又是善變的,它們的判斷可能會因為與之互動的病人的年齡、性別和種族的不同而受到蒙蔽,它們自己卻并不知道這一點。
助理教授Marzyeh Ghassemi說:“如果謹慎使用,這項技術(shù)可以提高醫(yī)療保健的績效,并有可能減少不公平現(xiàn)象?!薄!暗绻覀儾恍⌒?,這項技術(shù)可能會使醫(yī)療狀況惡化?!?/p>
助理教授Marzyeh Ghassemi探討了醫(yī)學數(shù)據(jù)中隱藏的偏見如何影響了人工智能的方法。
Marzyeh Ghassemi在麻省理工學院攻讀計算機科學學位論文時,寫了幾篇關(guān)于人工智能的機器學習技術(shù)如何應(yīng)用于臨床數(shù)據(jù)以預(yù)測患者預(yù)后的論文?!爸钡轿业牟┦垦芯拷Y(jié)束,我的一位委員會成員提問到:‘你有沒有檢查過你的模型在不同人群中的作用情況?’”
這個問題讓Ghassemi大開眼界,他之前評估過所有患者模型的總體表現(xiàn)。仔細觀察后,她發(fā)現(xiàn)模型對于黑人女性所在群體的工作方式通常是不同的——尤其是更糟——這一發(fā)現(xiàn)讓她感到驚訝。她說:“我事先沒有把健康差異直接轉(zhuǎn)化為模型差異聯(lián)系起來?!??!拌b于我是麻省理工學院中一名擁有少數(shù)族裔女性身份的計算機科學家,我有理由相信許多其他人也沒有意識到這一點?!?/p>
在1月14日發(fā)表在《模式》(Patterns)雜志上的一篇論文中,Ghassemi(她于2017年獲得博士學位,現(xiàn)在是電子工程和計算機科學系以及麻省理工學院醫(yī)學工程和科學研究所(IMES)的助理教授。)和她的合著者——波士頓大學的Elaine Okanyene Nsoesie對人工智能在醫(yī)學中的應(yīng)用前景提出了警告。Ghassemi 指出:“如果謹慎使用,這項技術(shù)可以提高醫(yī)療保健的績效,并有可能減少不公平現(xiàn)象。”“但如果我們不小心,這項技術(shù)可能會使醫(yī)療狀況惡化?!?/span>
考慮到人工智能往往通過處理和分析大量數(shù)據(jù)來訓練自身,一切都可以被歸結(jié)為數(shù)據(jù)。但它們得到的數(shù)據(jù)是由人類產(chǎn)生的,而人類又是善變的,它們的判斷可能會因為與之互動的病人的年齡、性別和種族的不同而受到蒙蔽,它們自己卻并不知道這一點。
此外,醫(yī)學條件本身仍然存在很大的不確定性。Ghassemi說:“在同一所醫(yī)學院接受了十年培訓的醫(yī)生們經(jīng)常會對患者的診斷產(chǎn)生分歧。”。這與現(xiàn)有機器學習算法的應(yīng)用不同——比如物體識別任務(wù)——因為幾乎世界上每一個人都會同意狗就是狗。
機器學習算法在掌握國際象棋和圍棋等游戲方面也表現(xiàn)良好,在這些游戲中,規(guī)則和“獲勝條件”都有著明確的定義。然而,醫(yī)生并不總是能就治療患者的規(guī)則達成共識,甚至連“健康”的標準也缺乏廣泛認同?!搬t(yī)生們知道生病意味著什么,” Ghassemi解釋說,“我們在人們生病最嚴重的時候掌握著最多的數(shù)據(jù)。但我們沒能從健康的人那里獲得太多的數(shù)據(jù),因為人們在健康的時候看醫(yī)生的可能性較小?!?/p>
即使是機械設(shè)備也可能帶來數(shù)據(jù)缺陷和治療差異。例如,脈搏血氧儀主要針對淺膚色的人進行校準,但不能準確測量深膚色的人的血氧水平。當氧氣水平較低時,這些缺陷最為嚴重——準確的讀數(shù)正是最迫切的時候。Ghassemi和Nsoesie寫道,類似地,女性在“金屬對金屬”髖關(guān)節(jié)置換術(shù)中面臨更大的風險,“部分原因是植入物設(shè)計中沒有考慮到解剖學差異?!边@樣的事實可能會隱藏在輸入計算機模型的數(shù)據(jù)中,其輸出將因此受到破壞。
Ghassemi說,機器學習算法的產(chǎn)品來自于計算機,它提供了“客觀性的曙光”。但這可能具有欺騙性和危險性,因為與忽略一位可能不稱職(甚至可能帶有種族主義色彩)的醫(yī)生的建議相比,更難找出大量提供給計算機的錯誤的數(shù)據(jù)。“問題不在于機器學習本身,”她堅稱?!笆侨?。人類護理人員有時會產(chǎn)生糟糕的數(shù)據(jù),因為他們并不完美?!?/p>
盡管如此,她仍然相信機器學習可以在醫(yī)療保健方面提供更有效、更公平的建議和實踐。實現(xiàn)機器學習在醫(yī)療保健領(lǐng)域前景的一個關(guān)鍵是提高數(shù)據(jù)質(zhì)量,這不是一項容易的任務(wù)。Ghassemi說,“想象一下,如果我們能從表現(xiàn)最好的醫(yī)生那里獲取數(shù)據(jù),并與其他培訓和經(jīng)驗較少的醫(yī)生分享這些數(shù)據(jù)的話,我們確實需要收集這些數(shù)據(jù)并對其進行審計?!?/p>
她指出,這里的挑戰(zhàn)是數(shù)據(jù)收集沒有激勵或獎勵?!耙@得這方面的資助,或要求學生花時間在這方面并不容易。數(shù)據(jù)提供商可能會說,‘當我可以把數(shù)據(jù)以數(shù)百萬美元的價格賣給一家公司時,為什么我要免費提供我的數(shù)據(jù)?’但研究人員應(yīng)該能夠訪問數(shù)據(jù),而不必處理類似這樣的問題:“我在什么文件上獲得許可,才能換取你對我所在機構(gòu)數(shù)據(jù)的訪問?”
“獲得更好的醫(yī)療保健的唯一途徑是獲得更好的數(shù)據(jù),” Ghassemi說,“而獲得更好數(shù)據(jù)的唯一途徑則是鼓勵數(shù)據(jù)的發(fā)布?!?/p>
不僅僅是數(shù)據(jù)收集的問題。還有一個問題是誰來收集和審查數(shù)據(jù)。Ghassemi建議召集不同的研究群體——臨床醫(yī)生、統(tǒng)計學家、醫(yī)學倫理學家和計算機科學家——首先要收集不同的患者數(shù)據(jù),然后“專注于開發(fā)公平合理的醫(yī)療保健改進措施,不僅可以在一個先進的醫(yī)療環(huán)境中部署,而且可以在廣泛的醫(yī)療環(huán)境中部署?!?/p>
她說,文章的目的不是阻止技術(shù)專家將他們在機器學習方面的專業(yè)知識帶到醫(yī)學領(lǐng)域中?!八麄冎皇切枰J識到治療中出現(xiàn)的差距,以及在批準某一特定計算機模型之前應(yīng)該考慮的其他復(fù)雜因素?!?/p>