尋求治愈癌癥的復雜性已使研究人員困擾了幾十年。雖然他們取得了顯著的進步,但他們仍在為之戰斗,因為癌癥仍然是全世界死亡的主要原因之一。 然而,科學家可能很快就有一個在他們身邊的關鍵新盟友 - 人工智能機器 - 可以以不同的方式解決這些復雜性的問題。 考慮一個來自游戲世界的例子:去年谷歌的人工智能平臺AlphaGo,部署了深度學習的技術,擊敗了世界頂級圍棋高手韓國著名圍棋手李世石,圍棋是極其復雜的游戲,每一步的走法可能性比宇宙中星星的數量都要多。 這些相同的機器學習和人工智能的技術也可以帶到解決癌癥的大規模科學謎題中來。 有一件事是肯定的 - 如果我們沒有更多的數據可以使用,我們就無法利用這些新科技來征服癌癥。例如,許多數據資料,包括醫療記錄,基因測試和乳房X線照片,如果被封鎖,那就無法被最好的科學思想和最好的學習算法所利用到。 好消息是,大數據在癌癥研究中的作用現在已進入主要發展階段,一些大規模政府主導的基因測序計劃正在向前發展。這些包括美國退伍軍人事務部百萬老兵計劃;英國的100,000基因組計劃;和NIH的癌癥基因組圖譜,其保存來自超過11,000個患者的數據,并且通過云分析開放給任何地方的研究者。根據最近的一項研究,2025年可以測序多達20億個人類基因組。 據羿戓信息所了解,還有其他趨勢推動對新數據的需求,包括遺傳測試。在2007年,測序一個人的基因組成本1000萬美元。今天你只需要花不到1,000美元。換句話說,10年前排序一個人,我們現在可以做10000。這個影響是很大的:發現你有基因突變或患上某些類型癌癥的更高風險有時可能是一個拯救生命的信息。而且隨著投入越來越多,研究工作也面臨巨大的潛在規模。 研究人員(和社會)的一個核心挑戰是,目前的數據集缺乏數量和種族多樣性。此外,研究人員經常面臨限制性法律術語和不愿意分享合作伙伴關系。即使組織共享基因組數據集,協議通常在個體機構之間針對單個數據集。雖然目前有更大的結算所和數據庫已經做了偉大的工作,但我們需要更多的標準化術語和平臺工作來加速訪問。 這些新技術的潛在利益超出了識別風險和篩查的范圍。機器學習的進步可以幫助加速癌癥藥物的開發和治療選擇,使醫生能夠將患者與臨床試驗匹配,并提高他們為癌癥患者提供定制治療計劃的能力(赫賽汀,最早的例子之一,仍然是最好的例子之一) 。 我們相信有三件事情需要發生,使數據更可用于癌癥研究和AI程序。首先,患者應該能夠輕松地貢獻數據。這包括醫療記錄,放射學圖像和遺傳測試。實驗室公司和醫療中心應采用共同的同意書,使數據共享容易和合法。第二,在人工智能領域,數據科學和癌癥的結合點上工作的研究人員需要更多的資金。正如Chan Zuckerberg基金會為醫藥新工具開發提供資金一樣,新的人工智能技術需要為醫療應用提供資金。第三,應該產生新的數據集,重點是所有種族的人。我們需要確保所有人都能獲得癌癥研究的進展。
|