晴時多雲

自由廣場》全民健保資料庫這個公共財

◎ 李友專

台灣全民健保實施至今已超過廿年,累積了龐大的族群就醫資料—也造就了「全民健保研究資料庫」。此資料庫擁有二三○○萬居民過去廿三年就醫資料,包括用藥、診斷、處置及檢驗檢查項目等,近年更囊括檢驗檢查結果報告及影像紀錄。這樣的醫療資料庫世上絕無僅有,與我們相似的只有北歐幾個國家,例如丹麥,其雖擁有卅年的全民就醫資料,但人口不到台灣三分之一。在人工智慧(AI)發展迅速的今天,龐大的就醫資料被視為極度重要的資料寶庫,也是驅動醫療AI革命的關鍵因子。

全民健保研究資料庫由衛生福利部資料統計應用中心管理,提供國內研究人員有限度的利用。其申請程序繁瑣且資料不易釋出,即使通過複雜且長期的審查,也只能在有限的使用時間內做相對簡易的分析。使得許多據此發表的研究論文被批評為深度不足且重複性過高。上述種種限制,多半肇因於對隱私權的保護。事實上,全民健保研究資料庫一直都不包含可識別病人身分的任何資訊,隱私不是關鍵問題。更何況現今資訊科技已能適度增加資訊模糊度,如年齡可合併成年齡層;一天可合併成一週,大大降低病人身分被重新識別的風險。

有人說台灣人口少,資料數量不足以發展AI,但在醫療領域,我們恰好擁有極度豐富的環境,提供蒐集高品質醫療資料的機會。台灣醫療資料蒐集的密度、精緻度跟標準度超越歐美等大國,是為我國醫療AI發展在世界上建立影響力的基石。若能將全民健保研究資料庫更完整方便地開放研究,台灣人工智慧在醫療應用必能跨出大步。且這麼好的醫療資料寶庫更應該與全人類共享,如能開放成國際研究公共財,讓全世界優秀的人工智慧科學家都能應用,可為全人類帶來更豐碩的醫療研究成果。

綜觀國際各種醫療大數據分享的例子,麻省理工學院(MIT)跟Beth Israel Deaconess Medical Center(哈佛教學醫院)共同釋出超過廿年的加護病房電子病歷及生理訊號資料庫MIMIC III,十多年來已造就數千篇研究論文,並成為醫學生理訊號研究人員不可或缺的重要資源。另,全球數億使用者的公開醫學文獻資料庫PubMed,則是美國國家衛生研究院(NIH)耗費四十年以上,由超過四百人的團隊每天分析所有被刊登的醫學文獻,逐一連結關鍵字所打造的龐大資料庫。全球醫藥衛生人員對PubMed的需求程度,絕不亞於一般人對Google搜尋引擎的程度。Sharing is power(分享就是力量),分享越多,得到越多,更能樹立台灣在國際人工智慧研究的能見度與地位,是不是一舉兩得呢?

(作者為台北醫學大學醫學科技學院院長、醫學資訊研究所特聘教授、台灣醫療人工智慧創新研究中心AIMHI.tw發起人)

不用抽 不用搶 現在用APP看新聞 保證天天中獎  點我下載APP  按我看活動辦法

已經加好友了,謝謝
歡迎加入【自由評論網】
按個讚 心情好
已經按讚了,謝謝。

編輯精選