題:
將藥品名稱映射到ATC代碼
Greg
2017-05-16 23:28:49 UTC
view on stackexchange narkive permalink

我有興趣使用 UK Biobank提供的藥物信息。為了使它們成為可用的形式,我想將它們映射到 ATC代碼。由於數據展示中列出的許多藥物都包含劑量信息,因此在藥物名稱之間進行精確的字符串匹配不是很有效。我已經考慮過使用 fuzzywuzzy之類的方法在數據展示櫃中的藥物與ATC藥物名稱之間進行字符串匹配,但是驗證匹配仍然是一個費力的過程。有誰知道可以將藥品名稱與ATC代碼或其他某些藥品本體進行匹配的工具?如果沒有,也許還有一種我沒有想到的更好的方法。

您能否添加一些藥品名稱和相應的ATC代碼示例(以防鏈接停止工作)?通常,將非受控詞彙與受控詞彙匹配起來總是需要手動檢查。
二 答案:
Michael Kuhn
2017-05-17 00:33:07 UTC
view on stackexchange narkive permalink

通過 CART工具,您可以上傳一組名稱並將其映射(可選以模糊方式)到STITCH 4標識符,然後使用這些名稱映射到ATC代碼(使用化學品來源下載文件)。這有點間接,我不確定CART將如何處理您提到的劑量信息。

Harry
2017-05-17 00:36:42 UTC
view on stackexchange narkive permalink

DrugBank似乎有一個工具將ATC代碼映射到藥品名稱和DrugBank ID。

在XSD架構上快速瀏覽一下發布頁面建議完整的數據庫包含藥品的ATC代碼,然後您可以對BioBank名稱與DrugBank的所有同義詞進行模糊匹配,或者在其他一些數據(例如規範化的SMILES)上進行匹配。

缺點是UK BioBank和DrugBank之間可能不會完全重疊。此外,DrugBank已獲得商業使用許可。



該問答將自動從英語翻譯而來。原始內容可在stackexchange上找到,我們感謝它分發的cc by-sa 3.0許可。
Loading...