Google AlphaMissense 預測結構變異
在 2023 年,Google DeepMind 發表了 AlphaMissense,震撼了整個基因定序領域,它利用 AlphaFold 對蛋白質結構的深刻理解,成功預測了人類所有可能的 7100 萬個錯義變異 (Missense Variants) 的致病性。
如果要簡單的理解 AlphaMissense 的邏輯,應該可以這樣理解,「破壞結構 = 致病」, 它不依賴人類的標註資料 (ClinVar),而是學習「什麼樣的氨基酸序列能形成穩定的蛋白質結構」,也因此,如果一個變異的蛋白質結構崩塌,那它就有很高機率是致病的 (Pathogenic)。
有興趣的可以去回顧一下這篇多年前的大作,AlphaMissense Paper: Cheng, J. et al. “Accurate proteome-wide missense variant effect prediction with AlphaMissense.” Science (2023).
Google 雖然釋出了分數,但原始檔案非常大,最快的使用方式是透過 dbNSFP (Database for Non-synonymous SNPs’ Functional Predictions),因為 dbNSFP 的最新版已經整合了 AlphaMissense。(還好我2026年才玩到?XD)
前置作業:
VEP (Variant Effect Predictor)。
dbNSFP 資料與插件:包含 AlphaMissense 分數。
# 下載 VEP 映像檔
podman pull ensemblorg/ensembl-vep:release_110.1
# 下載 dbNSFP4.7a (包含 AlphaMissense)
wget https://dbnsfp.softgenetics.com/dbNSFP4.7a.zip
unzip dbNSFP4.7a.zip
# 壓縮並建立索引
for chr in {1..22} X Y M; do
bgzip dbNSFP4.7a_variant.chr${chr}
tabix -s 1 -b 2 -e 2 dbNSFP4.7a_variant.chr${chr}.gz
done
執行註釋
我們使用 VEP 的 dbNSFP plugin 來提取分數。
podman run --rm -v $(pwd):/data ensemblorg/ensembl-vep:release_110.1 \
./vep \
--input_file /data/input.vcf \
--output_file /data/output_alphamissense.vcf \
--format vcf --vcf \
--fork 4 \
--cache --dir_cache /data/vep_cache \
--plugin dbNSFP,/data/dbNSFP4.7a_variant.chr1.gz,AlphaMissense_score,AlphaMissense_pred
參數說明--plugin dbNSFP呼叫 dbNSFP 插件。
AlphaMissense_score致病分數 (0-1)。越接近 1 代表越致病。
AlphaMissense_pred預測結果,P (Published Pathogenic), B (Benign), A (Ambiguous)。
解讀結果
在輸出的 VCF 中,您會看到類似這樣的標註:
CSQ=...|AlphaMissense_score=0.98|AlphaMissense_pred=P|...
Score > 0.564: 被歸類為 Pathogenic (P)。
Score < 0.340: 被歸類為 Benign (B)。
這給了我們一個強大的篩選依據:如果一個 VUS 的 AlphaMissense 分數高達 0.9,那麼它致病的可能性就大幅提升了。
雖然Deepmind 已經陸續推出各種deep家族工具,不過AlphaMissense 能夠對於VUS的內容多了幾分判斷的證據,在臨床上還是能夠提供很大的效益,後續再陸續把近期測試的一些tool內容更新上來。

Top comments (0)