Concetti Chiave
Pin-Tuning 能有效解決預先訓練的分子編碼器在少量分子性質預測任務中的微調效率低下的問題,通過參數高效的上下文微調策略,在不增加大量參數的情況下,顯著提升模型在少量標註數據下的表現。
研究背景
分子性質預測 (MPP) 在藥物發現和材料科學中至關重要,但現實場景中經常面臨數據稀缺的挑戰。為了解決這個問題,少量分子性質預測 (FSMPP) 應運而生。與其他少量學習任務不同,FSMPP 通常採用預先訓練的分子編碼器和上下文感知分類器,受益於分子預訓練和分子上下文信息。
研究問題
儘管取得了這些進展,現有方法在預先訓練的編碼器的無效微調方面仍面臨挑戰。主要原因有兩個:
可調參數的數量與標記分子的稀缺性之間的不平衡:使用少量標記分子微調預先訓練的編碼器的所有參數會導致可調參數與可用數據的比例失衡。這種不平衡通常会导致過度擬合和災難性遺忘。
編碼器中缺乏上下文感知能力:雖然分子上下文被用於增強分類器,但編碼器通常缺乏感知這種上下文的明確能力,而是依賴於隱式基於梯度的優化。這導致編碼器無法直接處理在 FSMPP 任務中至關重要的細微分子上下文信息。
研究方法
基於上述分析,本文提出了參數高效的上下文微調方法 Pin-Tuning,以解決 FSMPP 中的兩個主要挑戰。
參數高效的化學知識適應方法:
針對訊息傳遞層設計了輕量級適配器 (MP-Adapter),以有效地微調預先訓練的訊息傳遞層。
對預先訓練的原子/鍵嵌入層實施貝葉斯權重整合 (Emb-BWC),以防止過度激進的參數更新,從而降低過度擬合和災難性遺忘的風險。
賦予 MP-Adapter 上下文感知能力:
將分子上下文信息整合到 MP-Adapter 中,使其能夠感知上下文,從而在微調過程中提供更有意義的適應指導。
實驗結果
在公開數據集上的實驗結果表明,Pin-Tuning 方法使用更少的可訓練參數實現了卓越的微調性能,從而提高了少量分子性質預測的性能。
研究結論
Pin-Tuning 通過創新的參數高效微調和上下文微調策略,有效解決了預先訓練的分子編碼器在 FSMPP 任務中的微調效率低下的問題,為藥物發現和材料科學領域的未來研究提供了寶貴的見解。
Statistiche
在 Tox21 數據集上,Pin-Tuning 在 10-shot 設定下實現了 91.56 ± 2.57 的 ROC-AUC 分數,相較於最佳基準模型 GS-Meta 提高了 5.64%。
在 SIDER 數據集上,Pin-Tuning 在 10-shot 設定下實現了 93.41 ± 3.52 的 ROC-AUC 分數,相較於最佳基準模型 GS-Meta 提高了 10.73%。
Pin-Tuning 所需訓練的參數數量遠少於完全微調方法 (例如 GS-Meta),例如在 Tox21 數據集上僅為後者的 14.2%。