本論文では、化学分野向けの対話型大規模言語モデル(LLM)「ChemLLM」を開発した。従来の化学分野のLLMは、構造化されたデータを直接使用するため、自然言語対話の能力が低下していた。そこで本研究では、構造化データを自然言語対話形式に変換する新しい手法を提案した。この手法により、ChemLLMは化学分野の様々なタスクを自然な対話形式で実行できるようになった。
ChemLLMは、分子名変換、分子キャプション、反応予測などの主要な化学タスクで、GPT-3.5を大きく上回る性能を示した。さらに、GPT-4をも上回る結果を得た分野もある。加えて、ChemLLMは数学や物理などの関連分野でも優れた汎用性を発揮した。
また、文献翻訳やケモインフォマティクスプログラミングなどの専門的なNLPタスクでも高い能力を示した。ChemLLMは化学研究の新たな可能性を切り開くとともに、構造化データを対話システムに統合する手法は、様々な科学分野でのLLM開発に新たな道筋を示すものである。
Ke Bahasa Lain
dari konten sumber
arxiv.org
Wawasan Utama Disaring Dari
by Di Zhang,Wei... pada arxiv.org 04-26-2024
https://arxiv.org/pdf/2402.06852.pdfPertanyaan yang Lebih Dalam