Kernkonzepte
Spider 2.0は、実世界の企業向けText-to-SQLワークフローの複雑さを反映した新しいベンチマークであり、既存の言語モデルが実用レベルのSQL生成能力において大幅な改善を必要とすることを示している。
Zusammenfassung
Spider 2.0: 実世界の企業向けText-to-SQLワークフローにおける言語モデルの評価
本稿では、実世界の企業向けText-to-SQLワークフローを反映した新しいベンチマークであるSpider 2.0を提案する。Spider 2.0は、複雑なクラウドまたはローカルデータ、多様なSQLクエリ、データ変換から分析までの多様な操作など、実世界の課題を反映して設計されている。
Spider 2.0は、企業レベルのデータベースユースケースから抽出された632の実世界のText-to-SQLワークフロー問題で構成されている。データベースは、BigQueryやSnowflakeなどのクラウドデータベースシステムやローカルデータベースシステムに保存された、1,000を超えるカラムを持つ実データアプリケーションから取得されている。
Spider 2.0のタスクは、データベースメタデータ、SQL方言のドキュメント、プロジェクトレベルのコードベースの理解と検索を必要とする。モデルは、複雑なSQLワークフロー環境との対話、非常に長いコンテキストの処理、複雑な推論の実行、100行を超えることもある多様な操作を含む複数のSQLクエリの生成など、従来のText-to-SQLの課題をはるかに超える能力が求められる。