数学問題解答の自動評価を改善するための包括的な数学評価ツールキットを提案する。
大規模言語モデル(LLMs)を使用して高品質な数学的推論データを生成するシンプルでスケーラブルな方法、MathScaleを提案します。