核心概念
ソフトウェア工学研究者はGitHubを自身の研究成果物(ツール、レプリケーションパッケージ、データセット)を公開する場として活用しているが、その人気度や影響力は研究分野や成果物の種類によって大きく異なる。
摘要
本研究は、ソフトウェア工学分野の主要な学会・ジャーナルに掲載された論文10,000本を対象に、それらに含まれるGitHubリンクを分析した。主な知見は以下の通り:
-
論文の約3分の1でGitHubリポジトリが公開されており、主な目的はツールの公開やデータセット・レプリケーションパッケージの提供である。
-
GitHubリポジトリの人気度(スター数、フォーク数)は大きな幅があり、一部の人気リポジトリを除いて全体的に低い。特に、ジャーナル論文に関連するリポジトリは平均的に不人気である。
-
リポジトリに寄せられる一般ユーザからの問題報告(Issue)への対応は著者側で不十分なことが多く、多くの問題が放置されたままになっている。
-
一方で、人気のあるリポジトリは論文の被引用数とも相関しており、研究成果の可視性と影響力の向上に寄与している。
以上より、研究者がGitHubリポジトリを効果的に活用するためには、リポジトリの継続的なメンテナンスと充実した説明文書の提供が重要であると考えられる。また、リポジトリの人気度と論文の影響力の相関関係を考えると、リポジトリの管理・運営に対する評価も研究業績の評価に組み込むべきであろう。
统计
研究者が公開したGitHubリポジトリの平均スター数は6.0、平均フォーク数は2.1である。
人気の高いリポジトリ(スター数10以上)では、平均スター数が21.4、平均フォーク数が2.5である。
論文に関連するGitHubリポジトリの約4割が1つもIssueを受け取っておらず、受け取ったIssueの半数以上が放置されたままである。
引用
"GitHub has significantly transformed the Open Source Software (OSS) ecosystem. It now hosts over 100 million repositories and 31 million users, mostly software developers."
"Hosting a repository on GitHub comes with certain social expectations – GitHub markets itself as a "social coding" platform, after all, in terms of community interaction and involvement, and with it the potential of mass collaboration and impact."