The case for open computer programs

Darrel C. Ince,Leslie Hatton & John Graham-Cumming. The case for open computer programs. Nature 482, 485–488 (23 February 2012). doi:10.1038/nature10836.

http://www.nature.com/nature/journal/v482/n7386/full/nature10836.html

プログラムを使用した研究におけるソースコードの公開についての記事。コンピュータを用いた実験結果の再現性の重要度はコンピュータ科学の発展と共に高まっており、実験のコードは原則公開すべきであり、またそれを支援する環境の整備を急ぐべきだと論じている。Inceらは再現性をdirectなものとindirectなものに分けて説明し、コードの公開は妥当性の追試や不正な研究の防止に役立つだけでなくこれらの再現性を推進するための最も重要な手段だとしている。
Inceらはまた、自然言語によるプログラムの説明はどんなに詳細なものでも不十分であることを例を交えて主張するとともに、コードや実験条件の詳述が公開されたとしても条件の微妙な違いにより完全な再現性の確保は不可能であるがだからといってコードを公開しない理由にはならない(やらないより遥かにまし)とも言っている。
その後はコード公開の原則化にあたっての考えられる障害(適切なツールやリポジトリの不足、理論と実装の乖離への不理解、プロプライエタリなプログラムを含む場合があることなど)と提案(研究支援機関がコードを研究成果の公表手段に統合するためのツールやリポジトリを提供するとかジャーナルがコード公開の度合いの基準を設けるとかレビューにコードを用いた追試を含めるとか)が続く。
ここまで書いておいてなんだけど特にハッとするようなことは言ってないな。要は業績と見做されないし忙しいからみんなやらないということなんだろうけど、コードが公開されていないことで無意味に研究が埋もれていき車輪の再生産をしている事例地味に沢山ありそうだし、なんとももったいないことだなあと常々思っている。というわけで、研究で書いたコードを下の記事で公開してみる。