「オープンサイエンス時代における「研究・データ・出版」」鈴木親彦(2017年12月 秋季研究発表会)

Eメール 印刷 PDF

オープンサイエンス時代における「研究・データ・出版」
――「日本古典籍データセット」と「『東洋文庫所蔵』貴重書デジタルアーカイブ」を事例に


鈴木親彦
(情報・システム研究機構 データサイエンス共同利用基盤施設 人文学オープンデータ共同利用センター)


 本発表ではオープンデータの進展状況を概観しながら、報告者が現在進行形で取り組んでいるデータ公開の事例、「『東洋文庫所蔵』貴重書デジタルアーカイブ」および「日本古典籍データセット」を活用した「奈良絵本顔貌データセット」について述べる。このことを通して人文学における「データ出版」、とくにデジタル化された研究資料としての出版物が「研究データ」として扱われることによって変化する「出版」概念の可能性と課題を示した。発表者からの情報提供に加えて学会内での議論提起に重きを置き、会場とのディスカッションに多くの時間を割いた。

 「オープンサイエンス」は多くの学術分野で定着しつつある。ネットワークを利用した協力研究や集合知による知識構築はすでに認知を得ており、オープンジャーナルや公的資金による研究の最終成果の公開に関する必要性は研究者コミュニティで共有されてきている。さらにより専門的な研究に引きつけた「オープンデータ」が重要視されるようになってきた。この動きのもと、最終成果物である論文をオープンにするだけではなく、研究に利用したデータもDOI(Digital Object Identifier)を付与して公開・共有が推進されている。研究データ主体の学術雑誌出版も進んでおり、行為としては「データ出版」、成果物としては「データジャーナル」と呼ばれている。データジャーナルは日本学術会議の報告でも重要性が指摘され、日本の研究機関でも複数のデータジャーナルが刊行されるようになった。

 一方で、出版物を重要な研究資料とする日本の人文学においてはオープンデータの動きはまだ萌芽段階である。その一つの例として、報告者が所属する「人文学オープンデータ共同利用センター(CODH)」がある。CODHはオープンデータのみならずオープンサイエンスを推進することも目的としており、「オープンデータに基づくシチズンサイエンスやオープンイノベーションの実例を一般化」する取り組みもおこなっている。江戸時代の料理本を翻刻した「江戸料理データセット」のうち現代風にレシピ化したものを「クックパッド江戸ご飯」で公開し、注目を集めた。

 報告者はCODHにおいて人文学オープンデータの公開に関わっている。今回例としてあげるのは「『東洋文庫所蔵』貴重書デジタルアーカイブ」(http://dsr.nii.ac.jp/index.html.ja)と「日本古典籍データセット」を活用した「奈良絵本顔貌データセット」(http://codh.rois.ac.jp/pmjt/curation/4/)である。どちらのオープンデータも、デジタル画像の公開規格として世界的に定着しつつあるIIIF(International Image Interoperability Framework)を採用し、高解像度画像での公開を行っている。

 人文学にオープンデータの動きが取り入れられることで、人文学における研究の再現性や実証性が高まるとともに、一部の研究者しかアクセスができないために活用できなかった資源などがデータ化され、ある分野全体の研究が加速する可能性がある。これまで研究データとは考えられてこなかった、人文学研究の途中で整理され、埋もれてきた情報が共有されることで、人文学研究者自身が自分の研究方法を相対化し、あらたな発見や学際的な研究を生み出す駆動力ともなり得る。

 その一方で「出版」の観点、とくに産業構造の面から考えるとこのオープン化の動きには考えるべき点も多い。本論で示したように過去の出版物から作られたデータ(場合によってはあるページを抜き出しただけのもの)や、貴重書のような出版物そのものを研究データと考えるべきなのかという点、パッケージとしての出版物が解体される可能性などが指摘できる。

 さらには、そもそも学術情報流通のデジタル化やオープンアクセス全体の議論がある。これらについては例えばエルゼビア社を始めとする大型STM系のデジタルジャーナルのサブスクリプション問題や、ジャーナルオープン化の際の費用負担、いわゆるゴールドオープンアクセスのArticle Processing Charge(APC)問題などすでに具体的な問題に落とし込まれて議論が進んでいる。ここにさらに、データ出版と言う枠組みを導入することで、変化しつつある出版概念をさらにおし拡げる可能性もある。出版学における活発な議論とモデルの提案が必要となるだろう。

 発表後のディスカッションでは、図書館関係者や印刷関係者から産業構造の変化についての意見が提示され、今後の出版学会での議論の重要性も指摘された。