中西秀彦
書誌データの機械可読性
機械可読性とは字義通りとれば,機械での文書の読み取りやすさということになる。機械可読性ということが問題になるのは,むろん文書をコンピュータで扱うことが可能になって以後の現象である。機械可読性はまずMARC(MAchine Readable Cataloging)など書誌データベースの問題として顕在化した。
現在のところ,書誌データの機械可読性をもっとも重要視した作り方をされているのはオンラインジャーナルである。オンラインジャーナルを機械可読性の視点から考えると,まず書誌データベースとリンクして検索されることと直結していることがあげられる。読む側からすれば,検索「する」ということばかりに焦点があてられがちだが,論文の側からすれば検索「される」ことが重要となる。学術論文は「引用される」ことによって評価の対象となるが,「引用される」ためには多くの研究者に「発見されて,読まれる」ことが必須となる。その意味で人間の可読性より,「検索されやすさ」に直結する機械可読性の方がはるかに重要ということになる。
機械可読性の本質,柔軟性と再利用性
文書全体のデータベース化もやはりオンラインジャーナルにおいて早くから行われ,1990年代中頃からHTML形式として提供されている。
オンラインジャーナルではXMLを利用し,SEOなどの検索対策より以上のさらに細かい文書の構造規定が行われている。文書を表現形式で直接的に規定するより,まず構造で規定し表現を必要に応じて変える方が,文書を多面的に利用できるからである。
この構造化された記述は表現の多様性を保証する以上の文書としての利用可能性を拡げる。しかし機械可読性を重視する場合,完全な構造化はむしろ行われず,XMLのような汎用マークアップ言語が使われることが多い。機械可読性の本質とは,単に特定のシステムの利用しやすさを追求しただけのものではなく,他のシステムでも使いやすくする汎用性にあるからだ。
出版編集と機械可読性
出版,特に編集作業においては,本や雑誌の文書内容の調整もさることながら,人間側の可読性を高める工夫が重要視されてきた。文書を人間がいかに扱いやすく,読みやすくするかということを中心に出版組み版は成立していた。出版社の編集現場は人間の可読性に対して非常に敏感であって,書体や組み版は一行の帰趨までも問題にするなど繊細な組み版を要求してきた。だが,これらの繊細な編集は人間の可読性にとっては有効であっても機械可読性にはかならずしも有効ではない。
機械可読性の視点からすれば,人間の可読性を高めるための表現上の工夫はむしろ文書の構造を誤って解釈させる危険性を増大すらさせてしまう。にもかかわらず,従来の出版においては機械可読性が作成段階から意識されることはなかった。
この機械可読性と人間の可読性の不整合はオンラインジャーナルの初期に顕在化した。オンラインジャーナルがいち早く普及した欧米ではオンラインでの整合性や使いやすさを優先し,かならずしも人間の側の可読性にはこだわっていない。
機械可読性の未来
今後の出版編集は,人間の側の可読性を高めるという従来通りの役割をもつが,機械可読性がさらに重要になってくると思われる。機械可読性の考慮されていない雑誌や書籍は,SEO対策のされていないウェブページと同じで,読者から発見してもらえる可能性が低くなる。同時に販促としての対策というレベルにとどまらず,文書利用そのものにおいて機械可読性が考慮されていなければ,利用価値が低下してしまうという切実な問題でもある。今後は機械可読性と人間可読性の両立しうる組み版が望まれるが,技術的な制約から当面は機械可読性が優先されるべきであろう。