中西秀彦
(中西印刷株式会社・学術情報XML推進協議会)
情報流通が,紙の本からインターネットや電子書籍に移行するにつれ,情報をコンピュータに向けてどのように記載するかが非常に重要な問題となってきている。特に学術分野では,学術内容を厳密に伝達し,引用文献との整合性を図るために,紙の時代から文書を構造化することへの要望は強かった。
構造化については,さまざまな文書規定があったが,現在,学術雑誌においてはJATS(Journal Article Tag Suite)がスタンダードとなっている。世界中の多くのオンラインジャーナルプラットホームが学術論文をJATSで記載することを求めており,この結果,学術雑誌の必須要件となりつつある。
BITS(Book Interchange Tag Suite)はJATS規格を元に書籍(Book)全般にまで規格拡張したものである。JATSは学術雑誌に特化した規格であるため,実際のXML記載において構造定義上それほど例外はない。しかし雑誌ではなくスキーマの対象を書籍全般に拡張するBITSとなるとその適用範囲はきわめて多くなり,多数の構造定義が必要となる。また日本語の構造定義にも多彩な定義が必要となってくる。
BITSはJATSと整合性があり,BITSのエレメントはほとんどJATSのエレメントと同一である。学術情報XML推進協議会からは,JATS規格にふりがな記述や「昭和」などの非グレゴリー暦記述を提案して採用された。BITSは表記においてJATSとほぼ同一であるので,これらの日本側提案はBITSにおいても採用されている。学術情報XML推進協議会ではJATSの国際化提案に引き続き,BITS Working groupに対してもBITS国際化提案を行っている。
2015年6月15日BITSに対して構造上の問題の指摘および,アジア圏の言語を扱うにあたっての以下の提案を行っている。
昨年の発表においても指摘したように,日本では奥付の記載事項が多い。これは調査したところ,日本に限らず,韓国,中国など東アジア漢字文化圏共通の現象である。奥付は書誌事項すなわち構造として重要と思われるため多数の追加規定が必要と考えられた。しかし BITSの基礎となっているJATSではElementの数を増やすことは望まれていないため,Attributeとして提案している。Elementのみの記載になっているものは,新たなElementの提案ではなく,既存Elementの適用範囲の拡張提案である。
提案したのは下記の表の通りである。
また,これは昨年も報告しているが,日本語を含めた漢字文化圏では表意文字を使用するため,文字と発音が一致せず,索引作成には特別の配慮が求められる。そこでこの問題を解消するためすでにある〈index-entry〉の下位エレメントとして〈sortkeys〉エレメントを新設することを提案した。
これらの多言語化提案は,国際的な標準が固まるまでに日本から積極的な提案をすることがのぞまれる。そうでなければ規格が決まったときには日本語表記や構造は蚊帳の外になってしまう。今後も学術情報XML推進協議会では提案を続けていくが,日本側のみなさまにも協力をお願いしたい。