中西秀彦
(中西印刷株式会社・学術情報XML推進協議会)
JATSの多言語化と日本からの提案
JATSはJournal Article Tag Suiteの略であり、学術雑誌を記述するためのXMLの文書型定義(DTD)である。現在、NISO規格(ANSI/NISO Z39.96)となっており、世界中の多くのオンラインジャーナルプラットホームが学術論文をJATSで記載することを求めている。この結果、学術雑誌の事実上のスタンダードとなっている。日本でも、公的なオンラインジャーナルプラットホームである科学技術振興機構のJ-STAGEが2012年のバージョンアップ以後、データ入稿にJATS形式での記載を指定しており、日本でも急速に重要度が増している。
ただし、JATS0.4を実際に日本語に適用したところさまざまな不備が明らかになり、その後の討議を経て、ふりがな記述を可能にした〈ruby〉エレメントや年号表記を可能にした〈era〉エレメントが追加されて、現在はバージョン1.1となっている。
汎用〈emphasis〉エレメント提案
2015年4月、中西は、JATS0.4を使用した日本語表記とオンラインジャーナルへの展開例をJATS Conで発表した。その中で、今後の課題として、傍点エレメント、縦書きエレメント、割り注エレメントの提案を行った。この段階では、公式な提案ではないが、肯定的な反応をえた。2015年10月にアジア地域でのJATS普及を目指して、JATS Con Asiaが開催されるが、そこで、オーストラリア人であるが、スリランカ生まれのChandi Pereraから多言語翻訳環境においての表現について、我々と同じ問題意識をもっていることを知った。
そこで、学術情報XML推進協議会では、JATS Standing Committeeに対して、単に日本語に使用されるだけの傍点(圏点)エレメントではなく、言語間で汎用の〈emphasis〉エレメントを提案することとし、2016年8月31日に提案書を提出、正式に受理された。
〈emphasis〉エレメントは個々の表現を規定する物ではなく「強調」しているという構造を表記している。どのような言語であろうと、地の文より「強調」されていることがエレメントひとつで表される。
〈semantic〉エレメント提案
また〈emphasis〉エレメントだけでなく〈semantic〉エレメントを提案している。これは〈bold〉や〈italic〉を強調という構造としてのみとらえたのでは、特別な意味づけを失うことに対応した提案である。たとえば〈italic〉とすることで、属名(生物学)をあらわすという例では本来、記述上の表現にすぎない〈italic〉に「属名」という「意味」を持たせているのであって、これは正確には意味タグで表記すべきである。特に国際化にあたっては、それぞれの「意味」を明確にしておかないと、意思疎通や、書誌情報の共通化に支障が出ると考えられる。そこで、〈bold〉や〈italic〉の「意味」エレメントとしての役割を解体し、〈semantic〉というエレメントととする提案をやはり2016年8月31日に行った。
提案結果
2016年8月31日提案は数回の討議を経て、2017年3月10日正式に拒絶された。しかし、拒絶されたといっても、全面的に必要性が認められなかったわけではなく、その考え方は別のかたちで受け入れられた。
〈emphasis〉についてはいったん〈script-emphasis〉というあらたなエレメントの導入が承認されたと伝えられたが、最終的に討議の結果、これは覆され、〈styled-content〉という既存のエレメントを使いまわすことに落ち着いた。ただし、@style-detailの導入により、詳しい強調記述が可能となり、実質的に圏点表現が可能となった。これでJATSにおけるアジア系言語への対応の幅が拡がった。また結論コメントの中で「日本、韓国、タイ、中国、アラブ、アルメニア等の言語でラテン系言語にない強調指示が必要なことを理解する。」という表現が記載され、非ラテン系言語にたいして理解が示された。
〈semantic〉については〈named-content〉を用いるとされたものの新規に導入されたアトリビュートである@vocab、@vocab-identifier、@vocab-term、@vocab-term-identifierを準用することにより、実質的にセマンティックの記述が可能となった。
XMLのタグによる可塑性を充分に発揮したものと考えられるが、スキーマとしてはわかりにくくなった印象がある。しかし、〈semantic〉エレメント導入は、今までのJATS記述体系を根本的に変えてしまう可能性があり、やむをえないと思われる。
結語
JATS規格の日本からの提案グループに関わりだして5年がたった。今回、はじめて提案の策定からその決定までに立ち会った。ここで、世界への提案とは「日本」の独自性を認めさせることではなく、「日本」の独自性を世界の中で位置づけ、差異ではなくむしろ他国との共通性を見いだすことであることを学んだ。そして「日本語にはこういう表現があるから認めろ」ではなく、「欧米系言語以外の言語体系で、このエレメントを導入することで多くの言語の表現が可能になる」と他国をまきこむという方略をとった。
結果として、全面的に採用にはいたらなかったわけだが、JATS Standing Committeeには誠実に対応していただいたように思う。現在あるJATS体系の中に矛盾なく当方からの主張が盛り込まれたことは評価してよい。