International ISBN Agencyは電子書籍のIDをどう考えてるのか?

少しギョーカイに詳しい人なら、表題の問いには即答できるはずです。

日本図書コード管理センターの、Web上のデジタルコンテンツに対するISBN付与の基準

にあるように、

「とにかく個別にISBNを振る」

というのがその答えです(ちなみに、一番最初に公表された文書としては、2005年5月の「電子書籍に対するISBN付与基準 」というのもあるんですが、上記の2011年版はこれよりも一層ハードコアに「個別」を強調していますね)。

なお、International ISBN Agency発表の一次資料は↓こちらからが見つけやすいでしょう。

国際ISBN機関、電子書籍とアプリへのISBN付与についてのガイドラインとFAQを公表 | カレントアウェアネス・ポータル

しかし、少しでも現場を知っている人なら、上記ガイドラインは「絵空事」にすぎない、ということもご存知のはずです。

一つの「本」は、XMDF/.book/ePub/PDFの形で電子書籍化され、モバイルブックジェーピーやビットウェイに卸されたり、パピレスやkinoppyやボイジャーストアで(DRMをかける等の加工を経て)販売されます。紙の「本」から電子書籍を作るだけでも大変なことになるのに、さらに「分冊」や「合本」も自由自在ですから、それらの電子書籍にもISBNを振ります。それらにも、流通先の数だけ、さらにかけ算でISBNを振ります。

このように、すべてのファイルに、ISBNを出版社が振る、というのは、割り当てられている桁数から言っても、手間とその見返りから言っても、限りなく不可能な作業です。

もちろん、コードを付番する組織としては、「まあ、適当でいいよ」と回答するわけにはいかないので、論理的帰着として「すべてにISBNを」をいう見解を出しているのだと思われますが、あまりにも現状との乖離に無関心な、「冷たい」文書である、というのは衆目の一致するところかと思います。そして日本では、少くともいわゆる「大手」出版社においては、このガイドラインは完全に無視されています(あるいは、付番状況が外部には公開されていません)。

どうしてこうなった(AA略)」、であります。

というか、(日本における)電子書籍元年から結構経ちますが、こんな状況でいいんでしょうか。現場は、まあ、回さなきゃしかたがないので、「こんな状況」でもなんとかやっているわけですが、ルールを決めている人達は、「本当にこれでいい」と思っているんでしょうか?

……といったことを漠然と考えながらネットをさまよっていたところ、以下の動画を発見しました。

「電子書籍の識別子(ID)問題を掘り下げる– ISBN, ISTC, DOI etc.」
Drilling down into eBook identifiers – ISBN, ISTC, DOI etc. | River Valley TV

講演者は当時(2010年12月2日)International ISBN AgencyのExecutive DirectorであったBrian Green。ずばり、「中の人」です。

内容を正確に追いたい人は動画を見ていただくとして、お急ぎの方向けに、ここでは私が「グッときた」部分だけ超訳(古いなあ。。)しつつ解説したいと思います。

識別子の役割は「曖昧さをなくすこと(Disambiguation)」と「つながりを明示すること(Collocation)」(【スライド1】より)

ここはきわめて重要です。この部分をおさえないことには、電子書籍の識別子をめぐる状況がなぜこんなに混乱しているのか、という議論が成立しないので、ややくどくなりますが強調したいと思います。

ある商品を指し示す識別子が重複したり、逆に一つの識別子が複数の商品を指し示したりする場合、それは識別子としては機能しません。「識別子はユニークである」。これはシステムを設計する際のゴールデンルールです。

(蛇足ながら、もし、識別子がユニークとは言い難い状況にもかかわらず、システムを設計せざるを得ないとしたら、その識別子は「なにか他の事象」を指し示している、と定義・解釈しなおすべきでしょう。)

一方、それと同時に、識別子の適用を厳密にすればするほど、「よく似た別のもの」が大量に発生します。たとえば、ある作品の

・紙の本
・電子書籍(ePub)
・電子書籍(PDF)
・電子書籍(XMDF・自社サイト直販)
・電子書籍(XMDF・書店B ※ストリーミング形式)
・電子書籍(XMDF・書店C ※書店独自のDRMあり)
……

がすべて別個の識別子を持つ、というのは逆に不便なシーンが多いのではないでしょうか。たとえば、自社サイトのオンライン目録で表示する際、これらは「一つの作品」としてまとめて表示したいでしょうし、印税の管理なども「作品」単位でできた方が何かと便利そうです。「よく似た別のもの」がせいぜい「単行本と文庫本」「初版と増補改訂版」程度だった時代とは違い、電子書籍においては、「(大量の)同じもの」のつながりを明示できるシステム、というのもまた必須、なのです。

書籍流通においては(FRBRになぞらえて言うなら)、「作品(Work)」「体現形(Manifestation)」「個別商品(Item)」の三層構造で管理すべき(【スライド3】より)

流通サイドの人からFRBRの話が出るとは思いませんでしたが(スライドではいそいで「FRBR」の表示を引っ込めるあたり、いろいろな方面に気配りしたんじゃないか、と邪推したりしていますが)、とにかく、識別子の役割分担をはっきりさせて、「階層化しようよ」ということですね。データベース屋的に言うと、「正規化しようぜ」ということだと思いますが、いずれにしろ単一の識別子ではなく、複数の識別子が連携した「システム」で管理すべき、ということを、はっきり述べています。

それら三層のための識別子は「ISTC」「ISBN」「RFID」となる(のではないか?)(【スライド3】より)

さらに言うと、この流れで(まだまだデファクトとは言えない)ISTCを持ち出すとは、かなり「攻め」ている印象を受けます(ただ、現時点で上述のような構図にうまくはまるピースとしては、ISTC以外は考えられないんですよね……)。

ISTCで「作品」の同定をして、「個別銘柄」はISBN、その先の「個別商品」(電子の場合、ダウンロード商品でない場合はどうなるのか、という議論もありそうですが)はRFID等で管理すべきでは、という提案をしています。

2008年の新ルールによって……「ありとあらゆること」が起きて、ISBN導入以前のような混乱が起きている(【スライド9・10】より)

「2008年の新ルール」というのは、ズバリのソースを見つけられていないのですが、 E-books and ISBNs: a position paper にある、“E-Books and ISBNs: a position paper and action points from the International ISBN Agency” の中の、

the International ISBN Agency issued a guideline in April 2008 allowing ISBNs to be assigned by e-book resellers (primarily wholesalers), in limited circumstances where publishers will not provide their own ISBNs and the reseller judges that a unique identifier is essential.

というくだり、つまり、「(出版社がちゃんとやらない場合、)ISBNを流通業者がつけてもよい」ということを指しています。何か強烈にトラブルの匂いがプンプンしますが、案の定……ということで、Brian氏は現状をかなりネガティヴに捉えている、ことは間違いなさそうです。いやー、このガイドライン、日本ではどういうわけか浸透していませんが、浸透しなくて良かった。本当に良かった。

というわけで、2010年の時点で、ISBNの「中の人」は、ISBN Agencyの原則論を再確認しながらも、現状が極めて「うまくいっていない」ことに自覚的で、書誌メタデータの「階層化」(もっと具体的に言うと、ISTCの導入)に積極的である、ということはほぼ断定して良いのではないかと思います。

で、ここまで理屈を詰めていくと、結局ISBNの桁は絶対的に足りない、という問題に突き当たるわけで、三層構造の二番目、はDOIにせざるを得ないのでは、という気が禿しくするわけですが、さすがにそれを認めてしまうとISBNの中の人としては自己否定になってしまうのでそこには言及できなかったのではないか、と。

ただ、この方、ISBN Agencyを辞して、現在はEDItEURにいらっしゃるんですよねえ。ということは……(これ以上いろいろ書くと憶測に憶測を重ねることになるんで、控えます)。

なお、DOIについては、「本」をさらに「章」「節」に分けて流通させたい場合に使えばいいんでない? として補足的に述べるに留まっています。にもかかわらず、表題に盛り込むあたりはなかなか戦略的ですね。

というわけで、出版業界は、ISBNを管理・運営する立場に過ぎないInternational ISBN Agencyとは適度に距離を置き、主体的に電子書籍の識別子(ID)およびその管理運営方法を模索する必要があるのではないか、というのが現在の結論なんですが、まずはISTCのレジストラになる方法とか、マジで考えないとイカンかもしれませんね〜。

↓以下、講演で使用されたスライドの書き起こし、です。(通し番号は、私が勝手に振ってます)

【スライド1】Why do we need identifies?

– Why do we assign identifiers?
— Disambiguation — to distinguish things that are not the same
— Collocation — to bring together instances of the same thing
– What does “the same” mean?
— Whether things are or are not the same is always contextual
— For example, an ISBN identifies a class of individual instances as being “the same” for particular purposes — meaning is not universal
– Why does this matter?
— Unambiguous communication… particularly from machine to machine

【スライド2】When do we need standard identifiers?

– When there is a need to communicate across organizational boundaries — within any sort of “supply chain” …
– …particularly where anyone in the supply chain needs to manage and aggregate informatino from multiple sources
– What matters about standard identifiers?
— That their semantic should be clear to everyone…
— …in other words, everyone in the chain knows what type of thing they are identifying

【スライド3】“What matters is that everyone in the chain knows what type of thing they are identifying”

※図版につき、省略

【スライド4】“Disambiguation — distinguishing things that are not the same”

– Under “Rules of assignment”, the 2005 revision of the ISBN standard (ISO 2108) says:
— Different product forms (e.g. hardcover, paperback, Braille, audio-book, video, online electronic publication) shall be assigned separate ISBNs
— Each different format of an electronic publication (e.g. ‘.lit’, ‘.pdf’, ‘.html’, ‘.pub’) that is published and made separately available shall be given a separate ISBN.
– Seemed adequate at the time but file format is not really, in itself, anappropriate indicatior of different products

【スライド5】What differentiates e-book products?

– ability to render book
— Does it work on my device/platform/software?
– User’s experience and usage rights
— What can I do with it?
– File format is only part of the story. DRM is what really differentiates e-book products and platforms
— Can you really say that an e-book available without DRM is the same product as one with restrictive DRM, just because the content and file format may be the same?
– A product needs a separate identifier if anyone in the supply chain needs to identify it separately

【スライド6】Why identify separate e-book products?

– To ensure that the e-book ordered is the correct one for the user’s e-reader deviece and/or software platform
– To enable bibliographic databases to provide information about the different available versions of an e-book
– To facilitate electronic trading of e-books, particularly where multiple formats are sold through the same channel
– To facilitate product level reporting of sales and usage and facilitate management of e-book products

【スライド7】The e-book supply chain

– For printed books, publisheres assin ISBNs to each format, and that product and it’s ISBN remains constant throughout the supply chain
– For e-books, there is an additional layer of intermediaries provideing conversion services to publishers and producing new e-book products
– Many publishers only produce a single generic file format (e.g.”.epub” or “PDF”), and intermediaries of Internet reatilers add technical rights protection (DRM) and create different formats/products

【スライド8】

※図版につき、省略

【スライド9】New ISBN rule introduced 2008

– Since some publishers do not provide separate ISBNs for each version and some customers, including libraries, need unique identification of products from different platforms with different functionality…
– If a publisher does not identify each format with a separate ISBN, intermediaries/re-sellers may do so on their behalf
— Not ideal but a necessary compromise until publishers assign their own ISBNs
— Requires central bibliographic agency to cllect and list ISBNs and related metadata

【スライド10】What’s actually happening?

– Everything, It’s like the 1960’s before ISBN.
– Some publishers assign separate ISBNs to each version
– Some assign the same ISBN to all versions
– Some publishers assign an ISBN to the epub file and let third parties assign their own ISBNs or proprietary identifiers to their versions
— sometimes these proprietary “ISBN-like” identifiers actually duplicate ISBNs assigned to books already published elsewhere

【スライド11】

※実例のキャプチャにつき省略

【スライド12】“Whether things are or are not the same is always contextual”

– Results of ISBN survey 2009/2010:
– There is a need for each digital format to be separately identified at various points in the supply chain
– However there seems to be a need for a more abstract generic identifier to collocate different versions of the same books
— ISTC identifies underlying textual works and is a potentially useful way of aggregating different manifestations and ther ISBNs regardless of media
— Do we need yet another identifier to identify the generic e-book master file? If so it shouldn’t be an ISBN

【スライド13】“Collocation — bringing together instances of the same thing”

– The International Standart Text Code
– Unambiguously identifies a textual work, even though it may be published in many differnt forms (One ISTC may link to many ISBNs)
– For use in improved discovery services, collocation, rights and royalties etc.
– Identifies content separately from the products which contain it
– Also identifies the relationships between items of content (ONIX for ISTC registration)
— e.g. Abridged, Annotated, Compilation, Critical, Excerpt, Expurgated, Non-text material added or revised, Revised, Translated

【スライド14】

※実例のキャプチャにつき省略

【スライド15】What about chapters and fragments?

– Are you making chapters and fragments separately available through the supply chain?
– Do you want them listed in trade databases?
— If so, then treat them as individual publications and assign ISBNs
– Will the only be available through a single source (e.g. publisher’s website?)
— If so, then you can assign an internal identifier or, possibly, a DOI to facilitate linkng
— (N.B. ISBN-A, the actionable ISBN, provides a simple syntax to enable an ISBN to be incorporrated into a DOI)

【スライド16】In summary

– The use of a single ISBN to identify multiple e-book versions is confusing and potentially unsafe
– If two things are given the same identifier it becomes very hard to distinguish between them if/when we need to
– The International ISBN Agency continues to recommend that publishers should assign ISBNs to each e-book version separately available (see latest FAQs)
– …but we also need to use identifiers at higher levels of abstraction (ISTC, others?)
– Consistent application of standard identifiers is essential

【おまけ】
講演で利用したスライドと「まあまあ似ているもの

関連してそうなエントリ

日高崇