入門翻訳勝ち抜き道場

「洋書の森」ニュース

3. 書籍出版流通におけるコードとデータベースについて

出版科学研究所 佐々木利春
[ profile ]

書籍は年間約8万点の新刊が刊行されています。1日あたりにすると300点を超え、書店の店頭は新刊であふれかえっていますが、その一方で膨大な返品もあり、出版業界は長期低落の中で流通の効率化に懸命に取り組んでいます。今回は書籍出版流通のなかでも、ふだんはなじみの薄い「コード」と「データベース」について触れてみようと思います。

■ ISBNコードとバーコード

本の裏表紙にはISBN(日本図書コード)が表記されていて、その脇に書籍JANコードという2段のバーコードが表示されています。いま書籍にとって、このコードなくして出版社~取次~書店という流通ルートを通るのは難しくなっているのが現状です。

いまの出版流通はコンピュータと物流設備が連動したシステムが構築されていて、書籍はコードによって大量の出荷作業や返品処理作業が行われているからです。

ISBN(国際標準図書番号)は国際規格ですが、日本図書コードはISBNコードに「分類コード」と「価格コード」を加えて表示するコード体系をいいます。どの出版社の、どのようなタイトルか、定価はいくらか、といった本の識別コードであるわけです。表示箇所は、裏表紙、カバー、帯、スリップです。

ただし現在、取次や書店における出版流通の現場では、OCR-Bフォントで表示されたISBNコードを機械で読み取るのではなく、バーコード読み取りが主流で、取次や書店の持つ書籍マスター(データベース)とコンピュータで照合され、本が識別されています。

■ ISBNコードの体系

ISBNコードは13桁(昨年までは10桁、07年から13桁に改定)の数字からなっています。実例として私ども出版科学研究所の『2007出版指標年報』)をあげますと、ISBNコードは
 ISBN 978-4-9901618-04-2 C3000 \11429E
と表示されています。コードの意味は次の通りです。

価格コード
フラグ 国 出版者記号 書名記号 チェック数字 分類コード(本体価格)
978499016184C3000¥11429E

つまり当研究所のISBNコードでは10点しか収容点数がありません。書籍を年に1点しか出していない当所の暦年版『出版指標年報』は2013年版で書名記号がいっぱいになってしまうというわけですが、こうした場合、日本図書コードセンターでは出版社記号を新規に割り当てることで対応しています。

出版社記号と書名記号の数字の大きさは、出版量の規模に応じて割り当てられます。年間数百点から1千点以上を出す大手出版社の出版社記号は2桁、書名記号は6桁(つまり99万9,999点まで収容可)が割り当てられています。

■ バーコード(書籍JANコード)

さまざまな商品に付いているバーコードは、JAN(Japan Article Number=日本共通商品番号)と呼ばれ、国際的な13桁の共通バーコード体系EAN(European Article Number)の日本版です。

その中で書籍JANコードは、書籍独自の「日本図書コード」の内容を2段のバーコードに書き換えたものです。

1段目はISBNコード、2段目は書籍JANコードの2段目を表す「192」で始まり、分類コードと価格コード(本体価格)を示しています。

現在書籍には、文庫・新書はほぼ100%、その他の新刊も大部分はバーコードが表示されています。

これまで使用されてきたISBN表4表示のOCR-Bフォントは07年1月に廃止され、表示は目視可能な11級以上のサイズ(書体は自由、OCR-Bも可)を標準とする、となりました。つまり、表示は必須ですが、11級以上のサイズなら書体は自由となったのです。

書店の現場を含め、バーコード読み取り主体の物流体制が出来上がったことと、OCR-Bフォントの読み取りはエラーが多いというのがその理由です。

なお、出版者記号の取得、書籍JANコードの取得は日本図書コード管理センターに申し込みます(書籍JANコードは同センターが諸手続を代行。管理は(財)流通システム管理センターが行っています)。

■ Cコード(分類コード)

ISBNコード13桁の次にある「C○○○○」という4桁のコードは、販売対象と発行形態及び内容を示す「分類コード」と呼ばれるものです。

分類コードは1970年頃、コンピュータで物流を管理する時代に対応して、本の裏表紙に「書籍コード」を表示することを業界が取り決めたのですが、実効性に乏しく、1981年、ISBNコードが実施されるにあたって「分類コード」だけが現在に引き継がれたのです。

なお書籍コードは、分類コード(4ケタ)、商品番号(4ケタ)、出版社コード(4ケタ)、計12ケタで構成されていました。

では、分類コードを説明しますと、一桁目は販売対象(一般、教養、実用、専門、婦人、学参Ⅰ、学参Ⅱ、児童)、二桁目は発行形態(単行本、文庫本、新書本、全集・叢書、ムック・その他、辞・事典、図鑑、絵本、磁性媒体など、コミック)、3桁目は大分類、4桁目は中分類で、大分類は10、中分類は67に分かれています。

基本的に大分類・中分類は、図書館資料の分類方法である日本十進分類法(NDC)に基づいて作られています。

表はこちらに出ています。
http://www.asahi-net.or.jp/~ax2s-kmtn/ref/ccode.html

ISBN時代に入ってから、内容分類にコミックや情報科学が加わったり、発行形態にムックや磁性媒体、コミックが加わったりといように、出版の現状に合わせた改訂がなされています。

■ 出版統計と分類コード

出版科学研究所の書籍出版統計は、書籍コード時代の1973年から分類コードに基づいて取っており、すでに34年が経過しました。

ですが、おそらく、分類コードをフルに活用しているのは当研究所だけではないかと思われます。というのも、この分類は出版社が任意につけてくるもので、専門家が付けたものではありません。したがって、誤りも多く「参考程度に使える」というレベルなのです。

例えば、病気を治す本が「0030」(販売対象は一般、発行形態は単行本、内容は社会科学総記)と付けてあったり、自己啓発書といえる勉強法の本が「0033」(一般、単行本、経済)であったり、不思議なコードも多々あるのです。ちなみに、病気の本は専門的でない場合は「家庭医学」として「0077」、勉強法は「教育」と見て「0037」とします。

また、NDCでは、美術家・音楽家・芸能人など書いたエッセイなどは当該分野に分類するのがルールですが、分類コードは、エッセイが含まれる日本文学評論随筆と付けて来るケースが圧倒的です。

こうしたことから、書籍出版統計を取るにあたって、毎日刊行される新刊の分類コード訂正は半分以上にのぼります。専門の担当者が1ヵ月の3分の2を費やして訂正しているのが実情です。私どもも分類コードについて正確を期すよう出版社にPRしなくてはいけないと思っています。

分類コードはどんな場合に役に立つかと取次の営業担当者に聞きましたところ、書店の新規開店時、商品を棚詰めする場合、内容分類の意味を知っていると便利、と答えてくれました。

■ データベースはどのように作られるか

オンライン書店にアクセスすると、書名や著者名での検索キーがあります。この背後には、書誌情報と在庫情報がミックスされたデータベースが存在しています。

この作成過程は、まず出版社が大手取次のトーハンに新刊見本を持ってきますと、図書館流通センター(TRC)というところに回り、ここでMARC(Machine Readable Catalogの略称、コンピュータ上で読み取り可能な形式に保存されたデータファイルのこと)が作成されます。業界には標準MARCというものがあり、本のタイトル、副題、シリーズ名、著者、出版社、価格、出版年月などなど約50項目にのぼるデータが作られます。TRCは標準MARCの作成業務を受託しています。

このMARCが取次やリアル書店、オンライン書店に提供され、それぞれの企業が在庫情報を含めたデータベースを構築するわけです。

したがって、現物見本の提供がひとつの鍵になります。新刊見本がないと正確なデータベースは作られないからです。出版社はISBNとともにMARCの重要性を認識していますので、新刊見本提供の割合は高いといえるようです。

現在、出版界で必要とされているのが、近刊情報。いつどんな本が出るか、前もって分かると読者にとっても書店にとっても便利です。「これから出る本」という印刷物が書店で無料頒布されていますが、これでは不十分。日本インフラセンターでは近刊情報の提供を出版社に呼びかけて充実を図ろうとしていますが、これには多くの出版社と取次の協力なくしては難しいようです。

以上、裏表紙に表示されているISBNコードやバーコード、データベースについて触れてきましたが、本が流通するには情報を処理するさまざまな仕組みが必要であることが少しは理解いただけたと思います。しかしながら個人的には、バーコードはブックデザインとして無粋かなと思わないわけではありません。