DAISYの種類とバージョン 2019年更新版

※本エントリは、2014年9月に公開した「DAISYの種類とバージョン」の更新版です。
 DAISY (Digital Accessible Information SYstem) は、視覚障害者や発達障害者など読書に困難のある方々のための書籍コンテンツの国際規格です。日本では、「デジタル録音図書の国際標準規格」と紹介されることが多いですが、「録音図書」より幅広いコンテンツを包含するフォーマットでテキストデータ主体のDAISYもあります。
 DAISYの種類としてテキストDAISY、音声DAISY、マルチメディアDAISYがあります。また、DAISYのバージョンには、現在も使用されている、または使用されようとしている仕様のバージョンとして、DAISY 2.02、DAISY3、EPUB 3があります。
 これらのDAISYの種類とバージョンを整理してみました。

1. DAISYの種類

 DAISYには、おおざっぱに言ってテキストDAISY、音声DAISY、マルチメディアDAISYの3つの種類のDAISYがあります。特徴を表にまとめると以下のような感じになります。

DAISYの種類
種類 目次のテキストデータ 本文フルテキスト 目次・本文等を読み上げた音声データ 現在、日本で仕様されている主なバージョン
音声DAISY 有り 無し 有り DAISY2.02
テキストDAISY 有り 有り 無し DAISY3、そろそろEPUB3?
マルチメディアDAISY 有り 有り 有り DAISY2.02

 「2.DAISYのバージョン」で紹介するように、DAISYには、DAISY2.02、DAISY3、EPUB3(DAISY4世代)の3つのバージョンがありますが、いずれのバージョンでもテキストDAISY、音声DAISY、マルチメディアDAISYを製作することが可能です。

音声DAISY

 DAISYという言葉から最もイメージしやすいのが音声DAISYでしょうか。いわゆる録音図書のデジタル版です。「DAISY」という名称が、もともと”Digital Audio-based Information SYstem”であったように、当初は録音図書テープではできなかった録音図書のランダムアクセスを可能とするデジタル録音図書の規格として策定されたものでした。音声DAISYがもっとも歴史のあるタイプのDAISYになるかと思います。
 目次等のナビゲーションに関係するテキストデータは格納しますが、本文部分は本文を音訳した(視覚情報である本文を音声化した)音声データのみになります。音声ファイルを格納しているので、1タイトル単位のファイルサイズは大きくなります。100MB、200MBはざらです。
 現在も日本では、音声DAISYが最も多く製作されています。製作に使用されているフォーマットは、ほぼDAISY2.02です。
 EPUB3で製作した「音声DAISY」を製作することも可能です。試していませんが、EPUBに対応したPTR3などのようなDAISY環境であれば、たぶん利用できるはず。
DAISY2.02からの変換。音声の再生は0:40あたりから)

テキストDAISY

 目次と本文のテキストデータで構成されるDAISYです。Kindle Storeなどで販売されている電子書籍をイメージするとわかりやすいと思います。ほぼそれに近いものです。音声ユーザーは、スクリーンリーダーによって読み上げさせて利用します。本文テキストの文字の拡大縮小や配色の変更等が可能です。
 
 音声DAISYや後述のマルチメディアDAISYのように音声ファイルをもっていないため、音声DAISYやマルチメディアDAISYと比べると、ファイルサイズは非常に軽量です。
 欧米言語には、このテキストDAISYがよく使われているそうです。
 日本では、著作権法の権利制限規定でプリントディスアビリティのある方のためにテキストデータを製作できるようになったのが2010年からでさほど日が経っていないため、音声DAISYほどは普及はしていません。テキストDAISYの閲覧環境のほうがPCの操作が必要であるなど、ICTスキルが求められることもハードルを高めている原因ですが、近年は、PTR3などのように読み上げ機能を備えたDAISY環境も出てきていますので、いずれはハードルは下がるかもしれません。
 テキストDAISYは、DAISY3で製作されることが多いですが、DAISYの閲覧環境におけるEPUB3の対応も進んできているので、テキストDAISYは、EPUB 3への移行が今後進むかもしれません。
 なお、商用で流通しているいわゆる「電子書籍」は、目次とテキストデータで構成されるテキストDAISYとも言えますので、日本でも「テキストDAISY」的なコンテンツは、電子書籍の普及で一気に増えている、ともいえます。個人的に感じる商業の電子書籍と、テキストDAISYの大きな違いは、以下の3点です。

  • DRMフリーであること(障害者が利用する様々な環境で利用できるように)、
  • 論理目次の情報がより詳細に記入されること(ナビゲーション機能が強化されている)、
  • 画像には代替テキストが提供されていること

テキストDAISYだから、という要件ではないため、商業的に流通している一部の電子書籍でも上の要件を満たしているものがでています。 DAISYと商業流通コンテンツの境界線があいまいになりつつといえます(それが望ましいと思いますが)。

マルチメディアDAISY

 テキストDAISYと音声DAISYの特徴をあわせもったDAISYで、本文のテキストデータと読み上げ音声の両方をもち、音声を再生する際には以下のように本文テキストの該当箇所をハイライト表示させる機能を持っています。
マルチメディアDAISY図書の「ごん狐」

 音声ファイルを格納しているので、ファイルサイズは大きくなります。マルチメディアDAISYは全盲の視覚障害者だけではなく、ロービジョン、発達障害、知的障害など通常の紙の書籍では読書するのに困難のある様々な方にも有用であるため、今後普及が期待されているDAISYです。ただし、テキストDAISYと音声DAISYの両方を製作し、それを1つにマージするようなものなので、それ相応のコストがかかります。
 マルチメディアDAISYは、DAISY2.02で製作されることが多いです。
 

2. DAISYのバージョン

 DAISYにはDAISY2.02、DAISY3、DAISY4世代のEPUB3の3つのバージョンがあります。
DAISYのバージョンの図。DAISY2.02からDAISY3、続いて、DAISY4世代へ。DAISY4世代は交換フォーマットと配布フォーマットに分かれ。交換フォーマットはDAISY AI(ANSI/NISO Z39.98-2012)、配布フォーマットがEPUB
 なお、DAISY 2.02とDAISY 3は同じDAISYという名称ながら、ファイル構成も全く異なるもので、別のファイル形式と言えます。このあたりはそれぞれの策定の経緯も関係しています。詳しくは以下をご参照ください。

DAISY2.02

仕様の概要
  • Recommendation, February 28 2001(DAISY Consortium)
  • URL: http://www.daisy.org/z3986/specifications/daisy_202.html日本語訳
  • ファイル: SMIL1.0 + XHTML1.0 + CSS2.1 + 音声ファイル(MP3、PCMなど)など
  • 目次ファイル:Navigation Control Center (NCC) document(ファイル名は”ncc.html”または”NCC.HTML”)
  • メタデータを格納しているファイル:Navigation Control Center (NCC)ドキュメント(ファイル名は”ncc.html”または”NCC.HTML”)
特徴
  • 必須ファイルは、1つのNavigation Control Center (NCC) document(ファイル名は”ncc.html”または”NCC.HTML”)と1つ以上のSMILファイル。
  • Navigation Control Center (NCC)ドキュメントとテキストコンテンツドキュメントファイル(本文部分のテキスト)はXHTML1.0に準拠したドキュメント。
  • SMILドキュメントはSMIL1.0に準拠したドキュメント。
  • CSS2.1仕様に付録として記載されているAudio CSS(ACSS)も使用可。
  • ルビ表示を含め、漢字などの読み情報を格納する機能はサポートされていない。
  • CDなどの媒体にいれて配布する想定だったためか、EPUBのようなZIPアーカイブ化して単一ファイルとしてカプセル化するコンテナフォーマットは特に規定されていない。

参考 DAISY 2.0

仕様の概要

 DAISY2.02の前のバージョンとして、DAISY2.0があります。ファイルの構成はDAISY2.02とほぼ同じですが、テキストベースのコンテンツファイルのhtmlファイルが、DAISY2.0はHTML4.0です。現在、DAISYが2.0の仕様に基づいて製作されることはさすがにありませんが、過去に製作されたDAISYの中にはDAISY2.0のものが結構残っているようです。

ANSI/NISO Z39.86-2005 (DAISY3)

仕様の概要
  • Approved April 21, 2005 by the American National Standards Institute
    Reaffirmation approved April, 2012 by the American National Standards Institute
    ANSI/NISO Z39.86-2005
  • URL: http://www.daisy.org/z3986/2005/Z3986-2005.html日本語訳
  • ファイル: SMIL2.0 + XML1.0(DTBook XML) + CSS2.1+ 音声ファイル(MP3、PCMなど)+OPF+NCX など
  • 目次ファイル:NCX(Navigation Control file for XML applications)ファイル
  • メタデータを格納しているファイル: Open eBook Forum Package File (OPF)
特徴
  • パッケージファイルであるOPFファイルはOpen eBook Publication Structure 1.2仕様に準拠。
  • 目次ファイル:NCX(Navigation Control file for XML applications)ファイルはEPUB2でも採用されている。
  • DAISY XML(またはDTBook XML):DTBook XML要素セットを使用して記述されたXML1.0のテキストベースのコンテンツファイル。
  • DTBook XML要素セットを使用したコンテンツファイル(DAISY XML)はEPUB2でも使用可。
  • CSS2.1仕様に付録として記載されているAudio CSS(ACSS)も使用可。
  • ルビ表示を含め、漢字などの読み情報を格納する機能はサポートされていない(日本では、独自の実装でルビ表示を実現しているところがあるようですが、仕様上はサポートされていない)。
  • CDなどの媒体にいれて配布する想定だったためか、EPUBのようなZIPアーカイブ化して単一ファイルとしてカプセル化するコンテナフォーマットは特に規定されていない。
その他

 欧米圏では、このDAISY3が主に使用されているようです。DAISY 3という名称で知られていますが、米国の標準規格として認証されていますので、”ANSI/NISO Z39.86-2005″と呼ばれることも多いです(DAISY3と呼ばれることが少ない)。2012年に再確認(reaffirmed)されたので末尾に”R2012″がついて、”ANSI/NISO Z39.86-2005 (R2012)”と表記されることもあります。名称にあるとおり、”ANSI/NISO Z39.86-2005″は2005年に承認されたものですが、”ANSI/NISO Z39.86-2005″の前のバージョンの仕様として2002年に承認された”ANSI/NISO Z39.86-2002″もあります。”ANSI/NISO Z39.86-2002″もDAISY3です。
 米国では、個別障害者教育法(IDEA 2004)により、出版者は教科書などの教材のデータをNIMAS(全国指導教材アクセシビリティー標準規格)というフォーマットで提出することが義務づけられています。そのNIMASにDAISY3のサブセットが採用されています。

DAISY4世代(EPUB3とDAISY AI)

 DAISY4世代は、ユーザーが使用する配布フォーマットと製作者側がもつ交換フォーマットに分かれています。配布フォーマットはEPUB 3、交換フォーマットがDAISY AI(Authoring and Interchange)で米国の標準規格として認証もされましたので”ANSI/NISO Z39.98-2012″と呼ばれます。

EPUB 3

仕様の概要
  • Recommended Specification 26 June 2014 by International Digital Publishing Forum ※EPUB 3.0は2011年10月11日勧告
  • URL:http://idpf.org/epub/301
  • ファイル:HTML5(XHTML5)+CSS2.1(と一部のCSS3)+SMIL3.0+音声や動画ファイル+OPF など
  • 目次ファイル:EPUB Navigation Document(ファイル名は”nav.xhtml”とされていることが多い)
  • メタデータを格納しているファイル: パッケージドキュメントファイルのOPFファイル
特徴

 TTSサポートのところで触れていますが、ruby要素、インラインSSML、PLSによっての読みの情報を格納できるようになりました。日本語コンテンツとしては非常に大きなことですね。あと、DAISY2.02、DAISY3では特に規定されていなかったZIPアーカイブ化が規定されたことがとても大きい。

  • パッケージファイルであるOPFファイルはEPUB Publications 3.0.1に準拠。
  • 動画・音声ファイルのサポート。
  • SMIL3.0のサブセットが仕様に組み込まれ、テキストと同期した形で音声を再生することが可能になった(EPUB Media Overlays)。DAISYとしては、当たり前の機能ですが、EPUBとしては大きな機能の追加です(動画とテキストの同期は不可)。
  • MathMLのサポート。
  • JavaScriptのサポート。
  • Text-to-speechのサポート機能強化(ruby要素、CSS3 Speech Module、インラインSSML、PLS(Pronunciation Lexicon Specification)をサポート)。
  • 国際化対応(縦書きなどの日本語組版対応など)。
  • (EPUBとしては、当然のことであるが、)ZIPアーカイブ化して単一ファイルとしてカプセル化するコンテナフォーマットの仕様が「DAISY」としてはようやく盛り込まれた。
その他

 DAISYの閲覧環境におけるEPUB 3の対応も近年進んできています。新しく出るもの、メーカーのメンテがなされているものはだいたい対応してきていると言ってよい状況。

 ちなみにEPUBで作れば、全てがDAISYユーザーが満足するアクセシブルなコンテンツになるかというとそうではありません。作り手がアクセシビリティを意識して製作する必要があります。DAISYコンソーシアムは、DAISYユーザーが満足するようなアクセシブルなEPUBを”Accessible EPUB“と呼び、一応、他のEPUBと区別しているようです。

DAISY AI(ANSI/NISO Z39.98-2012)

仕様の概要

 DAISY AI(ANSI/NISO Z39.98-2012)に準拠したファイルを少なくとも私は未だにほとんど見たことがありません。DAISYコンソーシアムもEPUB 3 移行プロジェクトでEPUB3への移行は力入れているようですが、DAISY AIはあまり力を入れているように見えません。以下のような用途を想定してようですが・・。
メタデータ、音声、本文データ、SMILなどを持った交換フォーマットDAISY AI(ANSI/NISO Z39.98-2012)から配布フォーマットであるEPUBと点字データ、拡大図書などに変換される図です

EBSCO がアクセシビリティでとても頑張っている(らしい)

 EBSCO が、アクセシビリティにについてとても頑張っているようです。

上のサイトで紹介されている取り組みを列記するだけでも以下のとおり。いずれも重要なことなのですが、商業ベースで代替テキストの提供までやっているのは、プラットフォームレベルではかなり珍しいのではないか。どこまでやれているのだろうか。学術文献なので、大変ですが、ガイドラインのようなものがあるのでしょうか。

  1. Text-to-Speech: Text-to-speech functionality on HTML full-text articles
  2. Transcripts: Transcripts for videos and audiobooks
  3. Alternate Text :Descriptive page titles and alternate text for meaningful images
  4. ARIA Landmarks: ARIA landmarks to assist users with screen readers
  5. Access Keys:Access keys for keyboard-only navigation
  6. EPUB & DRM-free eBooks: Many titles available DRM-free and in EPUB forma

 54の電子書籍プラットフォームの中でアクセシビリティについてもっとも評価されたプラットフォームらしい。上のとおりなら、それもうなずける。

 EBSCO のブログでも取り組みの近況が確認できます。

EPUBのアクセシビリティ検証 Web サービス BACC (Born Accessible Content Checker)

German Central Library for the Blind がEPUBのアクセシビリティ検証 Web サービス BACC (Born Accessible Content Checker) を公開しています。 DAISY Consortium の EPUBのアクセシビリティ検証ツール Ace がベースになっているようです。

以下、解説記事。
Born Accessible Content Checker – update | planet-2019-01 | DAISY Consortium