DAISYの種類とバージョン 2019年更新版

※本エントリは、2014年9月に公開した「DAISYの種類とバージョン」の更新版です。
 DAISY (Digital Accessible Information SYstem) は、視覚障害者や発達障害者など読書に困難のある方々のための書籍コンテンツの国際規格です。日本では、「デジタル録音図書の国際標準規格」と紹介されることが多いですが、「録音図書」より幅広いコンテンツを包含するフォーマットでテキストデータ主体のDAISYもあります。
 DAISYの種類としてテキストDAISY、音声DAISY、マルチメディアDAISYがあります。また、DAISYのバージョンには、現在も使用されている、または使用されようとしている仕様のバージョンとして、DAISY 2.02、DAISY3、EPUB 3があります。
 これらのDAISYの種類とバージョンを整理してみました。

1. DAISYの種類

 DAISYには、おおざっぱに言ってテキストDAISY、音声DAISY、マルチメディアDAISYの3つの種類のDAISYがあります。特徴を表にまとめると以下のような感じになります。

DAISYの種類
種類 目次のテキストデータ 本文フルテキスト 目次・本文等を読み上げた音声データ 現在、日本で仕様されている主なバージョン
音声DAISY 有り 無し 有り DAISY2.02
テキストDAISY 有り 有り 無し DAISY3、そろそろEPUB3?
マルチメディアDAISY 有り 有り 有り DAISY2.02

 「2.DAISYのバージョン」で紹介するように、DAISYには、DAISY2.02、DAISY3、EPUB3(DAISY4世代)の3つのバージョンがありますが、いずれのバージョンでもテキストDAISY、音声DAISY、マルチメディアDAISYを製作することが可能です。

音声DAISY

 DAISYという言葉から最もイメージしやすいのが音声DAISYでしょうか。いわゆる録音図書のデジタル版です。「DAISY」という名称が、もともと”Digital Audio-based Information SYstem”であったように、当初は録音図書テープではできなかった録音図書のランダムアクセスを可能とするデジタル録音図書の規格として策定されたものでした。音声DAISYがもっとも歴史のあるタイプのDAISYになるかと思います。
 目次等のナビゲーションに関係するテキストデータは格納しますが、本文部分は本文を音訳した(視覚情報である本文を音声化した)音声データのみになります。音声ファイルを格納しているので、1タイトル単位のファイルサイズは大きくなります。100MB、200MBはざらです。
 現在も日本では、音声DAISYが最も多く製作されています。製作に使用されているフォーマットは、ほぼDAISY2.02です。
 EPUB3で製作した「音声DAISY」を製作することも可能です。試していませんが、EPUBに対応したPTR3などのようなDAISY環境であれば、たぶん利用できるはず。
DAISY2.02からの変換。音声の再生は0:40あたりから)

テキストDAISY

 目次と本文のテキストデータで構成されるDAISYです。Kindle Storeなどで販売されている電子書籍をイメージするとわかりやすいと思います。ほぼそれに近いものです。音声ユーザーは、スクリーンリーダーによって読み上げさせて利用します。本文テキストの文字の拡大縮小や配色の変更等が可能です。
 
 音声DAISYや後述のマルチメディアDAISYのように音声ファイルをもっていないため、音声DAISYやマルチメディアDAISYと比べると、ファイルサイズは非常に軽量です。
 欧米言語には、このテキストDAISYがよく使われているそうです。
 日本では、著作権法の権利制限規定でプリントディスアビリティのある方のためにテキストデータを製作できるようになったのが2010年からでさほど日が経っていないため、音声DAISYほどは普及はしていません。テキストDAISYの閲覧環境のほうがPCの操作が必要であるなど、ICTスキルが求められることもハードルを高めている原因ですが、近年は、PTR3などのように読み上げ機能を備えたDAISY環境も出てきていますので、いずれはハードルは下がるかもしれません。
 テキストDAISYは、DAISY3で製作されることが多いですが、DAISYの閲覧環境におけるEPUB3の対応も進んできているので、テキストDAISYは、EPUB 3への移行が今後進むかもしれません。
 なお、商用で流通しているいわゆる「電子書籍」は、目次とテキストデータで構成されるテキストDAISYとも言えますので、日本でも「テキストDAISY」的なコンテンツは、電子書籍の普及で一気に増えている、ともいえます。個人的に感じる商業の電子書籍と、テキストDAISYの大きな違いは、以下の3点です。

  • DRMフリーであること(障害者が利用する様々な環境で利用できるように)、
  • 論理目次の情報がより詳細に記入されること(ナビゲーション機能が強化されている)、
  • 画像には代替テキストが提供されていること

テキストDAISYだから、という要件ではないため、商業的に流通している一部の電子書籍でも上の要件を満たしているものがでています。 DAISYと商業流通コンテンツの境界線があいまいになりつつといえます(それが望ましいと思いますが)。

マルチメディアDAISY

 テキストDAISYと音声DAISYの特徴をあわせもったDAISYで、本文のテキストデータと読み上げ音声の両方をもち、音声を再生する際には以下のように本文テキストの該当箇所をハイライト表示させる機能を持っています。
マルチメディアDAISY図書の「ごん狐」

 音声ファイルを格納しているので、ファイルサイズは大きくなります。マルチメディアDAISYは全盲の視覚障害者だけではなく、ロービジョン、発達障害、知的障害など通常の紙の書籍では読書するのに困難のある様々な方にも有用であるため、今後普及が期待されているDAISYです。ただし、テキストDAISYと音声DAISYの両方を製作し、それを1つにマージするようなものなので、それ相応のコストがかかります。
 マルチメディアDAISYは、DAISY2.02で製作されることが多いです。
 

2. DAISYのバージョン

 DAISYにはDAISY2.02、DAISY3、DAISY4世代のEPUB3の3つのバージョンがあります。
DAISYのバージョンの図。DAISY2.02からDAISY3、続いて、DAISY4世代へ。DAISY4世代は交換フォーマットと配布フォーマットに分かれ。交換フォーマットはDAISY AI(ANSI/NISO Z39.98-2012)、配布フォーマットがEPUB
 なお、DAISY 2.02とDAISY 3は同じDAISYという名称ながら、ファイル構成も全く異なるもので、別のファイル形式と言えます。このあたりはそれぞれの策定の経緯も関係しています。詳しくは以下をご参照ください。

DAISY2.02

仕様の概要
  • Recommendation, February 28 2001(DAISY Consortium)
  • URL: http://www.daisy.org/z3986/specifications/daisy_202.html日本語訳
  • ファイル: SMIL1.0 + XHTML1.0 + CSS2.1 + 音声ファイル(MP3、PCMなど)など
  • 目次ファイル:Navigation Control Center (NCC) document(ファイル名は”ncc.html”または”NCC.HTML”)
  • メタデータを格納しているファイル:Navigation Control Center (NCC)ドキュメント(ファイル名は”ncc.html”または”NCC.HTML”)
特徴
  • 必須ファイルは、1つのNavigation Control Center (NCC) document(ファイル名は”ncc.html”または”NCC.HTML”)と1つ以上のSMILファイル。
  • Navigation Control Center (NCC)ドキュメントとテキストコンテンツドキュメントファイル(本文部分のテキスト)はXHTML1.0に準拠したドキュメント。
  • SMILドキュメントはSMIL1.0に準拠したドキュメント。
  • CSS2.1仕様に付録として記載されているAudio CSS(ACSS)も使用可。
  • ルビ表示を含め、漢字などの読み情報を格納する機能はサポートされていない。
  • CDなどの媒体にいれて配布する想定だったためか、EPUBのようなZIPアーカイブ化して単一ファイルとしてカプセル化するコンテナフォーマットは特に規定されていない。

参考 DAISY 2.0

仕様の概要

 DAISY2.02の前のバージョンとして、DAISY2.0があります。ファイルの構成はDAISY2.02とほぼ同じですが、テキストベースのコンテンツファイルのhtmlファイルが、DAISY2.0はHTML4.0です。現在、DAISYが2.0の仕様に基づいて製作されることはさすがにありませんが、過去に製作されたDAISYの中にはDAISY2.0のものが結構残っているようです。

ANSI/NISO Z39.86-2005 (DAISY3)

仕様の概要
  • Approved April 21, 2005 by the American National Standards Institute
    Reaffirmation approved April, 2012 by the American National Standards Institute
    ANSI/NISO Z39.86-2005
  • URL: http://www.daisy.org/z3986/2005/Z3986-2005.html日本語訳
  • ファイル: SMIL2.0 + XML1.0(DTBook XML) + CSS2.1+ 音声ファイル(MP3、PCMなど)+OPF+NCX など
  • 目次ファイル:NCX(Navigation Control file for XML applications)ファイル
  • メタデータを格納しているファイル: Open eBook Forum Package File (OPF)
特徴
  • パッケージファイルであるOPFファイルはOpen eBook Publication Structure 1.2仕様に準拠。
  • 目次ファイル:NCX(Navigation Control file for XML applications)ファイルはEPUB2でも採用されている。
  • DAISY XML(またはDTBook XML):DTBook XML要素セットを使用して記述されたXML1.0のテキストベースのコンテンツファイル。
  • DTBook XML要素セットを使用したコンテンツファイル(DAISY XML)はEPUB2でも使用可。
  • CSS2.1仕様に付録として記載されているAudio CSS(ACSS)も使用可。
  • ルビ表示を含め、漢字などの読み情報を格納する機能はサポートされていない(日本では、独自の実装でルビ表示を実現しているところがあるようですが、仕様上はサポートされていない)。
  • CDなどの媒体にいれて配布する想定だったためか、EPUBのようなZIPアーカイブ化して単一ファイルとしてカプセル化するコンテナフォーマットは特に規定されていない。
その他

 欧米圏では、このDAISY3が主に使用されているようです。DAISY 3という名称で知られていますが、米国の標準規格として認証されていますので、”ANSI/NISO Z39.86-2005″と呼ばれることも多いです(DAISY3と呼ばれることが少ない)。2012年に再確認(reaffirmed)されたので末尾に”R2012″がついて、”ANSI/NISO Z39.86-2005 (R2012)”と表記されることもあります。名称にあるとおり、”ANSI/NISO Z39.86-2005″は2005年に承認されたものですが、”ANSI/NISO Z39.86-2005″の前のバージョンの仕様として2002年に承認された”ANSI/NISO Z39.86-2002″もあります。”ANSI/NISO Z39.86-2002″もDAISY3です。
 米国では、個別障害者教育法(IDEA 2004)により、出版者は教科書などの教材のデータをNIMAS(全国指導教材アクセシビリティー標準規格)というフォーマットで提出することが義務づけられています。そのNIMASにDAISY3のサブセットが採用されています。

DAISY4世代(EPUB3とDAISY AI)

 DAISY4世代は、ユーザーが使用する配布フォーマットと製作者側がもつ交換フォーマットに分かれています。配布フォーマットはEPUB 3、交換フォーマットがDAISY AI(Authoring and Interchange)で米国の標準規格として認証もされましたので”ANSI/NISO Z39.98-2012″と呼ばれます。

EPUB 3

仕様の概要
  • Recommended Specification 26 June 2014 by International Digital Publishing Forum ※EPUB 3.0は2011年10月11日勧告
  • URL:http://idpf.org/epub/301
  • ファイル:HTML5(XHTML5)+CSS2.1(と一部のCSS3)+SMIL3.0+音声や動画ファイル+OPF など
  • 目次ファイル:EPUB Navigation Document(ファイル名は”nav.xhtml”とされていることが多い)
  • メタデータを格納しているファイル: パッケージドキュメントファイルのOPFファイル
特徴

 TTSサポートのところで触れていますが、ruby要素、インラインSSML、PLSによっての読みの情報を格納できるようになりました。日本語コンテンツとしては非常に大きなことですね。あと、DAISY2.02、DAISY3では特に規定されていなかったZIPアーカイブ化が規定されたことがとても大きい。

  • パッケージファイルであるOPFファイルはEPUB Publications 3.0.1に準拠。
  • 動画・音声ファイルのサポート。
  • SMIL3.0のサブセットが仕様に組み込まれ、テキストと同期した形で音声を再生することが可能になった(EPUB Media Overlays)。DAISYとしては、当たり前の機能ですが、EPUBとしては大きな機能の追加です(動画とテキストの同期は不可)。
  • MathMLのサポート。
  • JavaScriptのサポート。
  • Text-to-speechのサポート機能強化(ruby要素、CSS3 Speech Module、インラインSSML、PLS(Pronunciation Lexicon Specification)をサポート)。
  • 国際化対応(縦書きなどの日本語組版対応など)。
  • (EPUBとしては、当然のことであるが、)ZIPアーカイブ化して単一ファイルとしてカプセル化するコンテナフォーマットの仕様が「DAISY」としてはようやく盛り込まれた。
その他

 DAISYの閲覧環境におけるEPUB 3の対応も近年進んできています。新しく出るもの、メーカーのメンテがなされているものはだいたい対応してきていると言ってよい状況。

 ちなみにEPUBで作れば、全てがDAISYユーザーが満足するアクセシブルなコンテンツになるかというとそうではありません。作り手がアクセシビリティを意識して製作する必要があります。DAISYコンソーシアムは、DAISYユーザーが満足するようなアクセシブルなEPUBを”Accessible EPUB“と呼び、一応、他のEPUBと区別しているようです。

DAISY AI(ANSI/NISO Z39.98-2012)

仕様の概要

 DAISY AI(ANSI/NISO Z39.98-2012)に準拠したファイルを少なくとも私は未だにほとんど見たことがありません。DAISYコンソーシアムもEPUB 3 移行プロジェクトでEPUB3への移行は力入れているようですが、DAISY AIはあまり力を入れているように見えません。以下のような用途を想定してようですが・・。
メタデータ、音声、本文データ、SMILなどを持った交換フォーマットDAISY AI(ANSI/NISO Z39.98-2012)から配布フォーマットであるEPUBと点字データ、拡大図書などに変換される図です

スマートスピーカーでのDAISY再生環境はないのか

 アマゾンのAlexaやGoogleアシスタントなどのAIアシスタント機能を持つスピーカーが備える Voice User Interface (VUI)は、DAISYオンライン配信プロトコルを利用したサピエ図書館が提供しているようなデイジーオンラインサービスとも親和性が高いはず。モニタを備えないDAISY機器( PTR 3リンクポケット など)からサピエ図書館を検索し録音図書データなどをダウンロードして読めるサービスをすでに実現していて、インプットこそボタン操作であるものの、アプトプットは音声情報のみも可としています。ほぼVUI。インプットを音声にできれば、もうできるのでは。
 2018年度サピエ研修会資料 では、アマゾンジャパンから「視覚障害者へのAIスピーカーの可能性について」という発表もなされているので、その後の動向が非常に気になります。
 海外で、スマートスピーカーでのDAISY再生環境を探してみて、プリントディスアビリティのある人を対象とした世界最大の電子図書館Bookshareについて以下のような要望があがってることは確認できる。

 ニュージーランドの盲人協会がアレクサスキルを公開しているようです。もしかして初めての事例?

 なお、Bookshareについては、How Amazon Alexa Can Help You Read によると、2018にBookshareは近日中に対応予定と回答してるようです。まだでしょうか。

ALEXA AND BOOKSHARE
Bookshare is an accessible online library for people with print disabilities. Books, magazines, and other publications are available in accessible formats such as EPUB, DAISY, MP3, and more. Previously, I have been able to read Bookshare books by uploading the MP3 files to my Amazon Music Library and having it read the book by asking Alexa to play the file name, but Amazon Music Library is discontinuing its uploading capabilities. I contacted Bookshare in July 2018 and they said that Alexa capabilities are coming very soon.

2019/5/12 追記
上では、コンテンツプロバイダ(DAISY配信サービス)ばかりに言及していますが、純粋な意味でのDAISY再生環境(閲覧スキル)について、言及していませんでした。残念ながら、それもまだないみたいです。たぶん。

アクセシビリティは “Start Small, Start Now” でいこう

ミネソタ大学の障害学生支援室が公開する Accessible U

Start Small, Start Now

というフレーズがあり、とても響いたので書いています。全てに当てはまることだと思いますが、上のフレーズは特にアクセシビリティについては、肝に銘じておきたいと改めて。

Accessibility is NOT all or nothing, and it’s simply impossible to make your digital content 100% accessible for 100% of your users.

まさにこれです。特にアクセシビリティというと、ゼロか100かで考えられることが多い印象があります(そして、100は無理だから、障害者専門の担当に任せるかという感じに)。
百人いれば百通りのニーズや使いやすさがあるわけで、1つで全ての人間にとっての「100%アクセシブル」な状態にすることは不可能です。無論、それを理想として追い求めることは必要ですが、やらない理由にしてはいけない、と。
また、「百人いれば百通り」の話を差し置いて、「自分の考える100%アクセシブル」基準で考えるにしても、「100%」でないと不可という考えは、ユーザーにゼロか百かの選択肢しか提示できないということに繋がります。これは、避けるべきだと思うのです。
例えば、アクセシブなコンテンツ提供の話です。リソースが無限にあるのであれば、「100%アクセシブル」なコンテンツを1万点でも、10万点、100万点でもそろえることが理想だと思いますが、限られたリソースではそれが難しく、「100%アクセシブル」なコンテンツは100点しか揃えることができない場合は、それでおしまいにするよりは、0%と100%の間をつなぐ(「自分の考える100%アクセシブル」視点での)「不完全」なコンテンツも1万点、10万点、100万点と揃えて、より多くの選択肢も提示するべきではないかと。
1つ1つについて、100%でないことで、ユーザーからお叱りを受けることもあるかもしれませんが、「100%アクセシブル」のコンテンツが100点しか提示してはいけないという状態よりは、ユーザー側にとって、そして、コンテンツ提供側にとっても幸せ度は高いのではないかと思うのです(お叱りはユーザーの声として前向けに受け止める必要がありますし、改善できるところは改善していくという姿勢で)。
「百人いれば百通り」の話に戻ると、百人百通りのニーズや使いやすさに応えるためには、そもそも問題意識もベクトル異なるプレーヤーをどんどん増やすしかないと思っています。多くのプレーヤーがそれぞれの問題意識とベクトルで優先順位の高いものに取り組んでほしい。船頭は多ければ多い方がいい。
そのためにも、多くの人の意識下にあるであろう、 “Accessibility is all or nothing” という意識の壁は取り除きたい。
“Start Small, Start Now(小さく初めていこう、でも、できることから今やりましょう)”と呼びかけていきたいし、自分自身も肝に銘じておきたい。
年度末の締めでした。来年度も引き続きよろしくお願いします。