2015年に「メタデータを電子書籍のアクセシビリティの議論の俎上にそろそろのせませんか」というエントリで、アマゾンのKindle Storeが Kindeコンテンツについて、合成音声による読み上げが可能かどうかの情報を、個々のタイトル詳細画面で提供していないと書いたことがありましたが、いつの間にかアマゾンのKindleストアが、それをメタデータとして提供するようになっています。
合成音声による読み上げが可能となっているKindleコンテンツについては、登録情報欄に「Text-to-Speech(テキスト読み上げ機能): 有効」という情報が掲載されています。
逆に読み上げができないコンテンツについては、「Text-to-Speech(テキスト読み上げ機能): 有効になっていません。」というメタデータが記載が掲載されています。
PC版のサイトで、「有効」の横にあるリンクをクリックすると「テキスト読み上げは、Alexa が有効になっている端末で利用できます。」というポップアップが表示されます。iOS版のKindleでも利用できるようになっているはずで、「ちょっと、あれ?」という感じもします。 Alexa対応スマートスピーカーがKindleコンテンツの読み上げに対応した時期に読み上げ可否のメタデータが提供されるようになったのかもしれませんね。
ちなみにモバイル版のサイトだと、PC版のポップアップに相当する箇所には、「Kindle端末のみ有効」と記載されています。PC版とモバイル版の情報の違いは、なんなんでしょうか。
カテゴリー: Semantic Web
アクセシビリティメタデータを提供する、ということ
このブログ記事はWeb Accessibility Advent Calendar 2017の14日目の記事です。
2017年というと、年明け早々にIDPFからの1月5日付けでEPUBの公式のアクセシビリティ仕様であるEPUB Accessibility 1.0が公開されました(ちなみに同じ月の1月31日にIDFPはW3Cと統合)。この EPUB Accessibility 1.0 では、EPUB 自身にアクセシビリティに関するメタデータ(以下「アクセシビリティメタデータ」)を包含させ、コンテンツのアクセシビリティに関する情報をユーザーに提供することを最低限満たすべき要件としています。アクセシビリティメタデータの提供を最優先とする考え方もそうですが、Schema.orgに由来する提供するアクセシビリティメタデータの考え方も個人的に深く共感するところがあったので、個人的に今年一番注目していた仕様でした。
今回は、2017年の締めくくりとして、EPUB(ウェブコンテンツだから、広い意味でウェブアクセシビリティの範疇ということで)を中心にアクセシビリティメタデータの話をしたいと思います。
アクセシビリティメタデータを提供することの意義
アクセシビリティメタデータを提供する意義は、具体的には以下の2つがあると考えています。
- ユーザーが自分の能力でそのコンテンツが利用できるものかどうかをメタデータから判断することができる。逆にいえば、利用できないコンテンツをメタデータを確認する段階で選択肢から排除することができる。
- ユーザーが自分の能力で利用できるコンテンツに絞り込んで検索できることができる(メタデータがコンテンツへのリーチを担保する基盤になる)
上の2つを一言で表すなら、「対象の”discovery”(発見可能性)を担保する」という言葉でまとめられるでしょうか。
1については、以前、アマゾンを取り上げて、以下のエントリで書いた事があります。
2のコンテンツへのリーチの話も、1と同じくらい、あるいはそれ以上に重要です。アクセシビリティメタデータが適切に提供されていないと、他のコンテンツに埋もれてしまい、本当に必要とする人にそのコンテンツへのリーチを担保することができません。1つ1つのコンテンツをアクセシブルに制作して、アクセシブルなコンテンツを総量として増やしてくことは、もちろん重要なことです。しかし、見つけられないコンテンツはそのユーザーにとって存在しないと同義ですので、必要とする人が既存のコンテンツを利用できるようにすることも、ユーザーの選択肢を増やすという意味においては同程度以上に重要です。コンテンツへのリーチを担保する基盤として、アクセシビリティメタデータの提供は非常に重要だと考えています。
「障害者向け資料」とそれ以外の資料へのリーチの現状
少しEPUBから離れますが、アクセシビリティメタデータの周辺の話として、いわゆる「障害者向けの資料」へのリーチの現状を少し紹介します。
いわゆる障害者の利用を想定して制作された資料(電子データ含む)というものがあります。点字資料、録音図書、拡大図書、布の絵本、マルチメディアデイジー、LLブックなどです。便宜上、「障害者向け資料」という言葉を用います。
国内で障害者向け資料をもっとも広い範囲で検索できるのが、おそらく国立国会図書館サーチ障害者向け資料検索です。この検索サービスで検索できる書誌件数は、現在、83万件ほど。ちなみに国立国会図書館の全蔵書数が約4188万点、それを図書、雑誌、新聞という資料種に限定しても約2778万点です。若干大雑把な計算ですが、いわゆる健常者が利用できる資料点数として、4188万点や2778万点を母数とすると、国立国会図書館サーチ障害者向け資料検索で検索できる83万点という数字は、健常者が利用できる資料の2%から3%ほどにすぎないということになり、決して多くはありません。その最大の理由は、そもそも障害者向け資料が少ないということにありますが、点字図書・録音図書全国総合目録やサピエ図書館などのように、障害者向け資料に特化したデータベースに収録されたものか、点字図書、録音図書などのように、資料のジャンル(あるいは分類)で特定できるものくらいしか、検索サービスの検索対象として拾うことができないということもあります(また、現状、国立国会図書館サーチも全てのジャンルの障害者向け資料を検索できるわけではありません。布の絵本やLLブックなど、検索できないジャンルもあります)。
障害者の利用に特化したものでなくても、一般に流通しているもので、障害者が利用できる資料は多くあります。しかし、現時点では、アクセシビリティメタデータがきちんと提供されておらず、多大な資料群に埋もれてしまっているため、障害者がこの中から自分が利用できるものを探し出すことは、かなり困難だと思います。
例えば、DVDです。最近では、普通に販売されるDVDに視覚障害者向けの音声解説や聴覚障害者向けの日本語字幕が付いているものが増えてきています。特にテレビ放送での聴覚障害者向け字幕放送が増えてきているということもあり、「聴覚障害者向け」と書いていなくも、実際は聴覚障害者向けとなっている日本語字幕のついたDVDがかなりの割合で出てきているように感じています。その一部は「特定非営利活動法人メディア・アクセス・サポートセンターのサイトで検索することも実は可能なのですが、網羅されているものではありませんし、普通に発売されているDVDなので、アマゾンや図書館のデータベースなどで検索する段階でそういう情報がほしいところですが、なかなかありません。メタデータに記述があっても、「バリアフリー再生機能:音声ガイダンス/バリアフリー日本語字幕」とあるものもあったり、単に「日本語字幕」とかいてあるだけであったり、表記がバラバラなので、検索のキーとして使用ことができません。
以上のようなこともあり、実際に資料を探す場合には、点字図書、録音図書などのような「障害者向け資料」のジャンルによって検索範囲を絞らざるを得ないところもあります。
EPUB のアクセシビリティメタデータ
障害のある人も含めて多くの人が利用できる可能性のあるコンテンツとして現在進行形で量として急速に増え、アクセシビリティメタデータの提供が急務になっているのが、電子書籍です。そして、電子書籍フォーマットのEPUBについては、2017年に出た EPUB Accessibility 1.0 でアクセシビリティメタデータを提供することが要件として規定さました。EPUB Accessibility 1.0 とこの仕様が提供を求めるアクセシビリティメタデータについては、以下でまとめたことがありますので、詳しくは以下をご参照ください。
EPUB Accessibility 1.0 でEPUBに含むことを求められるアクセシビリティメタデータは端的にいって
- そのコンテンツを利用するには、どのような機能を読者が備えている必要があるのか。
- アクセシビリティのためにそのコンテンツはどのような機能や配慮がなされているのか
という観点からメタデータを記述するようになっています。
EPUB というコンテンツにアクセシビリティメタデータが含まれるということは、コンテンツを知悉しているはずのコンテンツ制作者がアクセシビリティメタデータをEPUBというコンテンツを通じて提供するということを意味します。EPUB がアクセシビリティメタデータが持つだけでは意味がなく、コンテンツをユーザーに提供するアマゾンなどのサービスプロバイダが、検索などに活用されるところに至らないといけませんが、その大前提として制作される段階で制作者が個々のEPUBについてアクセシビリティの要素を判断して、メタデータを提供するというフローがあることが重要です。
だれでもない、自分が今、読むことができるコンテンツを探せることが重要
上で「障害者向け資料」の資料のジャンルの話をしましたが、読書に困難な理由は非常に様々で診断書に名前がのるような明確なものとも限りませんし、読書に困難を感じても本人が障害そのものを自覚していない可能性があります。自分の障害の特性を理解し、かつ、点字資料、録音図書、拡大図書、マルチメディアDAISYのような資料の特徴の理解した上で資料のジャンルから、自分が利用できるもの選ぶということはかなり難しいことです。
また、「障害者」と「健常者」という言葉を便宜上使用しましたが、いわゆる「健常者」でも一時的な状況下において、読みたくても読めない状況はだれでもあるはずです。暗いので読めない、両腕がふさがっているので本が持てない、満員電車で本を拡げることができないという状況などです。私も子どもがまだ小さく、家の中が騒がしくてテレビなどがとても観れたののではないので、よく聴覚障害者向けに提供されている字幕を表示させるということを普通にやっています。アクセシビリティを必要とする人と環境の境はとてもあいまいです。
ユーザーにはメタデータの提供を通じて、資料のジャンルだけではなく、さらに一歩踏み込んで、コンテンツ1点1点に対してアクセシビリティの観点からどのような性質を持つものかという情報を提供し、ユーザーが自分の能力、置かれた状況を勘案して利用の可否を判断することができる情報の提供が必要だと感じていましたが、EPUBアクセシビリティメタデータの考え方はまさにそれです。
こういう情報が広い範囲で提供できるようになったら、「障害者向け」とそうでない資料の区別なく、広い範囲から自分が利用できるコンテンツを探し出すことができます。繰り返しになりますが、見つけられないコンテンツはそのユーザーにとって存在しないと同義です。障害者向け資料とそうでない資料は、数において後者が圧倒的に多いのですから、その1%でも利用できることがわかれば、選択肢が大幅に広がります。1つ1つのコンテンツをアクセシブルに制作して、アクセシブルなコンテンツを総量として増やしてくことも重要ですが、既存のコンテンツを利用できるようにすることも、ユーザーの選択肢を増やすという意味においては同程度以上に重要です。
私が知る限り、国内ではこれまでアクセシビリティメタデータの議論はあまりされてはいない印象でしたが、今年は、Advanced Publishing Laboratory Accessibility WGの場において、EPUB についてアクセシティメタデータの議論も行われるようになりました。議論の内容もさることながら、議論される事自体が画期的かもしれません。来年以降はこの動きが他にも広がることを期待しています。
明日12月15日は、kobatatakayuki さんの記事です。
図書館が視覚障害者等のためにテキストDAISY的なEPUBを制作した場合のメタデータ(EPUB Accessibility 1.0準拠)
公共図書館や点字図書館が著作権法第37条第3項の権利制限規定に基づいて、視覚障害者等のためにテキストDAISYを作るようにEPUBを作成した場合のPackage Documentファイル(OPFファイル)に包含するメタデータを考えてみました。EPUBのアクセシビリティ仕様であるEPUB Accessibility 1.0の要件を可能な限り満たすメタデータを目指しました。
今回は、仮にEPUBを制作する図書館を「XXX図書館」とし、この図書館が、『ローマ帝国の崩壊: 文明が終わるということ』(ブライアン・ウォード=パーキンズ 著、南雲泰輔訳)を原本にたEPUB作成した場合を想定してみました。
原本となる書籍の特徴
- 責任者に著者と訳者がいる。
- テキストが主体の書籍だが、図(テキストがベースの図も含む)や地図、写真、グラフが用いられている。
- テキストの一部にルビがふられている(ただし、訳語に原語の発音をカタカナ表記でルビをふったもの)。
想定されるEPUBの特徴
視覚障害者等のためにテキストDAISYを作るようにEPUBを制作するということで、通常のリフロー型のEPUBであるということに加えて、以下のようなアクセシビリティの要件が追加されると想定します。
- 原本のページ情報が追加されている。
- 原本にあるルビはルビタグを用いて表示される(逆にいえば、原本にルビのない箇所にはルビを追加しない)。
- 図や地図、写真、グラフが画像として挿入される場合は、代替テキストあるいは説明が長くなる場合は長い説明が追加されている。
- DRMは用いない(DAISYだからDRMは不可というわけではないですが、用いないほうが利用者のリーディングシステムの選択の幅が拡がるのでないほうが望ましい)
以上で、おそらくWCAG 2.0 Level AAに準拠することになるのではないかと思われます。
想定されるEPUBのメタデータ
EPUB Accessibility 1.0の要件を可能な限り満たすメタデータを包含します。
また、著作権法第37条第3項の権利制限規定に基づいて製作されたDAISY的なEPUBならば、その原本の出版事項はメタデータに入れておく必要があります。しかし、EPUBの仕様に規定されるメタデータだけでは、語彙が不足するようなので、接頭辞”dtb”を宣言して、DAISY3の仕様から語彙を一部使用することにしました(ただし、DAISY3のメタデータの語彙が定義されているURIが見つからないので、URIはとりあえずの仮のもの)。
作ってみたEPUBのメタデータ
作ってみたメタデータは以下の通りです。EPUB Accessibility 1.0の要件に関係してくるのは、「アクセシビリティ情報」以下のところです。
なお、タイトルや責任者名にヨミを入れているのは、今回なんとなく入れてみたという次元のもので、必須というものでもないようです(DAISYでは入れられている例はあまり見たことがない)。
接頭辞”schema”や”a11y”は、EPUB Publications Reserved Prefixesで予約済みなので、今回、接頭辞として宣言したのは、”dtb”のみです。。
実際に作ろうとすると、悩むところが多かったです。正しいかどうか・・・・
<?xml version="1.0" encoding="UTF-8"?>
<package
xmlns="http://www.idpf.org/2007/opf"
unique-identifier="uni_id"
version="3.0">
<metadata xmlns:dc="http://purl.org/dc/elements/1.1/">
<!-- 識別子 -->
<dc:identifier id="uni_id">urn:uuid:4dafre9c99rkfkrfirlelir84448kckc8kiiri393943cdrerre434343gbghtht</dc:identifier>
<!-- タイトル -->
<dc:title id="title">ローマ帝国の崩壊 : 文明が終わるということ</dc:title>
<meta refines="#title" property="file-as">ローマ テイコク ノ ホウカイ : ブンメイ ガ オワル ト イウ コト</meta>
<!-- 責任者 -->
<dc:creator id="creator1">ブライアン・ウォード=パーキンズ </dc:creator>
<meta refines="#creator1" property="role" scheme="marc:relators">aut</meta><!-- 役割:著者 -->
<meta refines="#creator1" property="alternate-script" xml:lang="en">Ward-Perkins, Bryan</meta>
<meta refines="#creator1" property="display-seq">1</meta>
<dc:creator id="creator2">南雲泰輔</dc:creator>
<meta refines="#creator2" property="role" scheme="marc:relators">trl</meta><!-- 役割:訳者 -->
<meta refines="#creator2" property="file-as">ナグモ, タイスケ </meta>
<meta refines="#creator2" property="display-seq">2</meta>
<!-- フォーマット-->
<dc:format>application/epub+zip</dc:format>
<!-- 言語 -->
<dc:language>ja</dc:language>
<!-- 著作権情報 -->
<dc:rights>このEPUB出版物は、著作権法第37条第3項の規定に基づき、障害等の理由により原本をそのままでは利用できない方のためにXXX図書館が制作したものです。著作権法に定められた権利制限規定に該当する場合を除き、又貸し、複製等による第三者への提供はできません。 </dc:rights>
<!-- EPUB製作機関情報 -->
<dc:publisher>XXX図書館</dc:publisher>
<dc:date>2017-07-30T22:34:23Z</ dc:date >
<meta property="dcterms:modified">2017-07-31T23:38:37Z</meta>
<!-- 原本出版情報 -->
<dc:source id="isbn_id">urn:isbn: 978-4-560-08354-3</dc:identifier>
<meta refines="#isbn_id" property="identifier-type" scheme="onix:codelist5">15</meta>
<!-- ↑原本のISBNが13桁の場合は"15"、原本のISBNが10桁の場合は"02" -->
<meta refines="#isbn_id" property="source-of">pagination</meta>
<!-- ↑EPUBに原本のページ情報を埋め込んだ場合にそのページ情報のソースがこの原本であるということをこれで記述 -->
<!-- アクセシビリティ情報 -->
<!-- accessMode -->
<meta property="schema:accessMode">textual</meta><
<meta property="schema:accessMode">visual</meta>
<meta property="schema:accessMode">textOnVisual</meta>
<meta property="schema:accessMode">chartOnVisual</meta>
<!-- accessModeSufficient -->
<meta property="schema:accessModeSufficient">textual,visual</meta>
<meta property="schema:accessModeSufficient">textual</meta>
<!-- accessibilityFeature -->
<meta property="schema:accessibilityFeature">alternativeText</meta>
<meta property="schema:accessibilityFeature">readingOrder</meta>
<meta property="schema:accessibilityFeature">tableOfContents</meta>
<meta property="schema:accessibilityFeature">printPageNumbers</meta>
<meta property="schema:accessibilityFeature">structuralNavigation</meta>
<meta property="schema:accessibilityFeature">unlocked</meta>
<meta property="schema:accessibilityFeature">displayTransformability</meta>
<meta property="schema:accessibilityFeature">longDescription</meta>
<meta property="schema:accessibilityFeature">structuralNavigation</meta>
<!-- schema:accessibilityHazard -->
<meta property="schema:accessibilityHazard">noFlashingHazard</meta>
<meta property="schema:accessibilityHazard">noMotionSimulationHazard</meta>
<meta property="schema:accessibilityHazard">noSoundHazard</meta>
<!-- schema:accessibilitySummary -->
<meta property="schema:accessibilitySummary">全ての図、写真、グラフ等には代替テキストが提供されているか、長文になる場合は、その近くにそれらの長い説明テキストが挿入されています。このEPUB出版物はWCAG 2.0 Level AAに準拠しています。</meta>
<!-- WACGへの適合レベル-->
<meta property="a11y:certifiedBy">XXX図書館</meta>
<link rel="dcterms:conformsTo" href="http://www.idpf.org/epub/a11y/accessibility-20170105.html#wcag-aa"/>
</metadata>
<manifest>
…
</package>
作ってみた感想
語彙の追加
テキストDAISY的に作る場合は、原本出版社(sourcePublisher)や原本出版年(dtb:sourceDate)を入れたい。DAISY3の語彙を使用したいが、DAISY3の語彙を定義しているURIがよく分からず、困った(未だに解決していない)。
アクセシビリティメタデータ
アクセシビリティメタデータについては、以下を参照。
アクセシビリティ情報として、追加したSchema.orgのメタデータは、”WebSchemas/Accessibility“(imagedriveさんによる日本語訳)を参考に入力しましたが、個々の値については、Schema.orgの本サイトを含め、どこにも説明がされてないものが多く、どの値を入れるべきか迷うところが多かったです。例えば
- accessMode:値に”chartOnVisual”、”textOnVisual”など”〜OnVisual”というものが用意されているが、”visual”と区別するのか(視覚機能が必要という点では全て同じように思えるが、画像として表示されるテキスト、グラフ区別する必要があるのか)
- accessibilityFeature: “rubyAnnotations”について。ごく一部分の提供でも”rubyAnnotations”は入れるべきなのか。また、ルビの目的に制限はないのか(今回は、原本のルビが補足情報の追加が目的でアクセシビリティ機能の追加ではないので、この値は使用しなかった)。
- WACG以外に適合させるガイドライン、規格は特に思いつかなかった。その場合、「最適化されたEPUB出版物」の要件として求められる「最適化(規格またはガイドライン識別)の要件」に適合できないということになるのか、そのあたりがよく分からなかった。代替手段として、accessibilitySummaryにきちんと書いておけばよいのか。
dcterms:conformsToにWCAGのどのレベルに準拠しているかを記入することが求められていますが、あわせて”a11y:certifiedBy”で誰がそれを証明するかを記入することも求められています。本当は第三者の外部機関に証明してもらうことが一番でしょうが、図書館で費用をかけて個々のEPUBに外部に証明してもらうのは、難しいとおもわれますので、おれおれ証明になりますが、制作館である「XXX図書館」が証明することにしました。仕様にも出版社が証明者になる例があるので、問題ないはずですが・・・
※2017/08/01 追記
imagedriveさんがWebSchemas/Accessibilityに追記された訳注を参考に、一部メタデータを修正しました。
具体的には以下を追加しました。
<meta property="schema:accessibilityFeature">tableOfContents</meta>
<meta property="schema:accessibilityFeature">displayTransformability</meta>
迷ったのは、すでに記入していた以下のメタデータです。番号付き見出しをEPUB出版物全体をとおして正しく使用できるかどうか。該当する場合としない場合がありそうですが、今回は該当するという前提で残しました。
<meta property="schema:accessibilityFeature">structuralNavigation</meta>
※2017/08/03 追記
dc:rightsに著作権情報(著作権法第37条第3項の権利制限規定に基づいて制作されたこと)を追加しました。DAISYならほぼ当然のことですが、EPUBだと必要でしょうか。おそらく
<!-- 著作権情報 --> <dc:rights>このEPUB出版物は、著作権法第37条第3項の規定に基づき、障害等の理由により原本をそのままでは利用できない方のためにXXX図書館が制作したものです。著作権法に定められた権利制限規定に該当する場合を除き、又貸し、複製等による第三者への提供はできません。 </dc:rights>
※2017/08/09 追記
DAISY3のメタデータを追加して原本出版社(sourcePublisher)や原本出版年(dtb:sourceDate)を入れていましたが、DAISY3のメタデータの語彙を定義するURIがみつからないので、原本出版社(sourcePublisher)や原本出版年(dtb:sourceDate)及び接頭辞”dtb:”の定義部分を削除しました。EPUB3の仕様にもあるとおり、dc:sourceに原本のISBNを入れることで、原本を一意に指定できるので、それでよしとしました。ISBNを持たない資料を原本とする場合は、<dc:source id=”###”>Publisher, YYYY, 1st edition, hardback</dc:source>のように原本の出版情報を直接、書けばよいみたいです(参考: Source of pagination for books without ISBN | International Digital Publishing Forum)。
<?xml version="1.0" encoding="UTF-8"?>
<package
xmlns="http://www.idpf.org/2007/opf"
unique-identifier="uni_id"
version="3.0"
prefix="dtb: http://www.loc.gov/nls/z3986/2005/dtbook"
>
<!-- 原本出版情報 -->
<dc:source id="isbn_id">urn:isbn: 978-4-560-08354-3</dc:identifier>
<meta refines="#isbn_id" property="identifier-type" scheme="onix:codelist5">15</meta>
<!-- ↑原本のISBNが13桁の場合は"15"、原本のISBNが10桁の場合は"02" -->
<meta refines="#isbn_id" property="source-of">pagination</meta>
<!-- ↑EPUBに原本のページ情報を埋め込んだ場合にそのページ情報のソースがこの原本であるということをこれで記述 -->
<meta property="dtb:sourcePublisher">白水社</meta>
<meta property="dtb:sourceDate">2014</meta>
余談ですが、EPUB 3.1の仕様 では、dc:sourceに対して言及はされているものの、dc:sourceそのものの項目がばっさり削除されていますね・・・。上のやり方(特に原本のページ番号を埋め込んでいるという”pagenation”という情報)は3.1でも使えるのかどうか・・