DAISYも提供する米国O'Reillyの電子書籍のマルチフォーマット対応

 今回は今更ながら、米国O’Reilly Mediaの電子書籍のマルチフォーマット対応がすばらしいという話。
 PDF、EPUB、mobi(Kindle形式)の他、全てではありませんが、ほとんどのタイトルでDAISY版が提供されています。AかBかではなく、AもBもだという姿勢がすごくいい。
スクリーンショット 2013-08-12 23.42.30
O’Reilly Mediaの電子書籍ダウンロード画面
 米国O’Reillyのマルチフォーマット展開については、『マニフェスト 本の未来』(ボイジャー)に「あらゆる場所への流通」という題で寄稿しているO’Reilly Mediaのアンドリュー・サヴィカス氏の文章が詳しいですが、このサヴィカス氏の文章によるとソースファイルはDocBook XMLが採用されているようです※。

※2013/08/13 追記
O’Reilly Mediaは執筆用フォーマットとしては、DocBookからAsciidocに移行しようとし、さらにHTMLBookに移行しようとしているとの情報をいただきました。ありがとうございました!
 ちなみに提供されているDAISYはDAISY3版のテキストDAISYです。
スクリーンショット 2013-08-12 23.45.55
例:”EPUB 3 Best Practices”のDAISY版
 ひさしぶりに米国O’Reillyをのぞいてみたら、Dropbox、Google Drive、Kinleへの送信機能まで実装されていた。ますます素晴らしい。
27

日本よっ!これがOpen Annotationだっ!!

 我々は様々なサービスやデバイスを通じて、デジタルリソースに対してコメントなどの付加的な情報を日々付与しています。ウェブサイトにはソーシャルブックマークサービスを経由してコメントが大量につけられていますし、Flickr、Youtube、ニコニコ動画などのWebサービスが抱えるリソースに対して大量のコメントが付与されています。Twiiter、FacebookなどのSNSはリソースに対する付加的な情報の付与に特化したサービスといってもよいかもしれません。昨今の電子書籍ビューワーでは、ハイライトやコメントの付与する機能は当然のように備えていますし、電子書籍プラットフォームでは「ソーシャルリーリング」という名前のアノテーションサービスが提供されています。
 どのサービスもあるリソースに対する付加的な情報を他のユーザーや他のデバイスと共有することを目的としています。しかし、残念ながら共有できるのは、プラットフォーム内のユーザー同士のみであったり、プラットフォームが抱えるコンテンツに対するコメントのみであったりと、リソースに対して日々生成される大量の付加的な情報はプラットフォームごと、デバイスごとに分断されてしまっています。それぞれが独自の方法で機能を実現しているためにプラットフォームの枠を超えた共有が基本的にできません。異なる携帯電話会社同士では通話やメールができない時代がありましたが、それと同じ状況になっています。
platform
 リソースに対して付加的な情報を付与し、異なる情報同士を結びつける行為は学術情報の共有と連携に不可欠なものですが、デジタルリソースに対する付加情報の共有が十分にできないため、学術分野におけるデジタルリソースの活用の大きな障害になっています。
 この問題に注視し、デジタルリソースに対する付加的な情報の付与をオープンスタンダード化することでプラットフォームの枠を超えた相互運用を可能とし、付加的な情報(アノテーション)の再利用・共有を可能にしようとしている動きがOpen Annotationです。

Open Annotationとは

 Open Annotationはクライアント、サーバ、アプリケーション、プラットフォームの枠を超えて、アノテーションを共有できるようにすることを目的しています。ただし、これはアノテーションが全てオープンアクセスであることを求めているものではなく、認証によってアノテーションへのアクセスがプラットフォームの会員に制限されることを排除するものではありません。Open Annotationはアノテーションのプロトコルによるやりとりよりはアノテーションの表現部分に焦点を置いており、この表現部分を標準化することで、アノテーションの相互運用性を向上させようとしています。
 Open Annotationがアノテーション付与の対象とするデジタルリソースは、Webサイトに限りません。PDF、EPUB、動画、音声、画像などデジタルリソース全般を対象としています。
 アノテーション(Annotation)は、英和辞典の多くで「注釈、注記、注解」と訳されていますが、Open Annotationにおけるアノテーションでは「異なる情報同士を結びつけれたもの」であり、もう少し広い意味で用いられています。例えば、以下のような行動が「アノテーションの付与」に含まれています。

  • コメントの付与
  • ハイライト
  • タグ付け
  • ブックマーキング
  • 質問や回答

 Open Annotationにおけるアノテーションの本質は、オリジナルのコンテンツ本体に異なる別のレイヤーとして付加的な情報を追加することです。オリジナルコンテンツを改変せずに(オリジナルコンテンツの真正性を担保しつつ)、情報を追加すると言い換えてもよいかもしれません。
コンテンツレイヤーにアノテーションレイヤーを追加する
 このOpen Anntotationを進めているのは、Open Annotation Collaboration(OAC)Annotation Ontology (AO)であり、この2団体によってW3C内に設立されたOpen Annotation Community Groupです※1。そして、このCommunity Groupで議論され、公開されたのが以下の仕様です(どちらもCommunity Draft)。

 仕様の安定的な運用と変化への柔軟な対応を両立させるために、仕様をOpen Annotation Data ModelOpen Annotation Extension Specificationの2つに分けて、長期にわたり大きく変更する必要がない基本的な機能を前者の仕様としてまとめ、コミュニティへのフィードバックの反映や状況の変化への対応は後者の拡張仕様(Extension Specification)で行うという棲み分けがされているようです。
 

Open Annotation Data Model

 Open Annotation Data ModelはアノテーションのためのRDFベースのLinked Open Dataスタンダードです。
 Open Annotationの基本的なアノテーションのモデルは以下になります。targetがアノテーションを付与する対象となるコンテンツ、bodyが付与されるアノテーション本体を指しています。
body、annotation、targetからなる基本的な図
 コメントなしのブックマークやハイライトの場合は、アノテーションとなるコンテンツ部分はありません(body部分がありません)ので、以下のようになります。
annotation、targetのみのモデル
 リソース内部の任意の位置を参照してアノテーションを付与するモデルです。

 キャッシュに保存されたリソースやInternet Archiveなどにアーカイブされたウェブサイトなどある時点のリソースに対するアノテーションの付与のモデルです。

 以上、ほんの一部ではありますが、Open Annotation Data Modelの紹介でした。
Open Annotation Data Modelでは、その他、タグ付けのモデル、複数のターゲットに対する複数のアノテーションなどが様々なモデルが規定されています。

リソース内部の任意の位置を参照する

 出版物の特定の箇所にコメントをつけたり、ハイライトするように、アノテーションはリソース内部の一部分に対して付与されることがあります。リソースの一部分に対してアノテーションを付与するためには、アノテーションを付与する側がリソース内部を任意に部分指定できなければなりません。フラグメント識別子(URLの先の#から始まるもの)を用いることが考えられますが、以下の理由で既存のフラグメント識別子の仕様を活用するだけでは目的をはたせないということで、

  • 多くのファイル形式にフラグメント識別子に関する仕様が存在しない。
  • 仕様が存在しても記述が正確とはいえないものがある。
  • メディアタイプが判明しないと、フラグメント識別子を正確に解釈することができない。
  • システムがリソースの内部まで参照しないことがある。

 Open Annotation Data Modelでは、既存のフラグメント識別子の仕様を活用しつつ、既存の仕様で足りない部分を補うために以下のセレクタという指定子が用意されています(”Open Annotation Data Model Module: Specifiers and Specific Resourcess“)。

  • Range Selectors
    • Text Position Selector
    • Text Quote Selector
    • Data Position Selector
  • Area Selectors
    • SVG Selector

  詳細はOpen Annotation Data Modelのエディタの1人であるPaolo Ciccarese氏の以下のスライドをご覧ください。 

Open Annotation, Specifiers and Specific Resources tutorial from Paolo Ciccarese
  
 なお、Open Annotation Data Modelには、既存のフラグメント識別子の仕様として以下の仕様が掲載されています。

形式 フラグメント識別子の仕様
HTML,XHTML RFC3236
PDF RFC3778
プレーンテキスト RFC5147
XML RFC3023
RDF/XML RFC3870
画像・動画・音声 Media Fragments.
SVG SVG

  EPUBにはEPUB CFI(Canonical Fragment Identifier)というEPUBコンテンツ内部の任意の位置を参照・指定できるフラグメント識別子の仕様がすでにあります。Fragment SelectorとしてまだOAMの仕様には掲載されていませんが、EPUBで使うならこの仕様でしょう。

 

さいごに

 Open Annotationという言葉を最近、いろいろなところで目にするようになりました。
 WebアノテーションサービスHypothes.isはOpen Annotation Data Modelを活用していますし、

 最近、公開されたJavaScirptベースのEPUBビューワーのepub.jsはOpen Annotationの実証実験のために公開されたものだそうです。

 図書館関係者を賑わしているBIBFRAMEはOpen Annotaiton Modelを参照しています※。

※2013/08/29 追記
8/26に公開されたドラフトでOpen Annotationに触れていた箇所がばっさりと削られたようです。4月から8月の間に一体何が・・・というあたりはBIBFRAMEのMLを追っていけばわかるのでしょうか(すいません。そこまでは追えてません・・・・)。ちなみに7月に”BF annotation and OA annotation”というスレが立てられていました。
 Open Annotation Collaborationで行われた実証実験では、デジタルアーカイブに対するアノテーションの付与や学術出版の共同編集作業、ストリーミング動画に対するアノテーションの付与などが試みられており、Open Anntotationが覆う領域の広さを伺わせます。

 現在、アノテーションサービスは、プラットフォームが個別に提供するものになってしまっていますが、アノテーションの標準化が進めば、例えば、個々の機関リポジトリやデジタルアーカイブ、学会ホームページがそれぞれでアノテーションサービスを提供したとしても、相互運用性の向上により、理想的にはWebリソースのような、「ばらばらに作成されたけれども1つの大きなアノテーションの世界」をつくることができるようになります。Webにもう1つのレイヤー、アノテーションレイヤーを追加する試みはMosaicブラウザでも検討されたことがあり、その後、Googleも含めていくつかのプラットフォームでも試みられたことがありましたが、まだ成功と言えるものは存在していません※2。単体のプラットフォームが覆うにはデジタルリソースの世界は大きすぎるということでしょう。Open Annotationの推し進める標準化によって、個々の活動が結果として1つのアノテーションの大きな世界になり、もう1つの大きな世界(デジタルリソース)を覆うようになれば、デジタルリソースの活用がもう1つ別の次元に進むかもしれません。
 W3C内のOpen Annotationの検討体(Open Annotation Community Group)はまだCommunity Groupですが、2014年にはいよいよWorking Groupが立ち上げられ、Open Annotation Data Modelの仕様化が本格化する可能性があるようです※3。数年後にはブラウザや電子書籍ビューワーで標準で対応するようになるかもしれません。しばらくOpen Annotationの動向から目が離せません。
※2014/8/25 追記
日本時間で8月21日にWeb Annotation Working GroupがW3CのDigital Publishing Activityの下に設置されました。W3cの仕様化のトラックにのったことになります。このWGについて改めて紹介記事を書きました。

※1 W3CのCommunity GroupはWorking Groupの前の段階に置かれている検討体です。詳細は以下のエントリをご参照ください。

※2 過去のアノテーションの動向については、以下が参考になります。

※3以下のスライドを参照。

関連エントリ

あらゆるデバイスのUIをユーザーに最適化・アクセシブルにいつでも変換するプロジェクトGlobal Public Inclusive Infrastructure (GPII)

 今回はミツエーリンクスさんのブログのエントリ「アクセシビリティに影響を及ぼした10の出来事」で紹介されていたGlobal Public Inclusive Infrastructure (GPII)を紹介します。スイスに拠点をおく国際団体Raising the Floor (RtF)によって進められているコンピュータやウェブ、プラットフォームのインターフェイスをクラウドベースでよりアクセシブルにするプロジェクトです。
Global Public Inclusive Infrastructure (GPII)
http://gpii.net/
 GPIIは標準的なデバイスのインターフェイスでの利用に困難を感じる人たちのために、いつでもどこでもどんなデバイスを使用していても、その標準的なインターフェイスをクラウド経由で各ユーザーに最適化されたアクセシブルなインターフェイスに変換して提供することを目的としています。
 以下の動画がGPIIの概要を非常にわかりやすく紹介しています。

 上の動画に使用されているイメージをお借りしてGPIIのインターフェイス変換の仕組みを紹介すると以下のようになるようです。開発途上のようですので、あくまでイメージです。
ユーザーに最適化されたインターフェイスへの変換は以下の3つの機能をもったシステムを連携させることで実現されます。黄色がユーザー情報を格納する機能を受け持ち、緑色が様々な支援技術機能を格納する機能、オレンジ色が様々なデバイスの情報を格納する機能を受け持ちます。 
スクリーンショット 2013-07-23 1.47.17
 まずユーザーは、自分自身に適したインタフェースをGPIIのクラウドサーバーにウィザードを用いて登録します。これは上の黄色部分のシステムに登録されます。登録されたパーソナルプロファイルは、インターフェイスのパーソラナイズに使用されます。
スクリーンショット 2013-07-24 0.28.40
 
 
 実際にデバイスのインターフェイスの変換を行うフローは以下になります。
 GPIIのサーバーにアクセスするとまずは黄色部分のシステムにつながります。そこでユーザーが登録したパーソナルプロファイル情報を取得します。
スクリーンショット 2013-07-23 2.04.11
 
 パーソナルプロファイル情報を取得したら、引き続き様々な支援技術機能を格納するサーバー(緑色)に引き継がれます。ここにはアクセシビリティ開発者が様々なニーズに応えるために開発した様々な支援技術が格納されています。この緑色部分に格納された様々なツールを用いてユーザーに適した形式に変換します。テキストを音声に変えたり、テキストを点字に変換するような機能をここで担ったりするのでしょうか?
スクリーンショット 2013-07-23 1.50.45
  
 緑色部分のシステムでユーザーが求めるインターフェイスに適した形式に変換したら、次はオレンジ色部分のシステムに渡されます。ここでは、様々なデバイスに関する情報を格納されていますので、デバイス情報を取得します。
スクリーンショット 2013-07-24 1.19.07
 
 最終的にユーザーとデバイスに最適化されたインターフェイスに変換してユーザーのデバイスに戻します。便宜上、インターフェイスという言葉を用いていますが、もちろん見た目の表面的なものだけではなく、インターフェイスから提供される情報も変換して渡されるのだろうと思います。
スクリーンショット 2013-07-23 1.49.33
 
 Global Public Inclusive Infrastructure (GPII)の「基盤(Infrastructure )」という言葉が意味するように、GPIIはアクセシブルなインターフェイスに変換する新技術を開発してそれを提供しようというよりは、その下の部分、つまり、支援技術をユーザーに提供するために必要な基盤になることを志向しています。GPIIが基盤となり、その上で支援技術をのせることで、支援技術の独自開発が必要な部分を減らし、さらには各技術の相互運用性を向上させる。そうすることで、多種多様な支援技術の開発を促し、それを手頃な価格でクラウド経由であらゆる場所に行き渡らせる。そんなことを目指しているようです。
 GPIIの支援技術開発支援の一例ですが、GPIIは容易かつ低コストに支援技術を開発するツールなどを開発者に提供することで、開発のハードルを下げ、様々なツールの開発を促そうとしています、さらに開発した支援技術を世界中に行き渡らせるためのプラットフォームも用意するそうです(それが緑色部分のシステム)。
スクリーンショット 2013-07-23 1.52.50
 対象となる「あらゆるデバイス」には空港の発券機や飛行機の座席の背面に据え付けてあるモニタなど公共の場で使用されている据え付けの機器も含まれているようです。これが実現できたら本当に凄いことです。
 一番優れたUIとは何か、という議論に結論が出るとは思えませんが、個々のユーザーとそのユーザーが使用するデバイスに最適化されたUIは、この種の議論の究極に近いところの答えの1つではないかと思います。