10月 07

RDAのバーバラ・ティレット氏講演会「Linked Open Dataによる書誌コントロール:Bibliographic Framework Initiativeのめざすもの」に参加してきました

 RDA、Linked Open Data、そして、BIBFRAME。「おらたち、熱いよね!」と迫ってくるかのようにこの3つの言葉が目によく飛び込んでくる今日この頃です。私も関心はありつつも、「今スイッチ切っているだけだからね」と言い訳しつつ、いつかやる気を出すであろう未来の自分をあてにしていたら、スイッチが入らないまま今日に至ってしまいました。「わかるやつだけわかればいい」といつまでも言っていられるのかわかりませんし、自分の興味を喚起するためにもRDA開発合同運営委員会議長のバーバラ・ティレット(Barbara Tillett)氏の10月6日の講演会(以下)に育児の合間をぬってヒットアンドアウェイ的に参加してきました。

 ティレット氏の講演内容をまとめるほどメモをとっていないので、今回は浅薄な感想を述べる程度にとどめておきます。講演の記録は同志社大学の紀要に掲載されるそうですので、そちらをご覧ください。

 ティレット氏の講演を聴いていて、つまるところ、RDAやBibliographic Framework Initiative (BIBFRAME) が目指すところは

 メタデータの各エレメントの独立性を高めて、エレメントレベルでユーザーが任意の形で再利用可能にする

ということなのかなと思いました。

  図書館がこれまでMARCにのせて作成してきたメタデータは紙のカード目録をそのまま電子に置き換えたものであり、それで完結してしまっている静的なものである。機械がメタデータ間の関係を理解できない。RDAやBIBFRAMEはその逆をしたいとであろうと。
  
 メタ情報をRDFで表現し、各エレメントにすべてURIなどの識別子を持たせて、メタデータ単位だけではなく、エレメント単位をリンクでつなげて関係を持たせる。もちろんその関係を機械が理解できるもので、ユーザーが望む形にメタデータを再利用可能にできる、という感じの。

 各エレメントに個別のURIなどの識別子を持たせてというところがポイントなのでしょうか。そういうのなしにメタデータをエレメントレベルに細分化してしまったら、「ぼっちゃん」というタイトルや「夏目漱石」という著者名もただの文字列の情報になってしまい、元に戻せませんし、他に流用してもそれはただのコピーカタロギングになってしまいます。一度ばらしたら再構築できない。

 BIBFRAMEというものに「フォーマット」ではなく、「フレームワーク」という言葉が使用されている理由が、これまでよく分かりませんでしたが、今回の講演で「メタデータフォーマット」が、エレメントを所定の形で固めたメタ情報のパッケージフォーマットであることを改めて認識しました。メタ情報を細分化可能にし、個々のエレメントレベルで再利用できるようにするというのが、BIBFRAMEの目指すところならば、たしかにそれはパッケージフォーマットではなく、枠組み、仕組みというもので、フレームワークという言葉が使用される理由もなんとなくそういうことで理解しました。ただし、この理解でよいならばフォーマットとフレームワークの境界線はかなり曖昧です。

 上のような理解でよいならば、シンプルな話であるように思えるのですが、RDAがFRAD(参考: 典拠データの機能要件(日本語訳)[PDF])とともにベースにしているという概念モデルのFRBR(参考: 書誌レコードの機能要件(日本語訳)[PDF])が分かりづらくしているような気がするなぁと思ったりもしまして(もっとも私はRDAもFRBRのドキュメントも読んでないので、言うなという話ではあります)。これまで作成してきたMARCデータの資産を生かすという要件がなければ、本質的に必要な概念モデルなのだろうかと思ったりもしまして。
  
 WebにはRDFa、Microdata、Microformatsというコンテンツに埋め込むメタデータフォーマットがあります(そして、RDFaやMicrodataを活用するschema.org)。W3Cの人などのこういうのを作った人たちは、メタデータが細分化され、コンテンツ内に偏在していく状況を目指しているのだと思いますが、仮にそういうことが状況になったったとして、RDAやBIBFRAMEのメタ情報もエレメントレベルに分解されてコンテンツ内に偏在されていくのでしょうか。

9月 22

古地図のデジタルアーカイブにOpen AnnotationなアノテーションをつけるMaphubプロジェクト

 今回は、コーネル大学が行っているMaphubプロジェクトの紹介です。古地図のデジタルアーカイブにOpen Annotationなアノテーションをつける実証実験です。

 米国議会図書館から提供された約6000件のパブリックドメインの地図データを使用したデモが公開されています。ここでは、便宜上”Historic Map”を「古地図」と訳しましたが、1990年代の地図も公開されていたりと結構新しい年代の地図も使用されているようです。

 デモサイトでどのようなことができるのかを紹介する動画が公開されています。

Maphub Demo Screencast from slhck on Vimeo.

 詳しくは上の動画をみていただければと思いますが、

範囲を選択して

コメントをつけたり、タグ付けしたり ←(1)

GeoNamesなどのURIと組み合わせて地理参照(georeference)させる、つまり、地理的な識別子を古地図の画像データに付与したり ←(2)

できるようです。

 Open Annotation Data Modelを利用してどのようにアノテーションが表現されているかは以下のドキュメントで紹介されています。

(1)のコメントの付与やタグ付けのモデルは以下になります。

図  Open Annotation Commentarial Annotation

(2)の地理参照(georeference)のモデルは以下になります。

図 Open Annotation Georeference Annotation (Control Point)

以上、ここに掲載した図や画像はMaphub Open Annotation API Documentationからの転載でした。

 Maphubプロジェクトはフェーズ2を終了したところのようで、実証実験の報告書が公開されています。

関連エントリ

9月 19

Open Annotationで動画にコメントをつけるOpen Video Annotation Project

 Web上に公開された動画にコメントをつけるOpen Video Annotation Projectというプロジェクトのウェブサイトが公開されています。Open Annotation Data Modelが採用されています。

Open Video Annotation Project
http://openvideoannotation.org/

 Twitter上のやりとりからおそらく公開されたのは9/17前後でしょうか。このプロジェクトはハーバード大学のヘレニズム学センター(The Center for Hellenic Studies)のイニシアチブによって進められているようです。なぜここが・・という事情はよくわかりませんが、なんとなく属人的な事情のような気がします。

公開されたばかりであるためか、サイトに情報があまり掲載されていませんが、デモ動画が公開されており、コメントを付与してみることができます。

Explore Open Video Annotation

関連エントリ

8月 03

Open Annotationとウェブアーカイブのちょっとした関係

 先のエントリでOpen Annotationの紹介をしましたが、余談としてOpen Annotationとウェブアーカイブのちょっとした関係を1つ。

 Open Annotation Data Modelのエディタの1人にロスアラモス国立研究所のHerbert Van de Sompel氏が名を連ねています。Sompel氏はOpen Annotation Collaboration(OAC)でプロジェクトのフェーズ1から主任研究員(principal investigator)の1人としてOpen Annotationに中心人物として参加され続けているようです。このSompel氏、このブログで時々紹介しているウェブアーカイブプロジェクトMementoの方でもありまして(その他、いろいろな顔をお持ちですが)、忙しいにも関わらず毎日、Mementoの“SiteStory Web Archiveのデモ用に自分の写真をBBCのトップページとともにを毎日公開している方でもあります。

 

 Open Annotatationとウェブアーカイブに関係する部分ですが、Open Annotation Data Modelの「3.3.1. Time State」あたりにでています。ウェブアーカイブされたウェブサイトなどデジタルリソースの過去のバージョンを参照するモデルを規定するところです。例示としてMementoプロトコルが言及されていますね

Time Stateのモデル
Time Stateのモデル

 
 Open Annotation Core Data Model Example Listには上のモデルの例示が掲載されています(ウェブアーカイブされたコンテンツがターゲットではありませんが)。

  <x:MyAnno> a oa:Annotation ;
    oa:hasBody <http://www.youtube.com/watch?v=uPh81LIe7B8> ;
    oa:hasTarget <urn:uuid:5D9AD68D-2043-4C77-A40C-ECB00F6248F9> .

  <urn:uuid:5D9AD68D-2043-4C77-A40C-ECB00F6248F9> a oa:SpecificResource ;
    oa:hasSource <http://en.wikipedia.org/> ;
    oa:hasState <urn:uuid:681821DE-E7C3-4486-9E30-F8B9A75AD16B> .

  <urn:uuid:681821DE-E7C3-4486-9E30-F8B9A75AD16B> a oa:State ;
    oa:when "2012-01-18 12:00:00Z" .

Example ListからリンクされているStateより

関連エントリ

8月 02

日本よっ!これがOpen Annotationだっ!!

 我々は様々なサービスやデバイスを通じて、デジタルリソースに対してコメントなどの付加的な情報を日々付与しています。ウェブサイトにはソーシャルブックマークサービスを経由してコメントが大量につけられていますし、Flickr、Youtube、ニコニコ動画などのWebサービスが抱えるリソースに対して大量のコメントが付与されています。Twiiter、FacebookなどのSNSはリソースに対する付加的な情報の付与に特化したサービスといってもよいかもしれません。昨今の電子書籍ビューワーでは、ハイライトやコメントの付与する機能は当然のように備えていますし、電子書籍プラットフォームでは「ソーシャルリーリング」という名前のアノテーションサービスが提供されています。

 どのサービスもあるリソースに対する付加的な情報を他のユーザーや他のデバイスと共有することを目的としています。しかし、残念ながら共有できるのは、プラットフォーム内のユーザー同士のみであったり、プラットフォームが抱えるコンテンツに対するコメントのみであったりと、リソースに対して日々生成される大量の付加的な情報はプラットフォームごと、デバイスごとに分断されてしまっています。それぞれが独自の方法で機能を実現しているためにプラットフォームの枠を超えた共有が基本的にできません。異なる携帯電話会社同士では通話やメールができない時代がありましたが、それと同じ状況になっています。

platform

 リソースに対して付加的な情報を付与し、異なる情報同士を結びつける行為は学術情報の共有と連携に不可欠なものですが、デジタルリソースに対する付加情報の共有が十分にできないため、学術分野におけるデジタルリソースの活用の大きな障害になっています。

 この問題に注視し、デジタルリソースに対する付加的な情報の付与をオープンスタンダード化することでプラットフォームの枠を超えた相互運用を可能とし、付加的な情報(アノテーション)の再利用・共有を可能にしようとしている動きがOpen Annotationです。

Open Annotationとは

 Open Annotationはクライアント、サーバ、アプリケーション、プラットフォームの枠を超えて、アノテーションを共有できるようにすることを目的しています。ただし、これはアノテーションが全てオープンアクセスであることを求めているものではなく、認証によってアノテーションへのアクセスがプラットフォームの会員に制限されることを排除するものではありません。Open Annotationはアノテーションのプロトコルによるやりとりよりはアノテーションの表現部分に焦点を置いており、この表現部分を標準化することで、アノテーションの相互運用性を向上させようとしています。

 Open Annotationがアノテーション付与の対象とするデジタルリソースは、Webサイトに限りません。PDF、EPUB、動画、音声、画像などデジタルリソース全般を対象としています。

 アノテーション(Annotation)は、英和辞典の多くで「注釈、注記、注解」と訳されていますが、Open Annotationにおけるアノテーションでは「異なる情報同士を結びつけれたもの」であり、もう少し広い意味で用いられています。例えば、以下のような行動が「アノテーションの付与」に含まれています。

  • コメントの付与
  • ハイライト
  • タグ付け
  • ブックマーキング
  • 質問や回答

 Open Annotationにおけるアノテーションの本質は、オリジナルのコンテンツ本体に異なる別のレイヤーとして付加的な情報を追加することです。オリジナルコンテンツを改変せずに(オリジナルコンテンツの真正性を担保しつつ)、情報を追加すると言い換えてもよいかもしれません。

コンテンツレイヤーにアノテーションレイヤーを追加する

 このOpen Anntotationを進めているのは、Open Annotation Collaboration(OAC)Annotation Ontology (AO)であり、この2団体によってW3C内に設立されたOpen Annotation Community Groupです※1。そして、このCommunity Groupで議論され、公開されたのが以下の仕様です(どちらもCommunity Draft)。

 仕様の安定的な運用と変化への柔軟な対応を両立させるために、仕様をOpen Annotation Data ModelOpen Annotation Extension Specificationの2つに分けて、長期にわたり大きく変更する必要がない基本的な機能を前者の仕様としてまとめ、コミュニティへのフィードバックの反映や状況の変化への対応は後者の拡張仕様(Extension Specification)で行うという棲み分けがされているようです。
 

Open Annotation Data Model

 Open Annotation Data ModelはアノテーションのためのRDFベースのLinked Open Dataスタンダードです。

 Open Annotationの基本的なアノテーションのモデルは以下になります。targetがアノテーションを付与する対象となるコンテンツ、bodyが付与されるアノテーション本体を指しています。

body、annotation、targetからなる基本的な図

 コメントなしのブックマークやハイライトの場合は、アノテーションとなるコンテンツ部分はありません(body部分がありません)ので、以下のようになります。
annotation、targetのみのモデル

 リソース内部の任意の位置を参照してアノテーションを付与するモデルです。

 キャッシュに保存されたリソースやInternet Archiveなどにアーカイブされたウェブサイトなどある時点のリソースに対するアノテーションの付与のモデルです。

 以上、ほんの一部ではありますが、Open Annotation Data Modelの紹介でした。

Open Annotation Data Modelでは、その他、タグ付けのモデル、複数のターゲットに対する複数のアノテーションなどが様々なモデルが規定されています。

リソース内部の任意の位置を参照する

 出版物の特定の箇所にコメントをつけたり、ハイライトするように、アノテーションはリソース内部の一部分に対して付与されることがあります。リソースの一部分に対してアノテーションを付与するためには、アノテーションを付与する側がリソース内部を任意に部分指定できなければなりません。フラグメント識別子(URLの先の#から始まるもの)を用いることが考えられますが、以下の理由で既存のフラグメント識別子の仕様を活用するだけでは目的をはたせないということで、

  • 多くのファイル形式にフラグメント識別子に関する仕様が存在しない。
  • 仕様が存在しても記述が正確とはいえないものがある。
  • メディアタイプが判明しないと、フラグメント識別子を正確に解釈することができない。
  • システムがリソースの内部まで参照しないことがある。

 Open Annotation Data Modelでは、既存のフラグメント識別子の仕様を活用しつつ、既存の仕様で足りない部分を補うために以下のセレクタという指定子が用意されています(”Open Annotation Data Model Module: Specifiers and Specific Resourcess“)。

  • Range Selectors
    • Text Position Selector
    • Text Quote Selector
    • Data Position Selector
  • Area Selectors
    • SVG Selector

  詳細はOpen Annotation Data Modelのエディタの1人であるPaolo Ciccarese氏の以下のスライドをご覧ください。 


Open Annotation, Specifiers and Specific Resources tutorial from Paolo Ciccarese
  

 なお、Open Annotation Data Modelには、既存のフラグメント識別子の仕様として以下の仕様が掲載されています。

形式 フラグメント識別子の仕様
HTML,XHTML RFC3236
PDF RFC3778
プレーンテキスト RFC5147
XML RFC3023
RDF/XML RFC3870
画像・動画・音声 Media Fragments.
SVG SVG

  EPUBにはEPUB CFI(Canonical Fragment Identifier)というEPUBコンテンツ内部の任意の位置を参照・指定できるフラグメント識別子の仕様がすでにあります。Fragment SelectorとしてまだOAMの仕様には掲載されていませんが、EPUBで使うならこの仕様でしょう。

 

さいごに

 Open Annotationという言葉を最近、いろいろなところで目にするようになりました。

 WebアノテーションサービスHypothes.isはOpen Annotation Data Modelを活用していますし、

 最近、公開されたJavaScirptベースのEPUBビューワーのepub.jsはOpen Annotationの実証実験のために公開されたものだそうです。

 図書館関係者を賑わしているBIBFRAMEはOpen Annotaiton Modelを参照しています※。

※2013/08/29 追記
8/26に公開されたドラフトでOpen Annotationに触れていた箇所がばっさりと削られたようです。4月から8月の間に一体何が・・・というあたりはBIBFRAMEのMLを追っていけばわかるのでしょうか(すいません。そこまでは追えてません・・・・)。ちなみに7月に”BF annotation and OA annotation”というスレが立てられていました。

 Open Annotation Collaborationで行われた実証実験では、デジタルアーカイブに対するアノテーションの付与や学術出版の共同編集作業、ストリーミング動画に対するアノテーションの付与などが試みられており、Open Anntotationが覆う領域の広さを伺わせます。

 現在、アノテーションサービスは、プラットフォームが個別に提供するものになってしまっていますが、アノテーションの標準化が進めば、例えば、個々の機関リポジトリやデジタルアーカイブ、学会ホームページがそれぞれでアノテーションサービスを提供したとしても、相互運用性の向上により、理想的にはWebリソースのような、「ばらばらに作成されたけれども1つの大きなアノテーションの世界」をつくることができるようになります。Webにもう1つのレイヤー、アノテーションレイヤーを追加する試みはMosaicブラウザでも検討されたことがあり、その後、Googleも含めていくつかのプラットフォームでも試みられたことがありましたが、まだ成功と言えるものは存在していません※2。単体のプラットフォームが覆うにはデジタルリソースの世界は大きすぎるということでしょう。Open Annotationの推し進める標準化によって、個々の活動が結果として1つのアノテーションの大きな世界になり、もう1つの大きな世界(デジタルリソース)を覆うようになれば、デジタルリソースの活用がもう1つ別の次元に進むかもしれません。

 W3C内のOpen Annotationの検討体(Open Annotation Community Group)はまだCommunity Groupですが、2014年にはいよいよWorking Groupが立ち上げられ、Open Annotation Data Modelの仕様化が本格化する可能性があるようです※3。数年後にはブラウザや電子書籍ビューワーで標準で対応するようになるかもしれません。しばらくOpen Annotationの動向から目が離せません。

※2014/8/25 追記
日本時間で8月21日にWeb Annotation Working GroupがW3CのDigital Publishing Activityの下に設置されました。W3cの仕様化のトラックにのったことになります。このWGについて改めて紹介記事を書きました。

※1 W3CのCommunity GroupはWorking Groupの前の段階に置かれている検討体です。詳細は以下のエントリをご参照ください。

※2 過去のアノテーションの動向については、以下が参考になります。

※3以下のスライドを参照。

関連エントリ