W3C Annotation Working Groupの憲章案が公開されている

先のエントリの続報になりますが、W3C Annotation Working Groupの憲章案が公開されています。 Digital Publishing Activityの下に設置されることになったんですね。

 すでにAnnotation Working Groupのメーリングリストは立ち上がっていて、 上の憲章案について意見が交換されています。
 

Open Annotationに関するエントリ

TED「セルゲイ・ブリン: なぜグーグル・グラスなのか?」

今回は、Google Glassの話です。すでに知られすぎているので、今更さらな話ですが、Googleのセルゲイ・ブリンのTEDにおけるGoogle Glassの講演を観て、改めてすごいと思ったのでちょっと紹介。
 
  Google Glassを紹介した動画は以下で、

 Google Glassを語るセルゲイ・ブリンのTEDにおける講演は以下です。

 頭でこういうものだろうと想像できても、映像でみると受ける印象がかなり違いますね。ウェアラブルコンピューティングが少し前からいろいろと話題になっていますが、Google Glassはウェアラブルコンピューティングをわかりやすい形で実現するかもしれません。iPhone以来の新しいカテゴリのデバイスになるのではないかと思ったりも。
 
 Google Glassが私の興味をひいたのは、検索行動そのものが1つ上の段階に進むのではないかと思わせたことです(えっ、今更言うか・・・。
 Googleの検索技術がどんなに進化しても、Googleの基本的はサービスは検索窓からキーワードを放り込んで検索させるテキスト検索です。人が脳内にある探したいものをキーワードに変換してアウトプットせねばならない点では、検索そのものはそれほど進化はしていないともいえます。頭の中にぼんやりとある調べたいこと、探したいことを、キーワードという抽象的なものにものに変換するフローですでにいろいろな情報が削られてしまっている。適切なキーワードに変換できないこともある。間にキーワードに変換するというフローがあるために必要な情報に正確にたどり着けなかったりするであろうと。
 理想は頭の中にぼんやりとある調べたいこと、探したいことを直接そのまま検索エンジンに理解させて探させることです。スマートフォンなどが搭載する各種センサーはそれを実現させる筆頭であろうと思っていましたが、Google Glassも視覚情報をベースに検索という行為を少しそっちよりにもっていくかもしれない。

Internet ArchiveのWayback Machineが大幅にサービスをリニューアル

先のエントリでアプリケーションのWaybackの話を紹介しましたが、今回はInternet Archiveが提供するWayback Machineというサービスの話です。Internet ArchiveのWayback Machineが10月25日リニューアルし、サービス・機能を大幅に強化しました。
00
Internet Archive: Wayback Machine

 リニューアル前の画面も当然ですが、Internet Archiveに保存されていますので、見ることができます。
11
Internet Archive: Wayback Machine 2013/10/21

リニューアルの詳細

  リニューアルの詳細は、以下のIAブログで紹介されています。「この世界(インターネット)は俺たちに任せろ」といわんばかりのInternet Archiveの「アーカイブ」に対する強い自負が感じられるエントリです。

 まとめると以下になります。

1.アーカイブされたウェブページをより早く公開

 アーカイブされたウェブページをクローラーで収集されてから1時間強で利用できるようになりました。これまでは利用できるまで数ヶ月かかっていたようですので、すごい時間短縮です。


収集したことを知らせるとともに、利用できるようになるまで数ヶ月かかることを知らせる従来のメッセージ
from
Internet Archive“Wayback Machine” | 世界のウェブアーカイブ|国立国会図書館インターネット資料収集保存事業より

2.インスタント・オンデマンド・アーカイブサービス

 と、勝手ながら呼ばせていただきましたが、Internet Archiveはユーザーのリクエストに応じてウェブサイトにクローラーを走らせ、ウェブページを保存するサービスを開始しました。
 アーカイブされてから提供されるまで1で紹介したような機能強化がされても1時間強はかかりますが、リンクを貼るためのWayback Machineにおけるウェブページの固定URLはユーザーがアーカイブをリクエストをしたタイミングで知らせてくれます。
 ウェブページを引用や参考文献に使いたい研究者やWikipediaの執筆者、法律家、学生などだれでも利用することができます。1のクローラーによる収集からアーカイブされたウェブページの公開に至るまでの時間短縮とあわせて考えるとこれは凄い機能です。
 簡単に流れを紹介しますと
 トップページに以下のようなフォームが用意されています。Internet Archiveに保存を依頼したいウェブページのURLを入力します。
Save Page Nowというフォーム
そうすると、すぐにIAのクローラーが走り、ウェブページのアーカイブが開始します。
アーカイブ処理中をしらせる画面
無事、アーカイブ処理が終了するとその固定URLが表示されます。
アーカイブ処理が終了したことをしらせ、その固定URLが表示される
 上のURLでアーカイブされたウェブページが利用できるようになるのは、1時間ほど先ですが、固定URLはすぐに取得できます。論文やなにかの執筆などに挙げる参考文献のために安定したURLを提供する機能として考えれば、アカデミズムへの貢献という観点からみてもウェブアーカイブの面目躍如たる機能だと思います。

3.Wayback Availability JSON API

 Wayback Machineに保存されているかどうかをプログラムによって確認できるWayback Availability JSON APIが公開されました(おそらく新規公開)。

4.Web上からリンク切れをなくす取り組み

 Internet Archiveがアーカイブしたウェブサイトをオリジナルのウェブサイト管理者に活用してもらうことで、リンク切れをなくす取り組みです。

WordPress.com及びセルフホストでWordpressで構築されたウェブサイト

 WordPress.comで公開されているブログと、Wordpressによりセルフホストで構築されたサイト(えっ・・汗)、そして、それらからリンクが貼られている外部のウェブページを含めて、Internet Archiveはクローラーを走らせて保存しているそうです(1日URL300万件分が保存されているとのこと)。
 リンク切れがあった場合にInternet Archiveが保存したウェブサイトのURLに自動的に変更するWordpressのプラグイン”Broken Link Checker”をInternet Archiveが作成し、提供しています。

Wikipedia.org

 Wikipedia.orgの全ての更新記事や新規記事に掲載されている外部リンク先(outlinks)のウェブサイトにクローラーを走らせ、Wikipedia.orgからリンクを貼られているウェブサイトを保存しているそうです(1日URL500万件分が保存されているとのこと)。
 Wikipediaから貼られた外部のウェブサイトが仮に消失してしまい、リンク切れになったウェブサイトは自動的にInternet Archiveが保存したウェブサイトのURLに自動的に変更されるような仕組みについて、Internet ArchiveとWikipediaで協議しているとのことです。

全てのウェブマスター向け

 全てのウェブマスターに以下の数行を404ページに追加することを呼びかけています。


<div id="wb404"/>

<script src="https://archive.org/web/wb404.js"> </script>

 404ページに上の2行のタグを追加しておくと、あるURLのページが消失し、404画面が表示される際に仮にそのURLの過去のウェブサイトがInternet Archiveが保存されていた場合は以下のような案内を404画面に表示して、Wayback Machineに誘導してくれます。

その例が以下です。

 詳しくはIAブログの以下をご参照ください。

 Internet Arhiveのブリュースター・ケール氏、Internet Archiveへのアクセスの集中がすごいために、アクセスを散らすためにSiteless WebsiteなどというP2P方式のコンテンツ提供方式を考えたりしているらしいのですが、そんなInternet Achiveがアクセスを減らす方向ではなく、よりアクセスを集めそうなサービスを展開する、その姿勢はすげーと思います。

関連エントリ