Linked Open Dataの意義、ってものを考えてみた。あってる?

 Linked Open Dataって何か、とか、その意義は何ぞや、ということがいまいち理解できていなかった私ですが、立ち話で人と話しているうちに、「そういうことかも!」と思うところが最近あったので、箇条書きですがまとめてみました。
「Linked Open Dataとして公開されるならば!!」(という言い方が日本語として正しいかどうかはともかく・・)

     

  • 深層Webと言われるデータベースの奥に隠れているコンテンツが静的なファイルとしてWeb上に公開される。APIの公開とどう違うの、ということですが、APIを公開しても所定の手続きを踏まないとそのデータはアクセスできないわけです。静的なファイルとしてWeb上に置いてあるのとURIを指定するだけでいろいろな方法でアクセスできるわけで。
  • CSV形式やテキスト形式で公開してもよいのです。Open Dataです。Linked Open Data star badgesという五段階評価によるとCSV形式というソフトウェア非依存な形式で公開したら星3つみたいです。それでも、たとえば、RDF形式のような形式で公開すると機械がより理解しやすい形式でなおよし。各語彙も名前空間をがちっと指定してね。
  • URIで他のフォーマットと有機的に関係を結ぶことができるわけでしょ。しかも、機械がその関係を理解出来る形で。
  • オントロジーが活用して語彙と語彙の関係をプログラムが理解できるようにできるなら、Web上に公開されているデータは機械がその関係や位置関係も含めて理解できるようになるわけではないか。
  • 最終的にWeb全体が、分散的かつ整合性をもって構築される、誰でも、様々な方法で、様々なデータにアクセス可能な、機械がその世界を理解できる一つの巨大なデータベースになるということですか。
  • Tim Berners-LeeがWebというものを1990年頃に作って「あちゃー、シンプルにしすぎたー。人は理解できるけど、機械はこの世界理解できねーしー」と思い、1990年代後半からいろいろとがんばってWebで実現しようとしている世界ではあるまいか、たぶん・・・。

 
 オントロジーもきちんと理解できていない今の段階では、さっくりですがこんな感じです。あってますか?