W3C Publishing Working Groupで軽量SMIL(次世代SMIL?)について議論始まる

 W3CのPublishing Working Group の2017年9月18日の電話会議で、SMIL lite(軽量のSMIL)が(おそらく)始めて議論されています。先のエントリで紹介したWeb Pulications
での利用が想定されています。Web Pulications はEPUBと統合されて、EPUB4的な立ち位置になる可能性も示唆されているので、次世代SMILといえる立ち位置になりうるのかもしれません。まだ、議論は始まったばかりのようで、どこに向かうのかはわかりませんが。

 要件リストは、Essential Requirements(不可欠な要件)とAdvanced Requirements(高度な要件)にわけて整理されています。Essential Requirements はざっと見た感じ、現行のEPUB3ですでに実現できていることが並んでいるようですが、Advanced Requirements では、現行のEPUBでは実現できていない手話動画とテキストの同期も想定した動画のサポートや、音声解説を付けた動画のサポートが挙げられています。
 議事録を読むと、SMIL lite は XMLではなく、JSON で行く可能性が今のところ高そうですね。 
 なお、SMIL (Synchronized Multimedia Integration Language) は、DAISY や EPUB 3 では、テキストと音声の同期あるいは音声(録音音声またはTTSによる読み上げ)の再生の制御のために使用されています。現行の EPUB 3 におけるSMILのサポートは音声に限定されていますが、聴覚障害者のために手話動画とテキストを同期させたEPUBを作るため、動画のサポートが EPUB 3 仕様策定の段階から要望としてあがっていたようです。そういう経緯があったためか、EPUB Media Overlays 3.0の仕様では、動画をサポートしないことがわざわざ言及されています(最新の EPUB 3.1 でも同じです)。今回の SMIL lite の議論もこの経緯を受けてということだと思われます。

Although future versions of this specification might incorporate support for video media (e.g., synchronized text/sign-language books), this version supports only synchronizing audio media with the EPUB Content Document.

 
 最後に議事録からSMIL lite に関係するところを転載します(ここでも河村宏さんの名前が…)。

1. Requirement for SMIL Lite
Garth Conboy: “SMIL lite” == “grin”
Tzviya Siegman: https://github.com/w3c/publ-wg/wiki/Requirements-and-design-options-for-synchronized-multimedia
Marisa DeMeglio: link in GotoChat
… we’ve been looking at design reqs for syncronized multimedia
Rachel Comerford: https://github.com/w3c/publ-wg/wiki/Requirements-and-design-options-for-synchronized-multimedia
Marisa DeMeglio: allowing talking books to talk
Tzviya Siegman: can you give a quick overview?
Marisa DeMeglio: EPUB3 didn’t have a lot of problems with media overlays
… we can look at something lighter than SMIL
… we used a slim subset in EPUB3
… but SMIL adoption in the world at large hasn’t been huge
… so we can look at other formats
… we do need to link chunks of text with chunks of audio
… you still need structural semantics for navigation etc
… making video + text transcripts more accessible is a requirement
… and there are some things not included in media overlays
… I’ve been emailing with dweck
… like having multiple granularities of navigation–from para by para to word by word
… text + sign language
… video + descriptive audio
… all those are not covered by media overlays
… our next step is deciding what format to do
Garth Conboy: That multi-resolution MO approach was discussed some years ago, and I think prototyped in Readium, I think. It’s a cool idea.
Marisa DeMeglio: first question is about formats–XML or not XML
Dave Cramer: what’s the status of audio sync on the web at large?
Marisa DeMeglio: I don’t know of anything
Ivan Herman: I don’t know much more
… I love your understatement… SMIL adoption is terrible
… we will have to define a SMIL-lite which has any hope for implementation
Bill Kasdorf: is there an active SMIL WG?
Ivan Herman: we will also have to ensure there will be several implementations on top of browsers
Laurent Le Meur: I agree with Ivan when he says we’ll have to create polyfills
… if this is the case, if JS is the language that will use SMIL, then XML is not the best structure for that
… JSON has the lead, a structure JS loves
… SMIL is so complex, there are too many features
… we can track as JSON structure
Garth Conboy: Marisa is also correct, when saying MO/SMIL(lite) adoption in EPUB Reading Systems is pretty good.
Laurent Le Meur: as for the requirements, we should make sure the structure we define doesn’t prevent us from adding advanced features later
Ric Wright: one other area is where there is a SMIL implemenation is for animation of SVG
… this has been implemented by browsers
Avneesh Singh: the main objective of this work was lack of support of SMIL on the web
… and then additional things came up
… that were not covered in EPUB3 MO
… media fragments is the one thing in the web which is used
… if we can find out groups in web who are trying to solve similar problems
… we can try to do it together
Charles LaPierre: ETS and Mark Hakkinen has done lots of work with SMIL
… they might have some insight
… they use this for assessments
Tzviya Siegman: the larger group should comment about requirements
… this is not part of our charter… so what should we do with these requirements? What are next steps?
Ivan Herman: as usual, this was the topic I wanted to put on the queue
… that’s an admin problem
… this whole issue of SMIL lite is not in our charter, but is a necessary thing
… this would be rec-track work
… the traditional way to do something like this would be to form a separate CG
… that would look at an initial spec plus one or two polyfills, showing it is possible
… once the CG says we have this, it solves these requirements, it’s polyfilled, it has users
… the most obvious way would be to then form a new WG
Garth Conboy: From charter: “This specification should generally be a functional superset of EPUB 3.1. Functional round-tripping to/from EPUB 3.1 considered highly desirable.” So, would could argue it’s kinda in our charter, as it’s in EPUB 3.1.
Ivan Herman: I still believe something like SMIL is still necessary for the web, and not only for WP
… even if WP is driving this here
… the web in general would benefit
… we then could get experts from other places for a CG
… I have some colleagues in Amsterdam who worked on original SMIL
… some of them are still around; I can approach them
… but a WG would be too much for them
Tzviya Siegman: the next steps are to clean up requirements and share them
… we should pass this on to APA, and share with Janina
Ivan Herman: there are some other media-related groups, like a video group
… they might have feedback
… and outside w3c there are other groups
Marisa DeMeglio: to comment on SMIL
… DAISY was in smil WG
… we used SMIL more than anyone else, but used less of it
… our use case was really different from everyone else’s
… they used it for short presos, annotations, etc.
… we used for entire books
… I’m not sure that reawakening the SMIL group would be good
… we might look elsewhere for overlap
Ivan Herman: it’s going to be very light, very concentrated
Tzviya Siegman: it might come down to how you position it
… I can help with that
Avneesh Singh: that’s a valid point from marisa_demeglio
… we need more strength to make it an implementable standard
… we need to strike a balance for something useful for our requirements as well as for others
… that IPTV was looking for something like SMIL
… Hiroshi can be a liason
… and Mark H can also help
Tzviya Siegman: we have people volunteering to be liasons
… joanie might know who to talk about at the browsers
Avneesh Singh: I will contact Mark Hakkinen and Hiroshi Kawamura
Bill Kasdorf: I was going to ask Marisa if there is a link she can share that documents the subset of SMIL that is actually used by DAISY
Marisa DeMeglio: bill_kasdorf: http://www.idpf.org/epub/31/spec/epub-mediaoverlays.html#sec-overlays-def
Bill Kasdorf: marisa: thanks, I didn’t realize that the MO spec in EPUB 3.1 was the subset you were talking about. That’s great to know because that is what folks are actually using in the publishing world.

HTML5 Conference の個人的なふりかえり #html5j

 先のエントリで書いたようにHTML5 Conferenceに参加してきました。

 HTML5 Conferenceは最初?の2012年のときから、すごい盛り上がりで「僕も混ぜてよ」という気持ちを持ちつつも、なかなか参加するに至らず(東京遠い)、今回が初参加でした。 Vivliostyleの村上真雄さんよりお声かけいただいて、html5j 電子出版部セッションのパネリストの1人として登壇する機会もいただいたので、一参加者として参加するだけではなく、スピーカーとして参加するという貴重な経験をさせていただきました。
hmtl5カンファレンスのスピーカー用の名札の写真
 今年のこのカンファレンス、セッションプログラムが公開される前に参加申込み者が定員の1600人を超えてしまうという勢いで、日本のIT系のイベントでは最も勢いがあるかもしれない。
 
 当日は朝早く京都を出て、11時すぎに会場となる東京電機大学のある最寄り駅の北千住着。カンファレンスのスピーカーには、お弁当がでることは聞いていたけど、その時点で猛烈にお腹がすいていたので、駅近くで海鮮丼を食べて会場入りした(なお、その後、会場で出たお弁当はお弁当でおいしくいただきました)。登壇して、気になるセッションを聞いて17時に会場を出て、そのまま京都に戻るという感じだった。京都駅に20時着。新幹線は待ち時間がほぼないので、京都につくのは意外と早い。

「Webフォント最新事情2017~導入事例も一挙紹介~」セッション

http://events.html5j.org/conference/2017/9/session/#e1
 関口 浩之さんによるウェブフォントのセッション。関口さん劇場。到着時間の関係もあって、このセッションは途中から参加だったので、最初の「FONTPLUS」とは何かという説明を聞き逃してしまった。そのため、流れが最初はつかめずにいたのだけど、それを差し置いても、関口さんの話は具体的で面白く、フォントがどう使われているという話や、フォントをどう表示させたいかという話は、フォントを普段はあまり意識したことがなかったので(エッ)、結構目から鱗だった(フォントの間の空白を調整して全体を美しく見せたいというニーズがあることからして、始めて知った。自分が○○ときに○○しても垢抜けないのはその差かー。みたいな)。

Webと出版が融合する新しい標準 Web Publications〈ウェブ出版物〉ができることで、Webと本の未来はどうなる?

http://events.html5j.org/conference/2017/9/session/#e2
 
このセッションはパネリストとして登壇。
 Vivliostyleの村上真雄さんによる10分のWeb Publicationsの概要説明があり(スライドは以下)、

イーストの下川和男さんによる5分のどのAdvanced Publishing Labの活動紹介があり(スライドは以下)、

 残り25分ほどがパネルディスカッションとなった。Web Pulicationsで話せるテーマがかなり広範であること、時間が短かったこと、パネリストの背景や関心も様々なので、議論が集約しきれなかったところが正直あったと思うけど、後で記録を読み返すと、ここを時間かけて膨らませればよかったんじゃないかという箇所が結構あったので、Web Pulicationsに関する論点は提示できていたのではないかとも思う。
 今にして思えば、パネリストのあの人数にあの時間なら、机を置かず、パネリストが全員立って、マイク持ちながら、村上さんのスライドにツッコミいれなが、立ち話しているかのように話をしたほうが盛り上がったかもしれない。
 私について言えば、パネルディスカッションというスタイルで、いきなり話を振られての適切なコメントを短く言うということが難しくて、ほとんど適切なコメントを言えていなかったような気がする。自分のペースで話せるスライドを使った発表でも、正直あまり得意ではないという自覚はあるけど、パネルディスカッションはそれとは全く別の難しさがあるなぁと感じた。Web Pulicationsについては、事前にいろいろとドキュメントを読んで考えをでまとめておいたのですよ。いいたかったことはここのどこかには書いてあるはずなんだけど・・・・。

 私は、図書館の立場、というよりも、アクセシビリティに関わる業務をしているという立場で、意見を期待されたのだと理解していたけど、Web Publicationsについて事前にいろいろとドキュメントを読み進めていくうちに、(無論アクセシビリティはもちろん無関係ではないけど)「ああぁ、これはいろいろな大前提となるコンテンツの器の話だ」と感じるようになっていたので、どういうスタンスでどのような発言をするべきかというのは、登壇しても迷っていた(それなりに学識のある方が発言されるならともかく、僕が器について発言してもあまり説得力ないぞ的な)。
 とはいえ、後で記録を確認すると、「コンテンツは器のUIが規定する」という考えを軸に、私は発言をしていたようだけど、上で述べたパネリストとして適切な発言をするということの難しさもあって、出だしの「コンテンツは器のUIが規定する」のところがそもそもうまく伝えられなかったかもしれず、全体的に何を言っているんだ感があったかもしれない。
 セッションでの僕の発言は、(だいぶ)補足し、誤解を招きそうなところを整理(削除)すると以下のようになる。

  • コンテンツは器のUIがその性格を規定する。紙の書籍についても、目次やページ、そして、紙の複数の固まりという物理的なあり方というか、触った時のページの厚みであと何ページ残っているか直感的にわかるUIに規定されている。Webについても、ブラウザやナビゲーションとしての検索エンジンなどに規定されている。電子書籍も本当はそのはずで独自の性格を持っているはず。
  • しかし、EPUBは現在は、紙と同時で出るものが多いので、紙のコンテンツに規定されてしまっており、本来の電子書籍という器本来のあり方がまだ発揮できていない。Web出版物は、たぶんEPUBのように紙版と同時に出る事例が多くないと思うので、紙版のあり方に規定されるようなことがないのではないか。今後どのようなコンテンツが出てくるか楽しみにしている。
  • Web側からすると、Web Pulicationの登場により、これまでのWebでは出来なかった表現ができるようになる。長いコンテンツがより読みやすくなる。EPUB側からすると、従来のEPUBよりWebのように簡単に作れるたり、公開できるようになる。
  • 現在は、WebとEPUBの間に大きな隙間が空いている状態だと思うが、Web出版物の登場で、みんながおもしろがって、その間を埋めてくれると良いと思っている。
  • 電子出版では、アマゾンなどのプラットフォームが公開、コンテンツへのリーチ、課金、DRMなど全てをそれぞれで囲い込む状況となっている。Webでは、このようではなく、公開、コンテンツへのリーチや課金などが水平分業型になっていると思うが、よりWeb寄りのWeb出版物もそうなっていくと思う。EPUBのそばにそういうコンテンツ群が登場することで、電子出版のビジネスモデルも変わっていけば面白い。
  • 出版物というと、出版社が出すコンテンツが想起されやすいが、実は官公庁のような公的機関や大学、個人が無償で公開しているようなものも大量にある。
    こういった無償で出しているコンテンツは、DRMフリーのものが多いので、適当な器があれば柔軟に移行できるのではないのか。これまではWeb出版物という器がなかったからだせなかったコンテンツがこういうところから出しやすくなるのではないか。

 パネルディスカッションで言えなかったことを補足しようとするときりがないけど、少しだけ追記すると、コンテンツを規定する器のUIには以下で触れるようなコンテンツと目の距離やコンテンツが読む{見る}ものに強いる姿勢も含まれると考えている。Webのように縦置き画面で少し離れたところからでも読みやすい文章と、本のように横に倒して30cmほどコンテンツから離れた状態で読みやすい文章は異なるはずなので、それで文体や作法もかわるはず。ケータイ小説も、今でいうガラケーの小さな画面で読むことを前提に書かれ、また、書く側もほとんど携帯で書いているので、紙で印刷された状態で読んでもそのおもしろさは伝わらない気がする(読んだことはないけど)。

 
 EPUB3の仕様が2011年に固まった当時、「この仕様の利用が順調に伸びるとしても、当面は紙版の書籍と同じものが刊行されるのだろう、しかし、いずれは、EPUB版オリジナルのコンテンツが増えてくるに違いない、そうなったときこそ、電子書籍の本来のUIやコンテンツのあり方が発揮されるだ!」とちょっと青臭く考えていた。2017年になってそれがEPUBではなく、Web Publicationsという形で出てくるのかーという感慨が個人的にある。2011年から2013年に電子書籍の登場で読書はこう変わるという議論がいろいろとされていたと記憶しているけど、Web Pulicationsにあてはあるものも多いかもしれない。

ECMAScript and Babel’s role

http://events.html5j.org/conference/2017/9/session/#a3
 ECMAScriptについては、標準化されたJavaScriptである、ということ以上のことは本当に何も知らずに参加したのだけど、さすがにそれだけの理解では、話について行くのは厳しかった(以上・・・・・・汗)。

多様なユーザーニーズに応えるフロントエンドデザインパターン〜書籍「インクルーシブ HTML + CSS & JavaScript」より

http://events.html5j.org/conference/2017/9/session/#d4
 11月発売予定の書籍『インクルーシブHTML+CSS & JavaScript』をベースに訳者である太田良典さんと伊原力也さんによる実装例の紹介。
スライドは以下。


 まず、太田良典さんと伊原力也さんがスライドめくりながら対話形式で話を進行していくというのが面白かった。お二人の話力もあると思うけど、対話形式のほうが一人が一方的に話すよりも、一般的にはテンポもよくて、わかりやすいのではないか。
 内容について。アクセシビリティ系の本や記事は、こうやるとアクセシブルでないからちゃっちゃだめと否定的なことが書いてあることが多いが、この本は、HTMLとJS、cssでこう実装するとアクセシブルという実装例を示しているそうで、「すいませんすいません」と思いながら話を伺っていた。原著者がHeydon Pickering氏ということで、同氏が意識しているスクリーンリーダーはJAWSかNVDAなのかな、日本の視覚障害者が多くしているスクリーンリーダーPC-Talkerだとどうなのかな、日本の視覚障害者によく利用されている音声ブラウザNetReader(ICTスキルが高い特に全盲の視覚障害者ほど使用しているという印象)で対応できるだろうかというところを気にしながら。例えば、ここで紹介されていたaria-live属性のようにたぶんPC-Talkerではまだ対応していない実装例もあるのだけど、しかし、どこまで特定のソフトにあわせる必要があるのか、悩ましい。とか、とはいえ、視覚障害者の間でPC-Talkerのシェアが圧倒的なので悩ましい。とか、いろいろとぐるぐるとぐるぐると。
ちなみにセッション中にこの本をアマゾンで予約した。

ウェブのための次世代決済法

http://events.html5j.org/conference/2017/9/session/#b5
GoogleのえーじさんによるWebPaymentsの話。Webpaymentsについては、このブログでも以下のエントリなどでよく分からないまま書いたこともあり(今、読み返すとたぶん間違ってるところある)、関心は持っていたけど、その後全然動向を追っていなかったので、その後どうなったのかという関心を持って参加した。
Webでの課金の仕様を検討するW3CのWeb Payments Community Group
 
 上のブログで書いた当時、肝心の課金部分をどのようにW3C標準にするか、いまいち想像ができなかったけど、なるほどこのように標準化するのか、頭いい人が考えることが違うと若干あほっぽいけど、素朴にそんなことを思っていたり、 仕様が固まるどころか、思っていた以上に一部とはいえ、実装がかなり進んでいたことに驚いた(仕様の数が多いことも)。
スライドは以下。

オライリー提唱の執筆・制作用フォーマットHTMLBook仕様案の日本語訳

公益社団法人日本印刷技術協会(JAGAT)XMLパブリッシング研究会が米国の出版社O’Reilly Mediaが提唱するHTMLBookフォーマットの仕様案及びHTMLBookの紹介ページの日本語訳を公開しています。
 HTMLBookはオープンで、XHTML5ベースでプリントとデジタル双方の本を執筆・制作するためのフォーマットです。XHTML5(HTML5)のサブセットでセマンティクスにEPUBの語彙(EPUB 3 Structural Semantics Vocabulary)を使用しています。

 PDF、EPUB、mobi(Kindle形式)、DAISYなどの電子書籍フォーマットをマルチに提供するO’Reilly Mediaですが、そのO’Reilly Mediaがgitでバージョン管理する出版プラットフォームAtlas(ベータ版)を立ち上げています。そのメインの制作用フォーマット(マルチフォーマット対応のためのソースファイル)にHTMLBookを据えようとしているようです。

 HTMLBookの仕様はまだドラフトの段階であり、HTMLBookの仕様案そのものがAsciiDoc形式で公開されているように、AtlasではまだAsciiDocがメインに使われているように思われます。なお、AsciiDoc形式の他にMarkdownDocBook XMLでの入稿も可とのことです(→参考)。
 HTMLBook、DocBook、AsciiDocの関係については、CAS-UBブログが以下のエントリで解説をしています。

 O’Reilly Mediaのマルチフォーマット対応については以下をご参照ください。