JAWSの生成AIを利用した画像説明機能 Picture Smart AI

少し前の話になりますが、2024年3月にスクリーンリーダのJAWSが、以前からあった画像説明機能のPicture SmartをChatGPTなどの生成AIを取り入れて大幅に強化し、Picture Smart AI として利用できるようにしたとのことです。

上のページの案内で、写真、円グラフなどの画像を例に、AI導入前後でどれだけ改善されたかの例も掲載されてますので、具体的にどのように改善されたのかを知りたい方はそちらを。以下の紹介動画も公開されています。

利用できる生成AIは、2024年3月時点ではChat GPTと GoogleのGeminiでしたが、2ヶ月後の2024年5月のアップデートで、Google のGeminiは、信頼性が高いという理由でAnthropicのClaudeに置き換えられたらしい。だから、現在は、ChatGPTとAnthropicのClaudeとなるようです。

なお、無償で使用できるのか、無制限に利用できるのかは不明です。

この生成AI関係のJAWSのアップデートはJAWS 2024にされたもので、これを書いている時点のJAWS 日本語版の最新版は、現時点で 2023 なので、日本語環境におりてくるのは、もう少し先にでしょうか。

ところで、そもそもJAWSとは何かということですが、米国のFreedom Scientific社が開発するデスクトップ環境用のスクリーンリーダー(読み上げソフト)で、海外では、オープンソースのNVDAと並んで広く利用されています(調査によるけど、以下のWebAIMの2023年12月あら2024年1月の調査だと、JAWS 40.5%、NVDA 37.7%の回答者がそれぞれ主に使っていると回答。)。

ちなみに、日本だと、PC-Talkerというスクリーンリーダを使用されている方が圧倒的に多いので、海外とは状況は少し異なります。

生成AIの導入といった新しい技術へのキャッチアップは、NVDAのほうが早いのではと予想していたのですが、NVDAはやるべきかどうかを含めて議論がされていると言った段階のようです。

自覚を求めないアクセシビリティ

アクセシビリティ Advent Calendar 2023の18日目の記事です。このブログ自体、ものすごく久しぶりの更新になってしまいました 汗。

極私的な話になりますが、ここ数ヶ月、「老眼」の傾向がでてきたりしまして、「おや?」という感じで書籍の小さな文字がやや見づらくなってきました(コミックのルビはとくに厳しい・・。)。今回はそれに絡めて少しポエム書きます。

「老眼」に近い感覚を覚えるようになったのは、振り返るとかなり前で、半年以上前、もしかすると1年以上前くらい前だったかもしれません。しかし、「老眼になってきた。眼鏡も合わなくなってきたので眼科行かねば」と自身の視力を「老眼」というカテゴリで自覚するようになったのは、先月くらいでした。「老眼」という名前の付いた区分で自身の状態を自覚することのハードルの高さを感じました。高齢になると身体機能が徐々に衰えてくるので、その身体機能の変化に慣れてしまうというか、自覚しないまま、その変化を受容してしまう方も多いと思います。

ただ一方で、自身の老眼を感じる場面についてさらに振り返ると、老眼によるしんどさを自覚するようになったのは紙版の書籍や資料を読んでいる時で、画面でウェブサイトなどを閲覧していたり、電子書籍を読んでいる場合は、文字サイズを自分の読みやすいサイズに自然と変更しているためか、老眼の傾向をあまり自覚していなかったと記憶しています。画面から情報を取得している時には、アクセシビリティ機能(文字サイズの変更)によって、私にとっての社会的障壁(=文字サイズが視力にあわずに読みづらい)を自覚のないままに除去していたということになります。

自身の状態の自覚に至るまでの時間または場合によってはその難しさを考えると、情報取得に係るしんどさを自覚せずに無意識に社会的障壁を除去できるようになっている状態はアクセシビリティ機能が普遍化した状態、「アクセシビリティ」という言葉を使う必要もない目指すべき未来の1つではないかなと思いました。

今年はアクセシビリティの向上の恩恵を特に感じた一年でした。これまでアクセシビリティの向上に取り組まれてきている関係者の皆様に改めて感謝申し上げます。そして、今年、アクセシビリティについてあまり取り組めなかった私、来年はがんばろう。

「The Last of Us」などのゲームとアクセシビリティ

ゲームクリエイターの桜井政博氏がYoutubeチャンネルの中で、「The Last of Us」でアクセシビリティ面での機能が充実していること、設定画面を紹介しながら、解説していました。

アクセシビリティ設定がここまできめ細かく、このゲームでできること、正直驚きました。逆に、ここまで細かく設定できると、ユーザーがどこまで自分で設定できるのかなと思ったら、プリセット設定まで用意されているのそうで、確かに親切設計。

このゲームは、視覚、聴覚、身体の運動機能に障害があるプレイヤーたちもプレイできるように、アクセシビリティ機能を充実させたことでも発売当時から話題になっていたようです。知らなかったです。不勉強でした・・・。

ウェブや電子書籍、映画などと異なって、ゲームはプレイヤーの操作によって、コンマ秒単位で常時状況が変わり、それに応じた操作をプレイヤーに求めるので、常に変わる状況をプレイヤーに如何に遅れずにアクセシブルに伝達するのか、プレイヤーの操作面での障壁をどのように取り除くのか考えるべきことは色々とありそうです。ゲームにもよると思いますが、UIやセリフを音声で読み上げる、支援技術で操作できるといった対応だけではおそらく足りないはず。

ゲームに関するアクセシビリティの取組みといえば、マイクロソフトのゲームパッドの事例がよく話題に上がるような気がしますが、マイクロソフトは開発者向けのドキュメントとして、Xboxゲームのアクセシビリティガイドラインを提供している上に開発者向けのラーニングプログラムを日本語で公開しています。すごいのでは。その点で、Xboxの日本でのゲーム市場におけるシェアがかなり低いこと残念ですね。

ゲームのアクセシビリティといえば、YoutubeのGame Maker’s Toolkitチャンネルがゲームとアクセシビリティについて1年の総括を毎年しているようです。最新は2021年ですが、2022年もおそらくそろそろ。

2022/12/31追記

後で調べてみると、プレイステーションを出しているソニーも頑張っているようでした。ハードの機能を活かすためには、ゲーム開発者が開発段階にそれを理解する必要がありますので、そのドキュメントも配布されているのかもしれません。どこにあるのだろう。

任天堂は・・・