JAWSの生成AIを利用した画像説明機能 Picture Smart AI

少し前の話になりますが、2024年3月にスクリーンリーダのJAWSが、以前からあった画像説明機能のPicture SmartをChatGPTなどの生成AIを取り入れて大幅に強化し、Picture Smart AI として利用できるようにしたとのことです。

上のページの案内で、写真、円グラフなどの画像を例に、AI導入前後でどれだけ改善されたかの例も掲載されてますので、具体的にどのように改善されたのかを知りたい方はそちらを。以下の紹介動画も公開されています。

利用できる生成AIは、2024年3月時点ではChat GPTと GoogleのGeminiでしたが、2ヶ月後の2024年5月のアップデートで、Google のGeminiは、信頼性が高いという理由でAnthropicのClaudeに置き換えられたらしい。だから、現在は、ChatGPTとAnthropicのClaudeとなるようです。

なお、無償で使用できるのか、無制限に利用できるのかは不明です。

この生成AI関係のJAWSのアップデートはJAWS 2024にされたもので、これを書いている時点のJAWS 日本語版の最新版は、現時点で 2023 なので、日本語環境におりてくるのは、もう少し先にでしょうか。

ところで、そもそもJAWSとは何かということですが、米国のFreedom Scientific社が開発するデスクトップ環境用のスクリーンリーダー(読み上げソフト)で、海外では、オープンソースのNVDAと並んで広く利用されています(調査によるけど、以下のWebAIMの2023年12月あら2024年1月の調査だと、JAWS 40.5%、NVDA 37.7%の回答者がそれぞれ主に使っていると回答。)。

ちなみに、日本だと、PC-Talkerというスクリーンリーダを使用されている方が圧倒的に多いので、海外とは状況は少し異なります。

生成AIの導入といった新しい技術へのキャッチアップは、NVDAのほうが早いのではと予想していたのですが、NVDAはやるべきかどうかを含めて議論がされていると言った段階のようです。