視覚障害者にこそお勧めしたい❣
~ChatGPT4の新機能で画像や代替テキストを生成してもらう方法~


ブログやSNSで使う画像が探せなかったり、画像は見つかっても適切な代替テキストを設定することができなかったり...。視覚障碍者が画像コンテンツを扱おうと思うと、苦労する場面が少なくないですよね。

そんな大変な作業ですが、全てChatGPTの最新モデル「GPT4」の力を借りれば自動化できることをご存じでしたか?

今回はiPhone用アプリを中心に、そんな便利なChatGPT4の画像生成・認識機能「DALL・E」と「Data Analysis」の使い方についてご紹介したいと思います。

ℹ️ 記事中でご紹介しているアプリについて、一部アクセシビリティの低い箇所もありますが、必要な操作は全てVoiceOverに対応していることが確認できています。


キャンバスに絵を描いている、可愛いロボットのイラスト

前提・必要条件

本題に入る前に、まずは今回ご紹介するツールを使うための必須条件についてご説明します。なお、比較的高価な優良サービスへの登録が必要になりますので、「それほど使わないかも「という方にはお勧めしません。

アプリのインストール・登録
まずはAppStoreから公式アプリをダウンロードしましょう。
その後、アプリの指示に従ってOpenAIのアカウントでログイン、または新規アカウントを作成してください。
優良登録
「DALL・E」や「Data Analysis」などGPT 4の最新機能は、優良サービスである「ChatGPT Plus」に登録していないと使うことができません。
アプリメイン画面左上にある「Menu」(点が並んだマーク)ボタンを選択した後、展開したメニューの下部にある「○○(ユーザ名) Settings」というボタンを押下してください。
続いて表示された画面から「Subscription,」というボタンを探し、その後に表示される指示に従って月額¥3,000のサブスクリプションに登録しましょう。
1つ前の設定画面で「Subscription,」のボタンに「ChatGPT Plus」という記載が追加されていれば登録成功です。

これでChatGPTの生成AIを使うための事前準備は終わりです。続いて、次項以降の手順に沿って画像・代替テキストなどを作ってみましょう。


「DALL・E 3」による画像生成

それではここから本題、ChatGPT 4を使った画像生成についてご紹介したいと思います。

実は本記事冒頭のアイキャッチ画像もChatGPTに作ってもらった者なのですが、これからご説明するChatGPTの生成AI、「DALL・E」(ダリー)を使えば、CG風のリアルな画像から少女漫画風のイラスト、可愛いロゴまでありとあらゆる画像を簡単に作製してもらうことができるんです。

「DALL・E」の使い方

まず、ChatGPTのメイン画面から左上にある「Menu」ボタンを選択します。

続いて画面左上に並んだたぶを「ChatGPT」から「DALL・E」に切り替えてください。

「Let me turn your imagination into imagery By ChatGPT」と書かれた画面が表示されれば準備完了です。通常通り「New Message」欄に指示を入力して、画像を生成してもらいましょう。

画像生成の言語と精度

DALL・E 3はまだベータ機能ということで、入力は日本語を含め数多くの言語に対応しているものの、出力は必ず英語で表示されてしまいます。また入力言語についても一度英語に翻訳してから送信されているようで、初めから英語で指示した方が正確に認識してくれるような印象です。

以下、実際に日本語・英語それぞれで指示して生成させたイラストの一例です。


日本語で生成した例

雪が降っている中、ウクレレを弾いているサンタクロースのイラスト

こちらのイラストは「ウクレレを弾いている、可愛いアニメ風のサンタクロースのイラストを作って。」と、日本語で指示して生成してもらった画像です。

とりあえず「サンタクロース」・「ウクレレ」というキーワードは漏れなく反映してくれているようですが、目の見える人に確認してもらったところ、「アニメ風でも可愛くもない...。それに笑ってるのか顔を顰めているのかわからない。」というコメントを頂きました。実はこの画像の前にも「ウクレレを弾いているサンタクロースの、アニメ風のイラストを作って」という指示でイラストを生成させてみたのですが、その時は「リアルすぎて気持ち悪い」や「顔が鬼みたいで怖い」と言われてしまうような画像が出来上がっっちゃいました。

このように、日本語の指示だと少し伝わりにくいのかな、という印象を受けました。


英語で生成した例

白いクッションの上で丸まって寝ている、赤い首輪をした茶トラねこのイラスト

こちらは英語で「Make an anime-like illustration of a brown tabby cat wearing a red collar, sleeping happily on a white cushion.」と指示して生成してもらったイラストです。「茶トラ」・「赤い首輪」・「白いクッション」というキーワードを押さえているのは勿論、「アニメ風」や「嬉しそうに」という細かな指示まで含めてくれているようです。


DALL・Eのまとめ

以上のように、まだ多言語対応ができていないといった課題はあるものの、DALL・E 3は大分実用的なレベルにまで達しているようでした。また今回の記事ではイラスト生成についてのみ触れていますが、白黒写真に色をつける、写真を加工・変換するなど、様々な使い道があるようです。

ぜひ指示の伝え方などを工夫しながら、DALL・Eを使いこなしてみてください。

「Data Analysis」による画像解析

次にご紹介するのは生成AIのDALL・Eと同様、ChatGPT 4に搭載されている解析AIの「Data Analysis」です。

視覚障害者にとっては「画像や地図、グラフなどの詳細を教えてもらうことができる」というのが最大のメリットで、最近ではスマートホン向けアプリ「Be My Eyes」に搭載されたことで話題になりました。

「Data Analysis」の使い方

DALL・Eと同様、まずはメイン画面左上の「Menu」ボタンを選択し、続いてたぶを「Data Analysis」に切り替えましょう。

一度メイン画面に戻り、画面下部の「Attach」ボタンから解析してほしい画像を添付、「New Message」欄から指示を入力するという流れになります。

指示としては「この画像の内容を説明して」や「この地図を元に道順を説明して」など、添付画像に基づいた内容であれば基本的に対応しているようです。ただ注意点として、新たに画像などを生成する必要がある指示については非対応ということです。

下記、前項でご紹介した画像2つの代替テキストを生成してもらった例です。


Data Analysisの生成した代替テキストの一例

まずは前項で先にご紹介した、サンタクロースのイラストから...

「この画像には、サンタクロースがウクレレを弾いている様子が描かれています。彼は赤いサンタの服を着ており、典型的な白いヒゲとサンタ帽をかぶっています。サンタの顔は笑顔で、ウクレレには赤いリボンとベリーの飾りがついています。背景は雪が降る青空で、クリスマスの雰囲気が感じられるイラストです。」

...と、大分具体的な説明文を生成してくれます。

続いては後にご紹介した、白いクッションの上で寝ている茶トラ猫のイラストです。

「この画像には、茶色と黒の縞模様のタビー猫が丸いペット用ベッドでくるまって眠っている様子が描かれています。猫はリラックスした表情で、目を閉じています。首には赤い首輪があり、その首輪には小さな鈴が付いています。背景は白で、猫とそのベッドの細部がはっきりと描かれています。」

...一部日本語に訳し切れていない箇所がありますが、先ほどと同様、かなり具体的に説明してくれていますね。


このように、Data AnalysisはDALL・Eと比べて非常に正確な結果を出力してくれます。SNSに投稿したい画像、何が写っているか忘れてしまった写真、大体テキストから内容を識別できない地図やグラフなど、幅広い画像ファイルの解析に使えそうです。


まとめ

さて、今回はChatGPT 4の最新生成AI、「DALL・E」と「Data Analysis」についてご紹介しました。

SNSなどに投稿する画像やその代替テキストの生成に、内容が識別できない地図やグラフの解説にと視覚障害者にとってとても便利な使い道が沢山あるるので、ぜひお試しください。


*本ページの記載内容に誤りがあれば、メール、TwitterのDMなどでお知らせください。


メールお問い合わせ
Twitter: @naokiluca
↑ホームに戻る