VoiceOver対TalkBack、AppleとGoogleのアクセシビリティー戦略を読む
AppleとGoogleが、スマートフォンを含むデバイス/OSのアクセシビリティー強化を進めている。両社ともAIを活用する点は共通するが、Appleは製品群をまたいだ新機能や体験強化を打ち出し、Googleは既存の支援機能をAIで底上げする構図が目立つ。
AppleとGoogleが、スマートフォンを含むデバイスやOSのアクセシビリティー強化を相次いで打ち出している。アクセシビリティーは、視覚や聴覚、身体操作に制約のある利用者を支援するための機能として発展してきた。しかしAIの進化によって、画面を読み上げる、文字を大きくする、音声で操作するといった従来の支援にとどまらず、画面や周囲の状況を理解し、利用者に合わせて情報を伝える方向に広がりつつある。
では、AppleとGoogleはこの領域で何を強化しようとしているのか。
AIで広がるアクセシビリティー、AppleとGoogleは何を変えるのか
Appleは2026年5月19日、「Apple Intelligence」を活用して「VoiceOver」「Magnifier」「Voice Control」「Accessibility Reader」などを強化すると発表した。画像説明の高度化や自然言語での操作支援、字幕生成などをApple製品群に広げる内容で、スマホ単体ではなくエコシステム全体で支援機能を拡充する色合いが強い(各機能の説明は補足1を参照)。
| 用語 | 一言説明 |
|---|---|
| VoiceOver | 画面上の文字やボタン、要素を音声で読み上げるスクリーンリーダー |
| Magnifier | iPhoneやiPadのカメラを使って周囲の文字や物を見やすく確認する機能 |
| Voice Control | 音声で端末やアプリを操作できるハンズフリー機能 |
| Accessibility Reader | 文字の見え方や表示を調整し、読みやすくするための閲覧支援機能 |
| 補足1:本記事で登場する、Appleが提供する機能の概要 | |
これに対してGoogleは、既存のアクセシビリティー機能に「Gemini」などAIを組み込む方向を鮮明にしている。2024年5月には「TalkBack」とGeminiの連携や「Lookout」におけるAI生成の画像説明、特定の物体を探す機能などを公表した。2025年5月には、TalkBackで画面全体の内容について質問できる機能や、字幕機能「Expressive Captions」も案内している(各機能の説明は補足2を参照)。
| 用語 | 一言説明 |
|---|---|
| TalkBack | 画面上の文字やボタン、要素を音声で読み上げるスクリーンリーダー |
| Lookout | スマートフォンのカメラを使って周囲の物や文字を認識し、その内容を音声などで伝える視覚支援アプリケーション |
| Voice Access | 音声で端末やアプリを操作できるハンズフリー機能 |
| Expressive Captions | 話し言葉だけでなく、声の強弱や感情、周囲の音も含めて字幕表示する機能 |
| Reading mode | 文字の見え方や表示を調整し、読みやすくしたり読み上げたりできる閲覧支援機能 |
| 補足2:本記事で登場する、Googleが提供する機能の概要 | |
統合体験を訴求するApple、既存機能のAI強化を重ねるGoogle
違いが出ているのは、強化の見せ方だ。Appleは、字幕のない動画に対する字幕生成や、Appleヘッドセット「Apple Vision Pro」の視線追跡の応用例として電動車いす操作支援など、今後提供予定の新しい用途を前面に出している。これに対してGoogleは、TalkBack、Lookout、「Voice Access」、字幕作成といった既存機能をAIで強化し、「見える」「読める」「操作できる」という機能を段階的に高めている。
関連リンク:7 ways we’re making Android more accessible(Google)
視覚支援で見ると、AppleはVoiceOverとMagnifierの強化を通じて、画像や周辺状況を詳しく把握しやすくする方向だ。一方Googleは、TalkBackにGeminiを組み合わせた画面理解や、Lookoutによる物体探索で対応している。聴覚支援では、Appleが字幕のない動画への字幕生成を打ち出しているのに対し、Googleは字幕そのものの情報量を高める方向を重視する。操作支援では、Appleが自然言語ベースのVoice Controlを訴求し、GoogleはVoice Accessを軸にハンズフリー操作を広げている。
なお、Googleは2026年2月、AIで利用者に合わせてUI(User Interface)自体を変える「Natively Adaptive Interfaces」(NAI)という考え方を公表している。2026年5月時点では設計思想や研究開発寄りの内容だが、アクセシビリティーを後付けではなく、インタフェースの中核に組み込む方向を示したものと言える。
| 観点 | Apple | |
|---|---|---|
| 基本方針 | Apple Intelligenceを既存支援機能に統合し、OS横断で体験を強化 | TalkBackや字幕、Lookoutなど既存機能にGemini/AIを重ねて高度化 |
| 視覚支援 | VoiceOverの画像説明強化、Magnifierでの質問応答 | TalkBack(画面読み上げ)+Geminiで画面理解、Lookout(物体や文字の認識)で視覚支援 |
| 聴覚支援 | 字幕なし動画への字幕生成 | Expressive Captionsで発話や音のニュアンスを表示 |
| 操作支援 | Voice Controlの自然言語操作、Apple Vision Proによる対応電動車いす向け操作支援 | Voice Access(音声によるハンズフリー操作) |
| 読みやすさ支援 | Accessibility Readerで複雑文書の閲覧を支援 | Reading mode(見やすい表示や読み上げ) |
| 今後の方向性 | Apple製品群をまたぐ統合体験を訴求 | 既存機能のAI強化に加え、適応型UIの構想も提示 |
| AppleとGoogleのアクセシビリティー強化の違い | ||
このように、Appleが新機能を含めた統合的な体験強化を前面に打ち出すのに対し、Googleは既存の支援機能をAIで段階的に高度化しており、同じアクセシビリティー強化でもアプローチの違いが見えている。
Copyright © ITmedia, Inc. All Rights Reserved.
関連記事
AIの台頭で音声入力の時代が来る 業務はどう変わるのか
次世代のAIベースの音声技術ツールは、組織のより広範囲に影響を与える。ITリーダーが考慮すべき3つの音声技術のトレンドを探ってみよう。
OpenAIの最新モデル「GPT-4o」で何ができる? ChatGPTの強化ポイント
OpenAIはChatGPTの有償ユーザー向けに、GoogleやMicrosoftの標準的な形式で表されたデータをより扱いやすくする「GPT-4o」を発表した。
Microsoftの「Copilot+ PC」はこれまでのWindows PCと何が違うのか
MicrosoftはAI処理をローカルで実行可能にする「Copilot+PC」の販売を開始した。Copilot+PCは一般的なWindows PCと何が違うのか。性能や機能から違いを見ていく。