🎧

Pixel Buds の Gemini への移行は「アシスタント機能に惚れ込んでいたユーザーには罠が多いよね」という話

2024/10/02に公開

先日、Pixel 8 と一緒に使うイヤフォンを Pixel Buds Pro から Pro 2 に換えたのですが、デジタルアシスタントが Gemini に切り替わったことで結構ハマってしまいました。

また、従来の Pixel Buds シリーズでもデジタルアシスタントとして Gemini が利用されると告知があったようです。

そこで、Google アシスタントから Gemini へ切り替わったときに「ここはハマりそうかな」という部分を書き出してみます。

Gemini への移行とは

従来の Pixel Buds シリーズではタッチセンサーの長押しや「オッケーグーグル」により、スマートフォンの Google アシスタントが起動されるようになっています。 (スマートフォンの設定でデジタルアシスタントを Gemini にしている場合でも Google アシスタントが起動されます)

一方、Pixel Buds Pro 2 ではこの挙動が変更され、スマートフォンの電源長押しなどと同じように Gemini が起動されるようになりました。そして、今回の発表により、いずれは既存の Pixel Buds シリーズでも同様の挙動になると思われます。

図 1-1 Pixel Buds Pro 2 を長押しするとディスプレイがオンになり Gemini が起動される

ロック画面の壁紙だけの画面で Gemini の入力ダイアログが音声入力を待機しているスクリーンショット

この記事では、「具体的な操作などにおいて、いままでと何が違うのか?」について記述していきます。

音声コマンドが認識されると従来のアシスタント的な動作になる

Gemini の UI が起動された後、「明日の朝 8 時にアラーム」のような音声コマンドを入力することで Google アシスタントの UI に切り替わります。

図 2-1 アシスタントの用途別 UI に切り替わる

入力ダイアログ上部に「アシスタント」と表示され、アラーム設定用の UI が表示されているスクリーンショット

これなら「操作感はあまり変わらないかな」と思ったのですが、少し困ったことがありました。

従来の Google アシスタントでは音声コマンドの入力に失敗すると「理解できませんでした」などの短いメッセージが流れてくるだけでした。 (たまに、似た名前のお店の住所を読み上げることもありましたが)

しかし、基本の UI が Gemini になったので音声コマンドとして認識されなかった入力は通常のプロンプトのように扱われ、長い返答を聞かされることになります。 (実際はイヤフォンをタップして打ち切りますが、それも煩わしいです)

ここは好みにもよりますが、私は面倒だったのでよく使うコマンドはルーティンを作成し、誤認識された単語を開始用の単語に登録しています。

図 2-2 誤認識された単語を開始方法に登録

「時刻と通知」に対して「地獄と通知」などを登録しているスクリーンショット

なお、ルーティンにはロック画面との関係で必要な設定と落とし穴があるので、その辺も後述します。

Gemini の UI が起動されるとディスプレイがオンになる

スマートフォンのディスプレイをオフにしてズボンのポケットなどに入れている場合の話です。

従来の Google アシスタントの場合は、Pixel buds からアシスタントを起動してもスマートフォンのディスプレイはオフのままでした。しかし、 Gemini の場合はスマートフォンの電源を長押したときと同じように、ディスプレイがオンになり Gemini の入力ダイアログが表示されるようになります。

ロックを解除しないとスマートフォンの機能にはアクセスできないのですが、ポケットの中でタップ的な入力がされてしまった場合、いくつかの問題が発生します。

  • 緊急通報が実行されてしまう
  • タスク追加でのタイトル入力などがキャンセルされる
  • その他、ロック画面でできることは実行される可能性がある

実際のところ、「タイトル入力がキャンセルされたかな?」という挙動はこの数日間でも 2 回ほどありました。 (私は Pixel Buds からのタスク追加をそこそこ使っているので、問題にヒットしやすいというのはあります)

図 3-1 タイトル入力時にキーボードアイコンをタップすると新しい入力になる(キャンセルされる)

新しいタスクを設定するダイアログボックスが表示されているスクリーンショット、タップするとキャンセルされるアイコンに赤枠がついている

タイトル入力がキャンセルされるくらいなら「まぁしゃあない」で済みますが、緊急通報を間違って実行するのは避けたいです。

よって、ディスプレイをオフにしておく設定を探してみたのですが、いまのところ見つかっていません。Google としてはポケットに入れて持ち運ぶ状態を重視してなさそうな気もするので、当面はあきらめてユーザー側で対策することになるかなと思っています(個人の感想です)。

なお、対策としては以下が考えられます。

  • ケースで工夫する

    • 手帳型ケースを使う
    • 吊り下げ型のケースを使う
  • ズボンのポケットに入れるときはディスプレイを外側にする

    • ディスプレイが割れやすくなるので気をつける
  • 余裕のある上着のポケットに入れる

幸い日本ではこれから冬に向かうので、とりあえず上着のポケットに入れることで様子見しようかと思っています。

長押しで音声入力するときの挙動の違い(指の離し方)

従来の Pixel Buds Pro では長押しで音声入力する場合、以下のような挙動でした。

  1. イヤフォンのタッチセンサーを長押しすると電子音が鳴り音声入力を待機する
  2. 音声で何か入力する
  3. 指を離すと音声入力の待機が完了し入力された内容を実行する

Pixel Buds Pro 2 では以下のようになっていました。

  1. イヤフォンのタッチセンサーを長押しすると電子音が鳴り音声入力を待機する
  2. 指を離す
  3. 音声で何か入力する
  4. Gemini が入力終了と判定した時点で電子音が鳴り入力された内容を実行する

従来と比べると「指を離しても音声入力は継続される」ことが大きく違います。また、逆に指を離していなくても、入力終了と判定された時点で電子音と共に処理が実行されます。

最初、これに気が付かず意図したタイミングで電子音が鳴らないので「タッチセンサーの初期不良か?」と疑いました。慣れると指を離してから入力する方が楽で認識率も良くなったように感じています(個人の感想です)。

これは、Pro 2 というハード固有の変更点かもしれませんが、従来の Pixel Buds でも Gemini が起動されるようになったら、一旦は挙動を確認しておくと混乱を減らせるかと思います。

ルーティンの利用

Gemini でもルーティンを利用できますが、制限があるのとロック画面で使うには少し設定が必要でした。

制限についてはドキュメントを見ていただくのがよいのですが、正直なところ何が制限されるのかわかりにくいので、実際に使って確認しておくのが良いと思います。

設定については、ロック画面での利用許可がデフォルトでオフになっていました。スマートフォンがロックされた状態でルーティンを利用したい場合は「Google アシスタントの設定」「ロック画面」「ロック画面で利用できる Google アシスタントの機能」をオンにします。

ただし、ロック画面での挙動には少し落とし穴があります。これは次の節で記述します。

ロック解除が必要なのは 1 回のみ

イヤフォンの長押しで起動された Gemini は利用者の確認が不十分なため、プライバシーなどに関連する操作が制限されます。よって、「最近更新したファイルの一覧」のような入力には以下のように「まず、スマートフォンのロックを解除してください」のように返答されます。 (メッセージが異なったり、入力ダイアログ表示が継続されるときもあります)

図 6-1 プライバシーなどに関連する操作は一旦ブロックされる

「最近更新されたフィルの一覧」に対して「はい、お手伝いできます。まず、スマートフォンのロックを解除してください」と表示されているスクリーンショット

ここでロックを解除することにより処理が継続されます。上記の他に通話の開始などの従来のアシスタント系の処理などもブロックされます。

これについては安全のためですが、せっかくのハンズフリー操作なのに少し面倒です。この制限を緩和するために、Pixel Buds アプリでは「ロック解除が必要なのは 1 回のみ」が追加されています。Pixel Buds をスマートフォンへ接続しておき、Pixel Buds アプリから「デジタルアシスタント」「ロック解除が必要なのは 1 回のみ」へ進むと変更できます。 (デフォルトはオンだったと思います)

これをオンにしておくと、スマートフォンとイヤフォンを接続しイヤフォンを耳へ装着した後、スマートフォンのロックを解除するとプライバシーに関連するような命令も実行されます。この状態は、イヤフォンを耳から外すか、スマートフォンとの接続が解除されるまで維持されます。

ただし、ルーティン関連で 1 つ落とし穴がありました。ルーティン実行もロック解除の対象ですが、解除前にルーティン開始の単語を入力すると、解除を促されるのではなく通常のプロンプトとして処理されました。

慣れればすぐに「あ、ロックの解除忘れてた」と気が付きますが、たまに何度も入力をやり直して涙目になるとこもあったので注意は必要です。

利用できない機能

これは実際に試しもらうしかないのですが、私が利用していた機能で使えなかったものを少し書いておきます。

バッテリー残量

スマートフォン本体とイヤフォンのバッテリー残量を確認するときに「バッテリー残量」を使っていたのですが、Gemini でこれを入力すると操作手順を聞かされるとこになります。

また、ルーティンでカスタムアクションを使ってできないか試したのですが、バッテリー関連のコマンドは使えなくなったようです。 (Gemini からでもテキストで入力したときは動作していたのですが、さっき試したらこれもダメになっていました)

施設の営業時間

スーパーやデパ地下に寄って帰ろうかなというとき、従来であれば長押しから「◯△スーパー、営業時間」だけの入力で近くの店舗の営業時間を読み上げてくれました。

Gemini では現在位置の範囲が大きく、思った店舗にならないことが多いです。駅名などを含めることで Google マップ拡張機能から情報を引っ張ってくれますが、認識率が悪いので今後はあまり使わなくなりそうな感じです。

その他

長押しでの通知の読み上げ機能の削除

これは Gemini とは関係ないのですが、(少なくとも私の手持ちの環境では)日本での利用においては Google からの案内は不正確に思えるので念の為に書いておきます。

従来の長押しに代わる方法として「通知を読んで」「Read my notifications」の音声コマンドが案内されていましたが、日本語の「通知を読んで」コマンドは存在しませんでした。また「Read my notifications」もメッセージアプリの未読メッセージを読むようになっています。 (従来の各アプリの通知には対応していない)

  • 日本語の「通知を読んで」コマンドは存在しない

    • 少なくとも手持ちの環境ではルーティンのカスタムアクションとしても使えないことを確認してある
  • 「Read my notifications」コマンドはメッセージアプリの未読メッセージを読む

  • 日本語では「メッセージを読んで」コマンドが「Read my notifications」と同じ挙動

なお、これを書いている時点での最新の日本語ドキュメントでは、通知を読み上げるための具体的なコマンドは記載されていません。

上記リンク先の「Gemini に通知を読み上げさせる」セクションを切り抜いたスクリーンショット

ただし、機能削除について扱っている日本語の記事でも「通知を読んで」を代替手段として案内しているので、私の使っている環境だけの問題という可能性もあります。まずは「通知を読んで」を試し、動作しない場合は「メッセージを読んで」を試してみるのがよいかと思います。

Gemini からの回答は画面を見ることが前提(のように思える)

Gemini の拡張機能が使われる場合の質問では、回答は画面を見ることが前提になっているように思えます。

たとえば、以下の場合「この回答で考慮されたアイテム」の内容は読み上げられません。よって、ファイルが見つかったのはわかるが、どんなファイルが見つかったのかはそのままではわかりません。 (続けて「そのファイルのタイトルを教えて」と音声で指示すると確認はできる)

図 8-1 拡張機能からの情報が含まれる回答

Gemini と会話しているスクリーンショット、回答の中に通常のテキストとは別に、拡張機能からの情報が表示されている

私の場合、Notion のメモなどを Gemini + Pixel Buds からハンズフリーで検索できるようにスタンバっていました。よって、デジタルアシスタントの Gemini への移行は「待ってたぜ、この瞬間をよ」という感じでしたが、上記のような回答なので「!?」となってしまいました。

これについては、Google としては「Gemini ライブチャット使ってね」という感じかもしれませんが、もう少しこうハンズフリーでの利点を出してほしいなと思ってしまいます。

おわりに

Pixel Buds シリーズから利用するデジタルアシスタントが Gemini へ切り替わったときに、既存のユーザーがハマりそうな箇所について書いてみました。

Pixel Buds Pro 2 自体は Pro から良くなった点が多いと感じています[1]。しかし、Gemini に関連してデジタルアシスタントは退化したように感じてしまいました。

個人的にはイヤフォンを Pixel Buds にしているのはデジタルアシスタント周りへの期待が大きいので、早い時期に安定するといいなと思っています。

脚注
  1. 記事の本筋と関係ないので簡単に書きます。Pro 2 は「小さく軽いので装着しやすい」「外音の取り込みが自然になった」「予想よりもバッテリーが持つ」とわりと満足しています(個人の感想です)。 ↩︎

GitHubで編集を提案

Discussion