2019/10くらいに調べた内容です。
「音声文字変換」はGoogleとアメリカのギャローデット大学と連携して開発したもので、いまのところAndroidしか出てない。
10万くらいの先行投資で検証してみた。
スマホの入力スピーカーで音声を拾って、ディスプレイ上で文字が表示される。
内部は、音声をインターネット経由でGoogle Cloudに送って音声を文字に変換したデータを受け取って、文字を表示している。
バックグラウンドが黒で、文字は白。
右上に音が拾っている状態がわかるアニメーションが表示されている。
会議とかで使ってみたが、某スピーチとかと比べて精度がいい方かもしれない。
でも、某トークは人に合わせた振り分けがあるが、「音声文字変換」はない。
みんなの声は、「すべて一緒」でわかりにくい。
つまり講義や公演といったような一人が多人数向けに話すケース向けで、多人数が双方向に話し合うようなミーティングはまだ使いにくい。
Pixel3 + emeet M2 + 音声文字変換
1 on 1 ならほぼ高精度で文字変換してくれる。
欲強いて言えば、2人以上のmeetingで色を変えて表示してくれたら嬉しい