将来のMacは、ユーザーの座り方や立ち位置、そして部屋にいる人数に応じてオーディオを調整するようになるかもしれません。Appleは「強化オーディオ機能を備えたデバイス」に関する特許(番号20170249122)を出願しています。
この特許は、Macと出力デバイスを含むオーディオ強化システムに関するものです。Macには、コンピュータに対するユーザーの位置を特定するように構成されたセンサーが搭載されています。このセンサーは、コンピュータの環境に対応する環境データを収集するようにも構成されています。

Macには、センサーと通信し、ユーザーの位置データと環境データを処理し、オーディオ出力またはビデオ出力の少なくとも一方を調整するように構成されたプロセッサも搭載されています。出力デバイスは、プロセッサと通信し、オーディオ出力またはビデオ出力の少なくとも一方を出力するように構成されています。
言い換えれば、システムはセンサーや画像デバイスを利用してユーザー入力を補間することで、ユーザーが物理的に入力する必要がなくなる可能性があります。これにより、オーディオ出力デバイスは、ユーザーからの直接的な能動的な入力を必要とせずに、さまざまなユーザーパラメータに合わせて動的に調整し、オーディオ出力を向上させることができます。
一実施形態では、システムはビデオ会議またはチャットの音声出力を増幅することができます。ビデオ会議中、特に複数の人が同時に話している場合には、受信側のユーザーは各人が何を言っているのか把握するのが難しい場合があります。
システムは、複数のユーザの画像を(例えばビデオカメラを介して)キャプチャし、受信側ユーザは特定のユーザの音声を強調することができる。例えば、受信側ユーザは、実施形態でフォーカスさせたい特定のユーザの画像をタップ(あるいは他の方法でユーザを選択または指示)すると、システムは音声をデジタル的に強調するとともに、ユーザの音声入力をより正確に捉えるために、マイクをユーザに向けることができる。
一例では、システムは、ディスプレイ画面の周囲に間隔を置いて配置された複数のマイクロフォンを備えたコンピュータを含み、特定のマイクロフォンは、所望のオーディオ信号を最適にキャプチャするために、オン/オフにしたり、回転させたりすることができる。
同様に、システムは、マイクの方向を定め、音声を強調し、または話している人物にビデオ画像をフォーカスするように構成することもできます。また、口元トラッキングや音声認識を用いて、話している特定のユーザーに音声やビデオ画像をフォーカスすることも可能です。
これにより、音声データストリームを受信するユーザーは、ユーザーの発話内容(例えば、システムの送信側ユーザー)をより聞き取りやすくなります。したがって、ユーザーの音声またはビデオ画像のいずれか、あるいは両方の強調機能は、自動(例えば、口の動きの追跡や音声認識に基づく)またはユーザー入力(例えば、ユーザーがユーザーまたはフォーカスエリアを選択できる)に基づいて行われます。
出力音質は、少なくとも部分的には環境に依存する場合があります。例えば、エコーキャンセル機能が必要になったり、部屋の大きさや音響特性に影響を受ける場合があります。出力音質に影響を与える可能性のある2つの要因としては、部屋の寸法と残響特性が挙げられます。

Apple によれば、同社のシステムは、オーディオ出力デバイスに対するユーザーの位置、オーディオ出力デバイスに対するユーザーの位置 (正面を向いているか、背を向けているかなど)、および環境入力 (部屋の大きさ、部屋の残響、温度など) に応じてオーディオ出力を調整するように構成できるとのことです。
ユーザーの入力には、部屋の中での位置や、オーディオ出力デバイスの正面を向いているかどうかなどが含まれます。さらに、システムはユーザーや環境からの入力だけでなく、コンピュータやオーディオ出力デバイスが現在実行しているアプリケーションに基づいてオーディオ出力を変化させる場合があります。例えば、アプリケーションが電話の場合、音楽プレーヤーアプリケーションと比較して応答が異なる場合があります。
特許によると、このシステムにはビデオ、オーディオ、環境センサーが含まれる可能性がある。例えば、画像センサー(カメラなど)や深度センサー(超音波、赤外線、無線周波数など)が使用される可能性がある。さらに、ユーザーがMacから離れた場所(例えば、広い部屋でユーザーがコンピュータから遠く離れている場合と、狭い部屋でユーザーがコンピュータの近くにいる場合)に基づいて、望ましい出力を変更することもできる。
例えば、ある物体が動画内でユーザーから遠く離れた位置にあるように提示されている場合、その物体(またはユーザー)の出力音声を変化させることで、ユーザーには物体が遠く離れているように聞こえるようにすることができます。この実装では、遠距離画像のローカル音声に奥行き感を与えることで、ユーザーの全体的なオーディオ/ビジュアル体験を向上させることができます。
さらに他の実施形態では、システムはユーザーに基づいて出力音声を調整するように構成され得る。男性、女性、子供はそれぞれ異なる聴力スペクトルを有しており、一般的に女性は男性よりも聴力に優れ、子供は男性または女性よりも聴力に優れている場合がある。システムは、音声認識、顔認識、またはその他の性別識別技術を用いて、特定のユーザーに応じて出力音声を変化させることができる。
もちろん、Appleは米国特許商標庁に数多くの特許を申請し、そして取得しています。その多くは日の目を見ることのない発明です。しかし、どの発明が実際の製品に実現されるかは、決して予測できません。