AppleはSiriが自然音と人工音をより正確に聞き分けられるようにしたいと考えている

Appleの新しい特許出願(特許番号20200090644)によると、今後発売されるMac、iPhone、iPad、Apple Watchに搭載されるマイクは、自然音と人工音を区別できるようになる可能性がある。これは、同社の「仮想デジタルアシスタント」であるSiriのパフォーマンスを向上させることが目的だ。

Appleは特許出願において、ノートパソコン、デスクトップパソコン、タブレットパソコン、スマートフォン、スマートスピーカーなどの消費者向け電子機器には、Siriなどの仮想アシスタントプログラムが搭載されていることが多く、これらのプログラムはトリガー音(「Hey Siri」など)を検知すると起動すると述べています。家庭環境やその他の環境においては、人の話し声やドアを閉める音など、自然発生的に発生する音もあれば、テレビやラジオのスピーカーなど人工的な音源(再生音とも呼ばれます)から発生する音もあります。 

Appleは、バーチャルアシスタントプログラムが自然音と人工音を区別できることが重要だと述べています。例えば、Siriが誰かの助けを求める声を検知した際に緊急サービスに通報する場合、検知した音声が部屋にいる実際の人間の音声なのか、それとも部屋で視聴されている映画の一部なのか(例えば誤検知を防ぐため)を認識することが重要です。Appleは、Siriが自然音と人工音を区別できる機能の必要性に対処し、この技術におけるその他の関連および非関連の課題にも対処したいと考えています。 

特許出願の概要は次のとおりです。「電子機器には、音を拾う1つ以上のマイクが搭載されています。少なくとも1つの特徴抽出器が、拾った音を含むマイクからの音声信号を処理し、音の複数の特徴を特定します。 

「本電子機器は、機械学習モデルを備えた分類器も備えており、この分類器は、特定された特徴の少なくとも1つに基づいて、人工音か自然音かといった音の分類を決定するように構成されている。その他の態様についても記載および特許請求の範囲に記載されている。」