謎学習帳 その1
インパルス応答/ステップ応答とはなんぞや?

(2009/9/23)


麺類の食べ歩きばかりしてはいけません。
たまには学習すべき!

・・・と、極まれに前向きな気持ちになった時に作ってみる学習メモです。というか単に俺備忘録です。忘れっぽいしなあ・・・。

まあ、程度の低い俺レベルの内容ですから、突っ込みどころ満載のはず。(間違いあったら是非突っ込んでくださいね)

まずはインパルス応答から。


【1.インパルス応答って何なのさ?】
インパルス応答は瞬間的なインパルス信号を加えた際のスピーカーの応答。
理想的には、パルス幅ゼロのデルタ関数をインパルス信号として加えたいところだが、当然のことながら現実的には
それは無理なので「擬似インパルス」による応答となる。(サンプリングレートが48kHzなら、パルス幅は1/48,000=20.8マイクロ秒)

有限のパルス幅を持つ
擬似インパルスの欠点は、パワースペクトラムが無限の高域まで伸びずに有限となることだが、普通にオーディオ帯域(20kHzまで)をカバーしていれば、実用的には問題とならない・・・・と思う。(弱気)


【2.何のためにインパルス応答を取るのさ?】
インパルス応答を得ておくと、以下の沢山のメリットあり。
・インパルス応答をフーリエ変換すると、(その実部と虚部から)、いわゆる
F特(周波数応答)に加えて、位相の情報も得られる。歪みおよび郡遅延も得られる。
・インパルス応答を時間で「スライス」してフーリエ変換することで、レゾナンスや反射について直感的に理解しやすい
CSDが得られる。
・インパルス応答を積分すると、時間的コヒーレンス(音圧とその位相の時間的な揃い具合)の評価に使える
ステップ応答が得られる。
・室内反射などの解析に使える
ETC(Envelope Time Curve)が得られる。(注1)
・その他色々。(バーストディケイ、ウェーブレット、ナイキストプロット・・・)

(注1)ETCを得る具体的な方法は、インパルス応答を実部とし、インパルス応答をヒルベルト変換したものを虚部とした複素数とみなして(Heyser Spiralを得て)、その大きさをプロットすればよい。


はっきり言って「ウマ〜」ではないでしょうか。原理的には周波数領域/時間領域いずれについても十分な情報が得られます。

しかし、ウマいばかりの話があるわけがありません。問題があります。


【3.インパルス応答を得る際の問題点は】
インパルス応答の測定は、印加するインパルスのトータルのエネルギーが小さくS/Nの悪い結果しか得られないという最大の問題あり。
かといってインパルスの増幅率を上げてエネルギーを稼ごうとすると、非線形性の大きい領域でスピーカーを駆動することになり、この手でS/Nを稼ぐのは限界あり。
よって結局は、S/Nを改善しようと数十回〜数百回もの加算平均を取りS/Nを改善する必要があった。(無響室での測定でさえ加算平均を要する!)。
特にラウドスピーカーの測定においては、個人では手が出せないか、出せても寂しいS/Nのインパルス応答しか得られないと言えましょう。

それでは、S/Nの良いインパルス応答を得る方法は無いのか?・・・と言われれば、方法はあります。


【4.S/Nの良いインパルス応答を得るには?】
PCベースの測定が一般的となる1980年代以降は、上記の方法であるインパルス/擬似インパルスを実際に印加して加算平均してインパルス応答を得る方法は殆ど用いられなくなったようです。
その代わりにPCの演算能力を活用して(主にFFT、逆FFTの威力)、十分なオーディオ帯域を持つ信号、例えばホワイトノイズ(注2)、MLS(注3)、サインスイープを刺激信号としてスピーカーへ印加して、この際のスピーカーからの時間応答と畳み込みの演算(具体的にはFFT/逆FFTを使った畳み込み演算)を行って、インパルス応答を逆演算して求めている
これとあわせて、得られたインパルス応答に対して「ゲート時間」を設定することで、不要な室内の反響を無視し、擬似無響室としてユニット自体の特性も得ることが出来る。
これらが現在数万円のローエンドPCで苦も無く実現可能である点がなんとも素晴らしいと言えましょう。

(注2)ホワイトノイズは、十分に長い時間に渡って観測した場合しかパワースペクトラムがフラットにならない、という制約があり、測定に時間を要する欠点あり、あまり使われていない・・・と想像します。想像じゃだめな気もします。
(注3)MLSはMaximum Length Sequenceの略。詳しくはググッて!・・・・だと不親切なので簡単に。
MLSは擬似乱数の一種(実際にMLSの音を聞くとホワイトノイズのように聞こえます)。本当の乱数とは違って周期が決まれば事前に一意に決まる信号。(サンプリング数で言うと長さは2^N-1。Nは整数。)
MLS信号を使うメリットは、なんといっても得られるインパルス応答のS/Nの良さ!インパルス信号を印加して算出した場合と比べると、周期2^N-1においてN=15とした場合(約32k長)には、なんと45dBものノイズ低減効果。
その他のメリットとしては、以下のような点があるようです。
・MLS信号の生成自体が非常に簡単(乱数不要)、観測や後の信号処理が楽。(印加する信号は分かっているので、観測はスピーカーからのアウトプットだけ観測すれば良し。)
・ホワイトノイズのような本当の乱数とは違って周期性があるのでFFTをかけた際のリーケージ(漏れ)が少ないという長所もあり。



【5.理想的なインパルス応答ってどんなん?】

理想的なピストン運動をする振動板が、バネとダッシュポット(速度に比例する抵抗)につながっている場合のシミュレーションをすると以下のグラフのようになる。
(ミックス・オイラー法を使って解析的に求めました。ミックス・オイラー法についてはこちらを参照のこと。単純明快でコロンブスの卵的なナイスな手法!)


時間軸や縦軸の倍率は単に形が見やすいように調節しています。ここでは定性的な振る舞いを見たいだけなので倍率自体に意味はありません。

・赤い線の「外力」はスピーカーへ印加した信号(インパルス信号)に相当し、時間「1」でピッと一瞬だけ「プラス1」の信号を印加していることになります。

・黒い太線の「変位」は、振動板の位置の変化を表しています。ここでは概ね「1.0」まで変位した後に、マイナス0.1程度までアンダーシュートした後、極僅かな振動をしながら「0」に近づいてます。(臨界制動条件を満たすorそれよりも強くダンプされている場合はアンダーシュートなし)

・灰色の線の「速度」は振動板の速度で、単に変位を微分したもの。振動板が最終的には変位0に戻るため、速度がマイナスになるアンダーシュートは大なり小なり必ず1回は発生する点に注意。

・青い太線の「加速度」は振動板の加速度で変位を2階微分したもので、
普通の放射インピーダンスが適用できるラウドスピーカーでは、基本的には振動板の加速度が音圧に比例するので、この「加速度」がインパルス応答に該当します。大なり小なりアンダーシュートは必ず1回は発生します。


一方、カナル型イヤホンの場合は、音圧は振動板の変位に比例するため、上のグラフの黒線(+測定系に依存するハイパスフィルタ)がインパルス応答になる・・・はず。(また弱気)

さらにオーバーヘッドタイプのヘッドホンはドーなるのか?変位、速度、加速度、いずれに比例するのか?はたまたこれらの混交なのか?


謎を残したまま(実はわからないだけですが)

<続く>

・・・のか?




参考文献:
・"TESTING LOUDSPEAKERS"/Joseph D'Appolito
・"SOUND SYSTEM ENGINEERING 3rd EDITION"/Don Daxis, Eugene Patronis,Jr.
・"Excelによる数値解析―オイラー法のうまい使い方"/北陸電力ミックスオイラープロジェクトチーム


==========================================

(2009/9/26追加)
周波数特性とインパルス応答のおおよその関係(?)について


Excel上で各種周波数特性を適当に手作りで作って、
これに逆FFTをかけてみてインパルス応答が定性的かつアバウトにどんな感じになるのか見てみました。
単に興味本位な内容であります。
もちろんインパルス応答の波形を見ただけでは、F特の細かい凹凸まで分かるはずもありませんから、そこは文明の利器であるFFTを使いましょう(汗)!


【注意】相対的な傾向を掴むのが目的ですので、XY軸の縮尺は適当であまり意味がありません。

   周波数特性 インパルス応答  俺コメント
 フラット   超理想的な応答。
・・・・スピーカーとかヘッドホンじゃ無理Death(笑)。
 高音寄り 立下りの時間はフラットの場合と変わりなし。
アンダーシュートが大きくなる感じですね。 
 低音寄り   立下がりに時間がかかってます。
収束にも時間を要している感じ
 カマボコ   立下がりに時間がかかってます。
アンダーシュート大。
収束時間も長い様子。
 
 局所ピーク   ピークのある周波数で長時間振動が残ってしまってます。収束時間という点ではツラいかも。