ジッタースペクトルってどう解釈すればいいのさ?の巻き
(2011/5/15)

Stereophileなんかで、DACやらCDプレイヤーやらのジッタースペクトルのグラフが載っていたりしますが、

「あれってさー・・・役に立つのん?」という疑問がある方もおりましょう。


今回、純音に任意の周期性ジッターを負荷するシミュレーションソフトを移植してみましたので(※1参考文献)、
動作確認のついてでに、何となく雰囲気が分かる程度にジッタースペクトルの解釈について説明をデッチ上げてみる。

まあ、なんとなくわかれば良し!

(※1参考文献)
"The Effects of Sampling Clock Jitter on Nyquist Sampling Analog-to-Digital Converters,and on Oversampling Delta-Sigma ADCs"J.AudioEng.Soc.,Vol.38,No.7/8,1990July/Augu,STEVEN HARRIS
"A Jitter Simulator on Digital Data" 110th AES Convention 2001 May,Shogo Kiryu, Kaoru Ashihara



(1)ジッターが発生すると、スペクトルはどうなるのん?
ジッターが発生すれば、当然元ファイルの波形データから波形が崩れるので、歪みが発生します。
この歪みはWaveSpectraなどのFFTを使えば簡単に観測できます。


(A)<シミュレーション>
 11025Hzの純音(0dBFS)
に、
  最大10nsecの時間振幅(時間のズレに1kHzの周期性あり)のジッターを加えたスペクトル。


はい。みなさん予想の通り、入力信号から±1kHz離れた位置に、位相雑音成分のピークがハッキリ現れています。



(B)<シミュレーション>
  4000Hzの純音(0dBFS)
に、
  最大10nsecの時間振幅(時間のズレに1kHzの周期性あり)のジッターを加えたスペクトル。


加えるジッターの量や周期性は(A)と同じですが、入力信号の周波数を11025Hzから4000Hzへ下げています。

(A)と(B)は同じジッターを加えているのに、
入力信号の周波数によって、位相雑音成分の大きさが異なっていることが分かるかと思います。

入力信号の周波数が高いほどジッターの影響により大きく歪む、という当然の結果を表しています。
(考えてみれば当然ですよね)


次に、(A)を少しいじって、こんどはジッターの周期性を1kHzから10kHzに変えてみてみましょ〜。



(C)<シミュレーション>
  11025Hzの純音(0dBFS)に、
  最大10nsecの時間振幅(時間のズレに10kHzの周期性あり)のジッターを加えたスペクトル。


(A)のスペクトルと比較すると、入力信号から10kHz離れるようになりましたが、位相雑音の大きさ自体は変化していません。



それでは、入力信号の周波数(0dBFS時)と、ジッターの時間最大振幅の関係はどうなっているんでしょうか?


(D)<シミュレーション>ジッターの量(最大時間振幅)に起因する位相歪みの発生量
【注意:-110dB以下は演算誤差により精度ありません。】


このグラフは、100nsec、10nsec、1nsec、100psecのジッターが加えられた場合、
周波数帯域によって信号がどれだけ歪むか?を表しています。

たとえば、上から2本目の
10nsec(ピンク色)のジッターの場合を見てみると、
10000Hz(10kHz)の信号で-70dBほどの歪みが発生するであろうことがわかります。
1kHzなら-90dBです。


100psecのジッターともなると、20Hz〜20kHzの全オーディオ帯域で-100dBを下回っており、
ジッターを位相雑音として知覚しているのであれば、まずもって問題のない量だと思います。


その他、 パッと見の規則性として
・ジッター時間振幅が1桁下がると、全体にPhaseNoiseは20dB低下する。
・周波数が2倍になると、6dB PhaseNoiseが増える。(両対数のグラフにすると直線になりますね。これは。)
・・などがありますねん。



(2)人間の知覚の限界はどのくらい?

ABX実験を行った結果(※2参考文献)によると、人間のジッターの知覚の閾値は、
・純音で、10nsec程度。
・楽曲再生時で、30nsec〜300nsec程度。

とのことですから、まあ安全を見て10nsec未満であればよろしいのではないかと。(純音メインを多く聴く人もあんまりいないでしょうけど)

(※2参考文献)
"Theoretical and Audible Effects of Jitter on Digital Audio Quality",Eric Benjamin and Benjamin Gannon,AES ConventionSeptember 1998



(E)<シミュレーション>知覚可能/不可能なジッター量はこんな感じかな?

Stereophile式の11025Hzの入力信号の場合、ざっくり-70dB以下の位相ノイズのピークであれば、
まず人間の知覚はできないはずなので問題ないのではないか・・と思います。



(3)現在の機器ではジッターはどんなもん?
例えばiPod classicなどの安価なDAPにおいて、
11025Hzの入力信号を観測しても-100dBを上回るような大きな位相ノイズのスペクトルは存在しません。

(F)<実測値>
ipod classicでStereophile式というかFIDELIX式のジッター解析信号(11025+230Hz)を測定した例。


元ファイルでわざと印加している230Hz矩形波の高調波成分のピーク(これはピークが観測されるのが正しい)以外には、
-120dB弱のノイズフロアより上に目立った大きなピークはないようです。
(上のグラフからザックリ換算すると、せいぜいでも数十psec程度のジッターと思われます)。
(2)で一応の目安とした「11025Hzで-70dB以下」は50dBも余裕を持ってクリアできていますから、
まずジッターの知覚は無理でないの?って思います。



最後に、以上の結果から適当なまとめをしてみます。

【まとめと俺感想】

@人間の知覚限度は、純音でもせいぜい10nsecくらい・・・らしいよ。

A現在の安価なDAPでも余裕で数十psec。@の人間の限界に比べてもジッターは既に2ケタ以上も低い。
 据え置きのDACなら10psec程度。もうジッターについてはお腹一杯で数字のお遊びの状況ではないかと思います。

Bそれでもジッターが気になる場合、最終出口であるLINEかPHONEアウトのジッタースペクトルを観測しましょう。
 良いDACでも熱雑音もあるでしょうからノイズフロアは実測で-140dB程度と思われます。
 つまりジッター換算で1psec程度の雑音は残っていることになりますから、安価なDAPと比べても
 出口ではせいぜい1桁程度の御利益しかないってことではないでしょうか。


以上

TOPへ戻る