ジッターの可聴限界はどのくらいなのか?
(2011/5/29)


良く目にする論文と、そこで書かれていた可聴限界を簡単にまとめてみましょう。

どちらかというと、自分用の備忘録のようなものですから、生暖かく見ていただければよろしいかと思います。

(1)再生フォーマットから要求されるジッターの下限値(人間の聴覚の精度を全く考慮しない場合)

まずは、人間の聴覚とは全く関係なく、
再生フォーマットの精度を1ビットたりとも落とさないためのジッター量の上限値を調べてみます。

ジッターは波形の歪ませるが、この歪の量が量子化雑音(=1/2LSB)以下であれば、歪による影響は無視できるはずです。

数値算出の考え方としては、
「そのフォーマットで再生が許される最高周波数の純音の最大傾斜(Smax)」 × 「ジッタ量(Tj)」が、1/2LSBを超えないこと。
というジッター量(Tj)を求めることになります。
(ジッターによって発生する歪は、波形の傾斜が大きいところほど大きいからです。元々波形が平らなら全然歪みませんよね?)

この限界を計算した値は以下のようになります。[3]

フォーマット  歪が1/2LSBを超えないためのジッター量
44kHz、16bit ±121.4ps 以下
192kHz、24bit  ±0.1ps 以下

[3]蘆原郁,桐生昭吾,“ディジタルオーディオにおける時間ゆらぎ許容値及び検知閾,”日本音響学会誌,59,241-249(2003).

これはつまり、
±120ps以下のジッターであれば、CDフォーマットを1LSBの精度も落とさずに完全に再現できることを表しています。

※CDのサンプリングレート(1/44100=22.7μs)と比較すると、
 実に
19万分の一程の時間のブレしか許されないということでして、結構驚いちゃう結果です。




(2)人間のジッターの検知限は一体どのくらいなのか?

さて、上の「±121.4ps」は単に精度を落とさないための限界でしたが、
幾つかの論文で、音楽信号を使って実際に人間がテストを行った結果がありますので、簡単にまとめます。

No.  論文  テスト方法の概要 テスト結果 
  [1] Eric Benjamin and Benjamin Gannon, “Theoretical and Audible Effects of Jitter on Digital Audio Quality”, Pre-print 4826 of the 105th AES Convention, San Francisco, September (1998) ◆CD音源4曲使用
◆CD同軸デジタル出力からのbitstreamに
正弦波ジッターを付加(Prism JM-1 jitter modulator)。
◆ジッターの振幅はDIRのロックが外れない範囲で付与。
◆ジッターの周波数は1530Hz〜1850Hz
◆ヘッドホン使用(Sony MDR-V6
◆被験者8人
20ns未満では弁別不能。
検知限は概ね30ns〜300ns程度だろうと結論
 [2] 桐生昭吾、蘆原郁、吉川昭吉郎、沢口真生、大賀寿朗:多様な被験者を対象とした時間ゆらぎによる歪の検知限界に関する実験、信学技報、EA2002-36(2002)  ◆音楽信号に、時間ゆらぎを付加して再生。
◆DAプロセッサ、AMP、スピーカーorヘッドホンは被験者が用意。
◆ゆらぎの条件は、
矩形成分の白色性雑音
◆スイッチングによるXAB法、正答率75%が弁別限。(9試行で7回正解以上) 
◆被験者は、高品位オーディオ機器の設計に携わるエンジニア、レコーディングエンジニア、オーディオ評論家、大学生など。
1μs〜2μs:23人全員弁別
500ns〜1μs:11人弁別
250ns〜500ns:6人弁別
250ns以下:全員弁別不可
 [3]  蘆原郁,桐生昭吾,
“ディジタルオーディオにおける時間ゆらぎ許容値及び検知閾,
”日本音響学会誌,59,241-249(2003). 
◆市販のCD楽曲5曲に対して、様々な大きさの時間ゆらぎを付加したオーディオ信号を作成して再生。(1Rock、2Violin、3Fusion、4Orchestra、5Pop)
◆ゆらぎの条件は、
@ランダムゆらぎ条件、A50Hz正弦波ゆらぎ条件、B相関ゆらぎ条件(※音楽信号自体を時間ゆらぎとする)
◆被験者は20〜30歳の大学生、大学院生。@14名、A10名、B11名
◆被験者は200cm間隔の左右スピーカーから250cmの位置で聞き取りXABテスト。(A、BのどちらがXと一致するかどうか回答)
@ランダムゆらぎ条件(Song1〜5使用):
 9μs:全5曲について14名全員正解(@75%弁別閾)
 1μs:Song2で2名正解、Song4で3名正解
 576ns:全曲で14名全員不正解。

A50Hz正弦波ゆらぎ条件(Song2、4使用):
 9μs:全曲で10人中9名が正解。(@75%弁別閾)
 2μs:Song2で2名のみ正解。
 1μs;全曲で10名全員不正解。

B相関ゆらぎ条件(Song2、4使用)
 9μs:全曲で11名全員正解。(@75%弁別閾)
 2μs:Song2で3名が正解。
 1μs:全曲で11名全員不正解。
  



・・・う〜ん・・結構結果がばらついてますね。

選択した楽曲やテスト環境、被験者にもよるんでしょうけれど、
ジッターの検知限は20ns〜1μsくらいの幅があるようです。(まあ1μsはあんまりだと思いますが)、



俺結論:
◆普通の聴覚な方であれば、余裕をみて10nsくらいのジッターっであれば許容される
  ・・と考えるのが妥当な気がします。
◆CDフォーマットが完全な16bit精度で再現されるジッター量120psとくらべると、
 人間の聴覚は2〜3ケタくらい甘いので、そこまではジッターの精度は要らないよってことかと思います。


結局「ジッタースペクトルの解釈についてダメな説明をしてみる」の結論と変わんない気がします。


以上


TOPへ戻る