임베디드/[ Embedded ]

[ Embedded ] 05. Sampling Rate와 나이퀴스트이론

kim.svadoz 2020. 8. 12. 15:03
728x90
반응형

Sampling Rate

  • 소리는 공기 중의 떨림이다.
  • 그 공기 중의 미세한 움직임을 우리의 귀는 우리의 뇌가 이해할 수 있는 형태로 바꿔주는 것이다.
  • 즉, 하나의 형태의 요소가 다른 형태로 바뀌는 것이다.
  • 마찬가지로 우리가 소리를 디지털화 시키기 위해선, 연속적인 아날로그 소리를 컴퓨터가 이해할 수 있는 디지털 언어로 바꿔주어야 한다. 이 과정에서 바로 Sampling 이 등장하게 된다.
    image-20200813152618102
`샘플링 레이트(Sampling rate)` : 1초에 몇개의 샘플을 추출할 것인지
`Bit Depth` : 한 개의 샘플이 얼마만큼의 크기를 가지는지

=> 잘개 쪼갤 수록 부드러운 곡선이 된다.

=> Sampling rate가 높을 수록 아날로그와 유사한 디지털 값(고음질)을 얻을 수 있다.

나이퀴스트 이론과 기본적인 샘플링

  • 스웨덴 출신의 미국에서 거주하던 엔지니어인 Harold Nyquist는 1918년부터 1924년까지 여러가지 연구를 하던 중, 1928년 세상에 처음으로 소리의 디지털 샘플링 이론을 내놓게 된다. 수학에 기반을 한 그 이론은 테스트 해볼 수 없는 당시의 현실적 여건에 부딪혀 증명을 하지 못하다가 20년이 지난 1948년 Claude E Sahnnon에 의하여 수학적 증명을 받게 된다.

    • 그리고 우리는 그 이론을 나이퀴스트 이론 혹은 섀년/나이퀴스트 이론이라고 부른다.

    -> 우리가 샘플(sample)하려는 소리의 가장 높은 주파수 보다(Highgst frequency) 2배 이상의 샘플링 속도(Sampling Rate)를 사용하면 정확하게 소리를 다시 만들어 낼 수 있다.(아날로그에서 디지털로, 디지털에서 아날로그로)

  • 즉 우리가 만약에 1kHz 주파수를 녹음하고 싶다면 최소 2kHz Sampling Rate를 사용해야 한다는 것.

  • 사람의 가청 주파수는 20Hz부터 20kHz까지이다. 최소한 인체학적으로 귀를 통하여 들을 수 있는 소리의 가청 주파수이다. 즉, 사람이 듣기 위한 소리를 녹음하기 위해서는 40kHz sampling rate 이상을 사용하면 된다.

그러면 여기서 질문!

44.1kHz, 48kHz, 88.2kHz, 96kHz 등 여러 다른 샘플링 수치는 무엇이냐?

샘플링을 "쪼개는 것"이라고 설명하는 것을 참 많이 볼 수 있따. 즉 44.1kHz는 1초에 44100번 소리르 조갠다는 것.

그렇다면 1초에 44100번 쪼개는 게 이득일까 아니면 96000번 쪼개는게 이득일까? 어느쪽이 원본에 더 가깝게 소리를 재탄생시킬까? 당연히 96000이겟죠?

다시 44.1kHz로 돌아와 보겠다.

1Hz의 진동 주파수가 있다고 생각해보자. 1Hz란 1초에 진동을 1번 한다는 뜻이다.

1000Hz진동주파수가 있다. 1초에 1000번 진동한다는 뜻이다.

만약에 Sampling Rate이 1초에 44100번 "쪼개는" 것이라면 1Hz를 더 많이 쪼갤까 1000Hz를 더 많이 쪼갤까

1초라는 시간안에 1000Hz보다 1Hz가 진동이 더 작으니 1Hz를 훨씬 많이 쪼개게 되겠죠.

그러면 1Hz가 1000Hz보다 더 원본에 가깝게 표현이 될 것이다. 왜냐면 1초에 44100번 쪼개니, 1Hz는 44100번 쪼갤 수 있고 1000Hz는 44.1번밖에 못 쪼개기때문.

하지만 다행이도, "쪼갠다"라는 표현은 틀린 것이다.

적어도 나이퀴스트 이론에는 맞지 않다.

나이퀴스트 이론을 다시 보자면

"우리가 샘플 하려는 소리의 가장 높은 주파수보다 2배 이상의 샘플링 속도를 사용하면 정확하게 소리를 다시 만들어낼 수 있다"

즉, 몇번을 쪼개냐가 아니라 2배 이상이면 정확하게 다시 소리를 만들어 낼 수 있는 것이다.

1Hz와 1000Hz 둘 다 정확하게 말이다.

그러니 만약에 누군가가 "나는 가청 주파수 안의 소리를 더 정확하게 담고 싶어서 높은 Sampling Rate를 선호해"라고 한다면 틀린 말이 될것이다.

우리의 가청 주파수는 20kHz까지라고 했다. 그리고 40kHz의 sampling rate이면 가청 주파수 이내의 모든 소리를 담을 수 있다.

그런데 왜? 디지털 미디엄의 시작인 CD는 44.1kHz 일까? 40kHz여야하는 것이 아닐까?(20kHz * 2)

나이퀴스트의 이론이 적용되기 위해선 우리가 샘플 하려는 소리가 Band-limited되야 한다.

무슨말이냐면, 세상에는 우리가 듣지 못하는 소리도 있다.(가청 주파수 위/아래).

즉, 우리가 듣지 못할 뿐이지공기 중의 소리는 존재한다. 우리가 녹음하려는 가청 주파수 안의 소리를 샘플하기 위해선, 우리가 샘플 하려는 주파수보다 높은 주파수들은 샘플하지 않아야 한다.

그러기 위해서는 Anti-Aliasing Filter라는 쉽게 알해서는 Low-Pass-Filter 를 걸어 주어야 한다.

왜냐면 우리가 샘플을 하기 위해선 샘플 하려는 신호보다 2배 빠르게 샘플해야 하는데 너무 높은 주파수들이 샘플되기 시작하면 Aliasing이 시작되기 때문이다.

그 말은 원래 존재하지 않던 소리들이 생겨나면서 소리가 정확하지 않게 되는 것이다. ( 소리에 에러가 생기기 시작한 것! )

이것 때문에 우리가 정한 Sampling Rate 이상의 소리는 아예 차단해버리는 Anti-Aliasing Filter를 만들어야 한다. 그러나 우리가 생각하는 것처럼 이상적인 필터(Brick Wall Filter)는 만들기가 힘이 든다.

image-20200811134657471

그래서 천천히 줄어드는 필터를 만들게 되고 그 필터의 특성상 22 0.5Hz까지 뻗어나가게 되기 때문에44.1kHz라는 Sampling-Rate이 CD에 채택된 것이다.

image-20200811134803164

44.1kHz, 충분한가?

높은 Sampling Rate가 낮은 , 주로 44.1kHz보다 좋다, 아니다 라는 논쟁은 수십년동안 지속되고 있다.

나이퀴스트 이론은 어디까지나 이론이다. 그것을 완벽하게 현실화 하기 위해서는 이론을 뒷받침할 기술이 필요하다.

1983년도에야 되서 제대로 된 디지털 44.1kHz, 16bit 기술이 나온걸 감안하면 아주 오랜 시간이 걸렸다. 거대한 마케팅에 비해 현실적으론 문제 투성이었고 많은 사람들에게 거부감을 심어주었다.

- 그렇다면 도대체 그 문제는 무엇이었는가?

  1. 클락의 부정확함

    • 바로 digital clock을 이야기 한다. 정확하지 않은 클럭은 Jitter가 많이 발생하며 그것은 고주파의 distortion과 비슷한 왜곡된 소리를 내어 준다.
  2. 16 bit

    • 16bit. 대부분의 컨버터가 24bit인 지금 16bit밖에 수용할 수 없던 기술은 높은 Signal to noise ratio, quantization erro등 많은 문제가 있었다.
    • "무조건 크게 녹음해야 한다"라는 녹음 기술이 이때 나오게 된것
  3. 아날로그 필터의 문제

    • 이것이 우리가 깊게 파볼 부분이다.

    • 나이퀴스트 이론을 실행하기 위해선 우리가 샘플링하고자 하는 가장 높은 주파수의 두 배 이상은 sampling rate를 성정해야 하며, 그 신호는 band-limited 즉, 필터를 사용하여 원하는 주파수 이상의 소리가 들어오지 않도록 차단해주어야 한다. 우리가 마이크로 소리를 녹음할 때, 마이크를 통하여 전달되는 소리가 디지털로 샘플링되기 전에 아날로그 필터(Low-Pass)를 거쳐야 한다는 뜻이다.

    • 그러면 이렇게 생각할 수 있겠다.

      *"20Hz부터 20kHz까지만 샘플링 할 예정이니 20kHz에 로패스필터를 걸어져면 되겠네? 끝!"*

      • 아쉽게도 아날로그 필터는 이렇게 간단하지 않다.
728x90
반응형