측정이란 무엇인가 [2]

측정과 유효숫자

지난 글에서 우리는 측정의 개념과 기본 원리를 살펴보면서 측정에 대해 다음의 내용을 전제하였다.

정량화가 가능한 물리량에는 쉽사리 변하지 않는 참값이 실재한다.
인간은 측정을 통해서 이 참값에 접근할 수 있다.
그렇지만 모든 개별 측정들이 반드시 참값을 올바르게 대표하지는 않는다.

이번 글에서는 이런 전제하에서 측정을 통해 참값에 도달하는 기술적이고 실질적인 방법에 대해 논의해 보고자 한다. 우선 위 세 가지 중 세 번째 문장을 다시 한번 살펴보자. “모든 개별 측정들이 반드시 참값을 올바르게 대표하지는 않는다”라고 했는데, 사실 엄밀히 말하면 그 어떤 개별 측정도 (아주 극적인 우연을 제외하면) 참값을 올바르게 대표하지 않는다라고 표현하는 편이 더 정확하다.

그 이유에는 여러 가지가 있지만 우선 모든 측정은 유한한 자릿수까지만 이루어진다는 사실을 주목해 보자. 이를 보통 유효숫자라고 한다. 예를 들어 사람의 키를 cm 단위로, 또는 체중을 kg중의 단위로 측정할 때는 보통 소수점 첫 자리까지 측정한다. 사람의 키는 보통 10 cm가 넘지만 1000 cm에는 미치지 못하므로 XX.X cm 또는 XXX.X cm로 표현하는 것이 가능하다. 즉, 3개 또는 4개의 유효숫자까지 표시하게 된다. 사람의 체중은 대부분 1 kg 중을 넘지만 1000 kg 중에 달하는 법은 없으니 X.X과 XXX.X kg중 사이의 2개에서 4개의 유효숫자까지 표시하하게 된다. 이 글을 통해 이에 대해 자세히 이야기하겠지만, 측정에서 필요한 유효숫자의 개수는 보통 측정의 용이함과 유효숫자의 필요성에 따라 결정이 된다. 유효숫자의 개수를 늘린다는 것은 측정 대상에 대해 더 많은 정보를 얻는 것이지만, 그만큼 측정의 난이도는 올라간다. 따라서 몇 자리의 유효숫자를 확보할 것인가는 일종의 비용 편익^cost-benefit 문제라고 볼 수 있겠다.

지난 글에서 사람이 가장 직접적으로 측정할 수 있는 물리량은 길이라고 하였고, 다른 도구의 도움 없이 맨눈으로 구분할 수 있는 길이의 최소단위는 사람 머리카락 한 가닥의 두께에 해당하는 0.1 mm 정도라고 하였다. 따라서 우리가 정말 원한다면 사람의 키 역시 0.1 cm 대신에 0.1 mm의 차이까지 구별하여 측정하는 것도 가능할 것이다. 그렇지만 사람들에게 그렇게까지 해야 할 필요가 있겠는지 물어본다면 아무도 그 필요성을 느끼지 못할 것이다. 사실 헤어스타일만 조금 바꿔도 사람의 겉보기 키가 1-2 cm는 쉽게 달라 보인다는 걸 고려하면 0.1 cm 단위까지 측정할 필요도 있을까 싶기도 하다. 이처럼 사람의 겉보기 키의 참값은 단 하나의 값으로 고정되어 있기보다는 어떤 범위 내에 존재한다. 따라서 이 참값의 범위를 표현할 수 있는 유효숫자만 확보한다면 충분히 의미 있는 측정이다.

그렇지만 이 글에서 초점을 맞추고자 하는 측정은 이렇듯 참값 자체가 불분명한 상황들이 아니라 자연에 고정불변의 참값이 존재한다면 측정을 통해 이 참값에 얼마나 가까이 도달할 수 있는가의 문제였다. 그런데 우리가 측정하고자 하는 물리량의 참값이 인간이 임의로 정한 단위계에서 유한한 자릿수를 가져야 할 이유는 없다. 즉, 우리가 유한한 자릿수의 유효숫자만 갖도록 측정을 수행한다면 측정값과 참값이 일치할 이유 역시 없는 셈이다. 따라서 기막힌 우연의 일치로 인해 어떤 물체의 특성을 나타내는 물리량이 우리가 선택한 단위계에서 측정하는 유효숫자 이내의 범위에서 똑떨어지는 참값을 가지지 않는 한, 그 어떤 개별 측정도 참값을 올바르게 대표하지 않을 것이라 결론지을 수 있다.

그렇다면 우리는 어떻게 해야 참값에 접근할 수 있을까? 이해를 돕기 위해 용수철저울을 이용하여 무게를 측정하는 상황을 다시 한 번 생각해 보겠다. 용수철에 물체를 매달면 용수철의 길이가 늘어난다. 이때 용수철이 늘어난 길이의 측정값이 \(x\)라고 해보자. 이 측정값 \(x\)는 그 자체로 물체의 무게를 나타내지 않지만, 사용한 용수철의 용수철 상수 \(k\)를 알고 있다면 훅의 법칙 \(W=kx\)로부터 이 물체의 무게 \(W\)를 계산할 수 있다. 만약 우리가 측정하는 위치에서의 중력 가속도 \(g\) 역시 알고 있다면 \(W = mg\)의 관계식으로부터 물체의 질량을 알 수도 있다. 질량은 중력이라는 특수한 환경과 무관한 양이므로 물체의 더욱 근본적인 속성에 해당한다. 따라서 앞으로 논의는 물체의 무게 대신 질량을 중심으로 전개하겠다.

한 번 측정한 결과가 \(m\)이라면, 이 질량의 참값은 얼마일까? 용수철 상수 \(k\)와 중력가속도 \(g\)를 알고 있다는 전제하에서 수행한 측정이므로, 측정 결과를 의심해야 할 뚜렷한 이유가 없다면 이 측정 결과가 참값에 가까울 것이라고 결론을 내리는 것이 합리적이다. 그렇지만 앞서서 측정이 반드시 참값을 올바르게 대표하지는 않는다고 했으므로 참값이 \(m\)라고 단언할 수는 없다. 이런 종류의 불확실성이 있으면 우리는 거의 본능적으로 측정을 반복해 보아야 한다고 판단한다. 그래서 실제로 여러번 측정을 수행한 결과 측정값이 항상 같게 나온다면 우리는 측정 결과가 참값에 가깝다는 사실에 대해 보다 자신을 가질 수 있다. 그렇지만 누가 언제 어디서 측정하든 똑같은 크기의 \(m\)값이 측정되었다고 해서, 우리는 과연 이 물체 질량의 참값이 \(m\)이라고 결론지어도 될까?

잡음(노이즈^Noise)

이 질문에 대한 답 역시 유효숫자의 개수와 무관하지 않다. 보다 구체적으로 중력 아래에서 질량 1 kg마다 1 cm씩 늘어나는 용수철 저울을 생각해보자. 이 용수철에 어떤 물체를 매달고 늘어난 길이를 측정하는데, 이때 사용하는 자의 눈금이 1 cm 간격으로 상당히 듬성듬성 표시되어 있다. 이 자를 이용하여 길이를 측정한다면 그 길이가 11 cm는 넘고 12 cm는 안 되며, 12 cm보다는 11 cm에 가깝다는 사실 정도는 쉽사리 판독할 수 있을 것이다. 이로부터 물체의 질량은 대략 11 kg보다 조금 큰 정도라는 것을 알 수 있다. 여러 번 반복하여 항상 일관된 측정 결과를 얻었다고 한다면 이 물체의 질량이 11 kg보다 크다는 사실에 대해서는 의심의 여지가 없을 것이다. 그렇지만 단순히 여러 번 측정하여 동일한 참값을 얻었다는 것만으로는 참값에 보다 근접하고 있다는 느낌이 들지 않는다. 즉, 매 측정마다 편차가 없다는 사실만으로 측정값이 참값과 같다는 결론을 내릴 수는 없다. 이 경우에는 측정에서 나타나는 편차를 가늠하기에는 측정의 유효숫자가 충분하지 않기 때문이다.

자에 눈금이 1 cm가 아니라 1 mm 간격으로 있었다면 용수철이 늘어난 길이가 11.2 cm인지 11.3 cm인지 구분할 수 있었을 것이고, 0.1 mm 간격의 더욱 촘촘한 눈금이 있다면 11.23 cm인지 11.24 cm인지 여부까지 구분할 수 있었을 것이다. 측정에 대해 대단한 훈련을 받지 않았더라도 물체의 질량이 11.23 kg이라고 표현하는 것이 11 kg이라고 이야기하는 것보다 참값에 근접한 것 같다고 생각하기란 어렵지 않다. 유효숫자의 개수를 늘리는 것만으로도 참값에 근접할 수 있다면, 측정의 눈금을 촘촘히 하는 것은 상당히 중요해 보인다. 육안으로 구분되지 않는 눈금을 촘촘히 새겨두고 눈금을 읽기 위해 돋보기나 현미경을 동원한다면 0.01 mm 이하의 작은 차이까지 구분하는 것도 가능할 수 있다. 그렇지만 아무리 최첨단의 측정 도구를 동원한다고 하더라도 유효숫자를 무한히 늘리는 것은 불가능하다.

그리고 사실 유효숫자를 무한히 늘리는 것만으로 측정값이 참값에 도달할 수 있는 것은 아니다. 바로 측정잡음 때문이다.(라디오나 여타 음향기기에서 원치 않는 잡다한 소리라는 의미로 신호에 대비되는 개념을 노이즈^noise라고 하고 이를 우리말로는 잡음^雜音으로 번역한다. 그런데 이 용어를 측정 전반에 확장하여 적용하다 보니 소리와 관계없는 측정에서도 잡음이라는 용어를 사용하는 다소 생뚱맞는 상황이 벌어지게 되었다. 그렇지만 물리학 표준 용어집에서 노이즈를 잡음으로 번역하고 있으므로 이를 그대로 사용하겠다.) 측정잡음이란 정확한 측정을 방해하는 명확하거나 불명확한 모든 원인을 통칭하는 개념이다. 용수철 저울의 예로 돌아오자면, 물체의 질량을 측정하는 데에 있어서 용수철 저울에 아주 미세한 진동이 있다면 물체의 위치가 계속해서 미세하게나마 흔들릴 것이고 이는 용수철이 늘어난 길이의 정확한 측정을 방해한다. 건물의 공조 시설, 건물 주변을 지나다니는 자동차나 전철, 방안의 냉장고, 심지어 다양한 음원이 만들어내는 공기의 울림 등은 모두 미세한 진동을 동반한다. 물론 우리는 이런 진동을 일상에서는 전혀 느끼지 못하지만, ‘무한히 많은 유효숫자’로 무언가를 측정하려고 한다면 이런 미세한 진동까지도 고려해야만 한다. 그리고 바로 여기에 모든 정밀 측정의 딜레마가 존재한다. 참값을 정확히 알고자 한다면 측정의 유효숫자를 늘려야 하지만, 많은 유효숫자를 포함하는 정밀한 측정은 반드시 잡음의 측정을 포함한다. 결국 정밀 측정이란 잡음의 원인을 파악하고, 가능하다면 이를 제거함으로써 측정의 유효숫자를 한 자리씩 더 확보해 나가는 과정이다.

체계적 오차^{systematic error}, 무작위 오차^{random error}와 측정 불확도^{measurement uncertainty}

지금까지의 논의를 종합하면 개별 측정값은 참값과 차이가 날 수밖에 없는데, 이렇게 측정 시 발생하는 측정값과 참값 사이의 차이를 측정 오차라고 한다. 오차는 크게 두 종류로 나눌 수 있는데, 그 두 가지는 체계적 오차^{systematic error}와 무작위 오차^{random error}이다. 체계적 오차는 실험 장비의 특성이나 관측 방법 상에 편향적 오류가 있어서 발생하는 오차이다. 우리가 고등학교나 대학교 과학 실험 시간에는 주로 참값이 이미 알려진 물리량을 측정하곤 하는데, 이때 체계적 오차가 매우 빈번하게 발생한다. 필자가 대학원 시절에 학부생들의 물리학 실험 조교를 했었는데, 그 실험 중 하나가 9.8 m/s²으로 알려진 중력가속도를 측정하는 실험이었다. 수십명의 학생들의 실험 결과를 받아보았지만, 9.8 m/s2의 값을 얻는 경우는 거의 없었고, 9.7과 10.0 사이의 값들이 꽤 골고루 분포했던 기억이 난다. 잠시 후에 설명하겠지만 무작위 오차는 통계적 기법으로 제거하는 것이 가능한데, 학생들이 무작위 오차를 제거하는 통계적 기법을 적용하고도 오차가 남아 있다면 이는 보통 실험 수행 방법상에 문제가 있었기에 발생한 체계적 오차이다.

체계적 오차는 참값과 일치하지 않고 편향되어 있다는 사실을 통해서 주로 확인이 가능하므로 참값이 알려지지 않은 물리량을 새롭게 측정하는 데에 있어서는 오차의 존재를 인지하는 것 자체가 상당히 까다로운 문제가 된다. 그래서 실험을 설계하는 단계에서 참값이 알려진 물리량을 확인하는 절차를 거침으로써, 실험 수행 과정에 체계적 오차의 원인이 끼어있지 않은 지 점검하기도 한다. 그리고 체계적 오차는 그 원인이 주로 실험 수행 과정상에 존재하기 때문에 오차를 제거하는 일반적인 방법이 없고, 각 실험 방법의 의미와 한계를 정확히 이해하고, 그 방법에 맞추어 오차를 제거하는 방법을 찾아내야 한다.

체계적 오차를 제거할 수 있는 일반적이고 범용적인 방법이 없다는 것은 측정 결과가 잘못될 수 있다는 것 외에 또 다른 중요한 문제를 야기하곤 한다. 일상생활에서 길이, 체중 등의 측정을 할 때는 이런 일이 잘 일어나지 않지만, 실험실에서 정밀 측정을 수행하다 보면 더러 실험자가 통제하는 실험 조건은 바꾼 것이 없는데, 측정값이 갑자기 잡음 범위 바깥으로 크게 변하는 일들이 있다. 측정의 기본 원리에 대해서 “정량화가 가능한 물리량에는 쉽사리 변하지 않는 참값이 실재한다”고 했으므로, 측정값이 갑자기 변했다는 것은 상당히 이해하기 힘든 일이다. 따라서 이럴 때는 측정값 변화 전후의 두 가지 중 한 가지 값이 더욱 참값에 가깝고, 나머지 한 가지는 ‘모종의 체계적 오차’가 포함된 값이라고 판단하기도 한다. 문제는 이 체계적 오차의 원인을 끝끝내 밝혀내지 못하는 경우도 자주 있다. 결과적으로 측정자가 참값을 ‘선택’하는 상황에 부닥치게 된다. 생각보다 흔하게 ‘원인이 불분명하지만, 체계적 오차가 존재했을 것’이라는 가정하에 이런 종류의 선택이 이루어진다. 충분히 정당한 이유 없이 측정자가 참값을 ‘선택’하는 것을 두고 데이터를 체리-피킹^{cherry-picking}한다고 하는데, 이는 실험 및 연구 윤리를 훼손하는 중차대한 문제이다. 그런데 체계적 오차의 원인이 다소 불분명하더라도 데이터를 선택하는 것이 용납할 수 있는 상황과 연구 윤리를 훼손하는 체리-피킹 사이의 경계가 명확하지 않기에 많은 문제가 발생하기도 한다.

체계적 오차와 달리 무작위 오차는 그 이름이 암시하듯이 오차에 특정한 경향이나 패턴이 없이 무작위로 나타나는 오차이다. 이런 오차는 통계적 방법을 적절히 이용하는 것만으로도 제거할 수 있다. 통계적 방법 중 여러 독자에게 가장 익숙한 개념이 바로 “평균”일 것이다. 진정한 무작위 오차라면 때로는 참값보다 크게, 때로는 작게 나오므로 측정을 여러 번 반복하여 오차의 평균을 내면 0으로 수렴하여야 한다. 따라서 측정을 충분히 많이 하면 평균값은 참값으로 수렴할 것이라고 기대할 수 있다. 그러나 실제로 측정을 무한히 수행할 수는 없는 노릇이고, 실질적으로 의미 있는 실험 횟수는 측정 유효숫자와 실험 수행 시간 사이에서 적당한 절충점을 찾아서 결정하게 된다.

이 절충점이란 결국 측정 불확도^{measurement uncertainty}를 유효숫자에 맞추어 줄이는 작업이다. 갑과 을 두 사람이 용수철로 동일한 물체의 질량을 같은 유효숫자까지 측정하는 실험을 수행했다고 해보자. 갑은 실험을 딱 두 번만 수행하여 11.23 kg, 11.26 kg의 측정 결과를 얻었다. 이때 평균은 11.25 kg이고, 표준 편차는 0.02이다. 반면에 을은 스무 번을 측정한 결과 11.18(×1), 11.20(×2), 11.22(×2), 11.23(×2), 11.24(×5), 11.25(×2) 11.26(×4), 11.28(×1), 11.30(×1)가 얻어졌다면 (괄호안의 곱하기 뒤의 숫자는 측정치가 없어진 횟수) 평균은 11.24 kg이고 표준 편차는 0.03이다. 무작위 오차는 여러 번 측정해야 0으로 수렴한다는 점을 고려해 봤을 때, 갑의 측정 표준 편차가 을의 것보다 작다고 해서 갑의 측정값이 을의 측정값보다 참값에 가깝다고 생각하기는 어렵다. 오히려 열 배나 더 여러 번 측정을 반복한 을의 측정을 더 신뢰하는 것이 합리적으로 보인다. 이를 반영하는 개념이 측정 불확도이다. 측정 평균값을 \(\bar{m}\), 표준편차를 \(\sigma\), 측정 횟수를 \(N\)이라고 한다면 불확도를 포함한 측정값은 \(\bar{m} \pm \sigma/\sqrt{N}\)으로 표현한다. 여기서 \(\pm \sigma/\sqrt{N}\)이 측정 불확도이다. 통계학에서 표본 평균의 분산variance of sample mean에 제곱근을 취한 양에 해당한다. 측정의 표준편차는 유한하더라도, 측정 횟수가 충분히 크다면 측정 불확도는 0에 가까워질 수 있다. 측정 불확도를 포함하여 갑과 을의 측정값을 표현하면 각각 11.25 ± 0.02 kg과 11.24 ± 0.01 kg으로 표현할 수 있다. 이 때 두 측정은 불확도 내에서 두 결과는 일치한다. 많은 경우에 무작위 오차는 참값을 중심으로 가우스 분포를 한다고 가정하므로, 질량의 참값이 \(\bar{m}\)을 중심으로 \(\pm \sigma/\sqrt{N}\), \(\pm 2\sigma/\sqrt{N}\), \(\pm 3\sigma/\sqrt{N}\)의 범위 안에 존재할 확률은 각각 68%, 95%, 99.7%라고 해석한다.

참고로 무작위 오차를 제거한 측정값의 평균이 참값과 얼마나 가까운가를 나타내는 용어가 측정의 정확도^accuracy이고, 각 측정값 사이의 편차가 얼마나 작은가를 나타내는 용어가 측정의 정밀도^precision이다. 반드시 그런 것은 아니지만 일반적으로 측정의 정확도가 높다는 것은 체계적 오차가 작고, 정밀도가 높다는 것은 무작위 오차가 작다는 의미로 이해할 수 있다.

마지막으로 한 가지 염두에 두어야 할 것은 여러 번 반복 측정하여 평균을 취한다고 해서 유효숫자의 개수가 늘어나지는 않는다는 점이다. 앞선 예에서 단순한 산수를 따르면 갑의 측정값 11.23과 11.26의 평균은 11.245지만, 11.245로 표현하게 되면 유효숫자가 5개로 11.23이나 11.26에 비해 1개가 더 많다. 그렇지만 유효숫자 계산 규칙에 따르면 측정 단계에서 발생한 유효숫자의 자릿수가 통계적 계산 과정이나 기타 데이터 후처리 과정에서 늘어나는 것은 허용되지 않는다. 따라서 11.245의 계산 결과는 11.25로 반올림하여 유효숫자를 4개로 다시 맞춘다. 이때 측정 횟수를 늘려서 측정 불확도를 줄인다고 하더라도 유한한 유효숫자의 개수로 인해 측정값이 참값과 다를 수밖에 없는 문제는 사라지지 않는다. 결과적으로 측정 불확도를 측정의 유효숫자보다 작은 자릿수까지 표현하는 것은 의미가 없다. 따라서 측정 빈도를 무한히 늘릴 필요 역시 없으며, 이를 통해서 정밀 측정을 수행하려면 처음부터 충분한 개수의 측정 유효숫자를 확보하는 것이 중요함을 다시 한 번 확인할 수 있다.

잡음의 제거

그렇다면 측정 유효숫자는 어떻게 늘릴 수 있을까? 이를 위해서는 측정의 분해능^resolution과 동작 범위^{dynamic range}를 높여야 하는데, 측정 표준^{measurement reference}을 이용한 브릿지 셋업^{bridge setup} 등이 이런 방법에 해당한다. 무엇을 측정하려고 하느냐에 따라 구체적인 방법은 달라지므로 이는 이후에 연재될 각 측정 물리량별로 그 방법을 알아보기로 하겠다. 여기서는 측정 장비가 아주 작은 신호의 차이를 구분할 수 있는, 따라서 많은 자릿수의 측정 유효숫자가 확보된 상황에서 그 유효숫자들이 실질적으로 의미가 있으려면 어떤 조건을 추가로 만족해야 하는지에 대해 살펴보겠다.

[그림2]의 왼쪽에는 파란색 데이터와 빨간색 데이터로 두 가지 다른(가상의) 측정 결과를 표시해 보았다. 파란색 데이터와 빨간색 데이터 모두 총 6개의 유효숫자(소수점 넷째자리)까지 측정이 이루어졌고, 측정 횟수는 400회이다. 육안으로도 측정값이 10 근처임을 알 수 있는데, 파란색 데이터는 잡음(각 측정값 사이의 편차)이 매우 크다. 반면에 빨간색 데이터는 왼쪽 그래프만 봐서는 측정값 사이의 편차가 있는지가 불분명하다. 이를 보다 확대하여 10 근처의 데이터 분포를 표시한 것이 [그림2]의 우측 그래프로, 실제로 매우 작은 잡음이 섞여 있음을 확인할 수 있다. 두 측정 결과를 통계적으로 처리해 보면 다음 표와 같은 결과를 얻을 수 있다.

	평균	표준편차	불확도
파란색 데이터	10.0507	1.8991	0.0950
빨간색 데이터	10.0002	0.0020	0.0001

우선 파란색 데이터는 측정 불확도가 0.1에 가깝다. 개별 측정 단계에서 유효숫자의 갯수가 많다고 하더라도 우리는 참값에 대해 높은 확률로 9.95와 10.15 사이에 있을 것이라 이야기할 수 있을 뿐이다. 이 확률의 의미를 생각해 봤을 때 소수점 둘째 자리 밑의 숫자들은 유용한 정보를 포함하고 있지 않다. 즉, 6자리나 되는 유효숫자의 이점을 충분히 살린 측정이라고 말할 수 없다. 그에 반해 빨간색 데이터는 높은 확률로 참값이 10.0001과 10.0003 사이에 있을 것이라 결론 내릴 수 있다. 이 경우 참값의 확률 분포를 표현하기 위해서는 실제로 6개의 유효숫자가 모두 필요하다.

물론 파란색 데이터도 측정을 더 많이 반복함으로써 무작위 오차로 인한 불확도를 줄일 수 있다. 다만 측정 불확도가 측정 횟수의 제곱근에 반비례하다 보니 측정 불확도를 1/10 줄이려면 측정 횟수를 100배 늘려야 한다는 문제가 있다. 파란색 데이터의 측정 불확도를 0.001보다 작게 만들어 6개의 유효숫자를 의미 있게 만들기 위해서는 측정횟수를 400만회 이상으로 늘려야 한다. 측정을 1회 수행하는 데에 필요한 시간이 정해져 있다면, 측정 횟수의 문제는 결국 측정 시간의 문제이기도 하다. 매우 큰 무작위 오차를 단순히 측정 횟수를 늘림으로써 제거하려는 것은 비현실적인 접근이다. 짧은 시간 안에 충분히 작은 측정 불확도를 확보할 수 있도록 측정을 수행하기 위해서는 처음부터 무작위 오차 또는 잡음의 크기 자체가 작아야 한다.

^{[그림3](상좌)}한 개의 진동수로 진동하는 사인파.
^{[그림3](상우)}좌측의 사인파를 주파수축에 대해 표현해보면 사인파의 진동수에 해당하는 주파수에서 뾰족하게 표시된다.
^{[그림3](하좌)}모든 진동수에서 무작위 크기와 위상을 갖는 사인파들을 합한 것과 같은 백색 잡음. 신호의 크기가 평균값을 기준으로 임의의 순간에 무작위로 커졌다 작아졌다 한다.
^{[그림3](하우)}백색 잡음을 주파수축으로 표현할 경우, 모든 주파수 영역에서 무작위로 잡음이 존재한다. 일반적으로 왼쪽의 시간 축 백색 잡음의 푸리에 변환하여, 그 크기만을 로그 축으로 표현한다.

잡음을 줄이려면 잡음의 원인을 파악하는 것이 중요하다. 모든 잡음은 그 잡음이 요동치는 시간 척도가 있다. 어떤 잡음은 짧은 시간 안에도 빈번히 요동치는가 하면, 어떤 잡음은 아주 서서히 요동치기도 한다. 잡음이 얼마나 빨리 요동치는가를 잡음의 주파수라고 하는데, 이는 잡음을 마구잡이 사인파들의 집합으로 보는 것이다. [그림3](상좌)에서와 같이 시간에 대해 진동하는 사인파가 있을 경우, 이 시간 주기의 역수를 사인파의 주파수 또는 진동수라고 한다. 그림에서와 같이 단일 사인파가 주어졌다면, 진동수는 단 한 개의 값을 갖는다. 이런 사인파를 시간 축이 아니라 주파수를 축으로 표현하면 [그림3](상우)에서와 같이 특정 주파수에서만 뾰족하게 솟아 있는 그래프로 표현할 수 있다. 그런데 특정 주파수를 가리지 않고 모든 주파수에서 비슷한 크기의 잡음이 섞여 있다면 [그림3](하우)에서와 같이 주파수에 대해 다소 들쭉날쭉하더라도 비교적 일정한 크기일 것이다. 이렇게 별다른 주파수 특성이 없는 잡음을 백색 잡음이라고 한다. 이런 잡음을 시간 축에서 보면 [그림3](하좌)에서와 같이 평균값을 기준으로 무작위로 들쭉날쭉 거리는 형태로 나타난다. 그런데 이런 백색 잡음은 우리 주변에 매우 흔하다. 아날로그 라디오나 텔레비전을 사용해 본 경험이 있는 독자들은 채널 주파수가 맞지 않을 때 라디오에서 ‘치이익’거리는 소리가 나거나, 텔레비전에는 [그림4]에서와 같은 화면이 나타나는 것을 본 적이 있을 것이다. 이런 것들이 라디오와 텔레비전의 백색 잡음이다. 백색잡음이 발생하는 원인은 여러 가지가 있는데, 그 원인이 무엇이냐에 따라 이를 일정 수준까지 줄이는 것은 가능하다. 일례로 측정이 이뤄지는 대상의 온도를 낮출 경우, 열적 요동이라고 하는 요소를 줄임으로써 잡음의 크기를 줄일 수 있다. 그렇지만 백색 잡음을 완전히 없애기란 불가능하다.

예를 들어 모든 주파수 영역에서 잡음이 나타나는 백색 잡음의 평균이 0으로 수렴하게 만들려면, 주기가 무한대에 가까운 사인파 잡음의 평균 역시 0이 될 정도의 시간을 기다려야 한다는 뜻이다. 즉, 무한한 시간 동안 측정해야 한다. 무한히 오래 측정해야 얻을 수 있는 참값이란 실질적으로는 아무 의미가 없는 참값이다. 그렇다면 비교적 합리적인 시간 안에 측정이 가능하도록 잡음을 제거하려면 어떻게 해야 할까? 잡음이 주파수와 진폭이 마구 섞여 있는 사인파의 집합이지만, 만약 우리가 측정하고자 하는 신호는 주파수와 진폭이 잘 정의된 사인파라면, 이 신호 주파수를 제외한 모든 주파수를 걸러내면 잡음의 대부분도 걸러지지 않을까? 실제로 대역 여파기^{band pass filter}나 락-인 진폭기 같은 장비를 이용할 경우 원하는 주파수만 골라내서 측정하는 것이 가능한다. 백색 잡음이 존재하더라도 측정을 수행하는 주파수로 요동치는 잡음만이 측정에 섞여 들어올 뿐이고, 백색 잡음의 대부분을 차단하는 효과가 있다.

지금까지 여러 차례 예를 들었던 용수철이 늘어난 길이로 질량을 측정하는 상황으로 다시 한번 돌아가 보자. 이때 우리가 측정하고자 하는 물리량은 용수철이 늘어난 길이였다. 물체의 질량이 변하지 않는다고 전제한다면, 이상적인 실험 조건 하에서 이 길이는 시간에 대해 변화하지 않는 상수여야 한다. 이렇게 시간에 대해 변하지 않는 물리량을 측정하려고 할 때는 불리한 점이 한 가지 있는데, 백색 잡음에 더해서 바로 핑크 잡음을 고려해야 한다는 사실이다. 거의 모든 물리적 측정 장비들은 주파수의 역수에 비례하는 잡음 크기를 갖는데 이를 핑크 잡음이라고 한다. 주파수에 반비례하므로 이를 \(1/f\)-잡음이라고도 한다. 백색 잡음과 핑크 잡음이 합쳐진 잡음을 주파수에 대한 함수로 그려보면 [그림5]와 같다. 핑크 잡음은 주파수에 반비례하는 특성 때문에 낮은 주파수에서는 백색 잡음보다 그 영향이 크지만 주파수가 높아질수록 그 상대적 영향은 적어진다. 이렇게 핑크 잡음과 백색 잡음이 교차하는 주파수를 모서리 주파수^{corner frequency}라고 한다. 핑크 잡음의 원인은 여전히 명확히 밝혀지지 않았지만, 느리게 진동하는 잡음일수록 그 잡음의 크기가 커진다면, 용수철이 늘어난 길이처럼 시간에 대한 변화가 없는, 즉 주파수가 0인 신호를 측정하려고 할 때 상당한 문제가 되리란 것은 쉽사리 짐작할 수 있다. 그래서 초정밀 측정을 수행하고자 한다면 매우 느린 주파수 측정은 피하는 것이 좋다.

^[그림5] 핑크 + 백색 잡음 그래프. 잡음 세기와 주파수를 모두 로그 축으로 표시하였다. 잡음 세기의 로그값과 주파수의 로그값 사이에 기울기가 -1인 관계를 보이는 부분이 핑크 잡음, 기울기가 0인 부분이 백색 잡음이다.

실제로 거의 모든 정밀 측정은 모서리 주파수보다 높은 주파수에서 교류 신호를 생성할 수 있도록 실험을 설계하고, 그 교류 신호를 측정한다. 그렇게 할 수만 있다면 핑크 잡음이 강하게 섞여 있는 저주파수는 걸러낼 수 있기 때문이다.

그러면 용수철을 이용하여 물체의 질량을 측정할 때도 교류 신호를 발생시킬 수 있을까? 이때 유용한 것이 바로 질량-용수철 시스템의 조화진동자이다. 용수철에 물체를 매달고 용수철의 평형점보다 길게 잡아당기거나 짧게 압축하였다가 놓으면 물체가 상하로 진동한다. 용수철이 훅의 법칙을 잘 따를 경우 이 물체의 진동을 기술하는 운동 방정식은 \(F = m\frac{d^2 x}{dt^2} = – kx\)로 표현이 된다. 새로운 변수 \(\omega = \sqrt{\frac{k}{m}}\)를 정의하고 이 운동방정식을 정리하면 \(\frac{d^2 x}{dt^2} + \omega^2 x = 0\)의 형태로 표현할 수 있는데, 이런 미분방정식을 따르는 물체를 조화진동자라고 한다. 조화진동자의 특징은 평형점을 기준으로 한 물체의 위치가 \(x = A \cos(\omega t + \phi)\) 형태의 (코)사인파를 따른다는 것이다. 여기서 조화진동자의 주파수가 \(f = \frac{\omega}{2\pi}\)인데, 앞선 \(\omega\)의 정의로부터 질량-용수철로 이루어진 조화진동자의 주파수는 \(2\pi f = \sqrt{\frac{k}{m}}\)임을 알 수 있다. 용수철 상수 \(k\)를 이미 알고 있다고 전제하였으니, 조화진동자의 주파수를 측정하는 것만으로도 물체의 질량을 측정하는 것이 가능하다.

불확도 전파^{Propagation of Uncertainty}

자, 그러면 질량-용수철 시스템의 조화 진동자 주파수를 측정하면 물체의 질량을 측정할 수 있다는 것까지는 알겠다. 그렇지만 진동의 주파수를 알아내기 위해서는 물체가 진동을 시작하여 제자리로 돌아오는 것을 확인해야 한다. 결과적으로 측정의 첫 단에서는 각 시간에서 물체의 위치를 측정함으로써 x(t) 함수 형태로 표현할 수 있는 데이터를 얻어야 한다. 그렇지만 시간과 위치 측정에 있어서 모두 오차가 있으므로 이렇게 얻은 데이터는 사인파형에 가깝지만 완벽한 사인파형은 아니다. [그림6]에서와 같이 시간과 위치 측정에 있어서 오차의 정도에 따라 실제 데이터가 사인파에 유사한 정도가 차이 난다. 이렇게 측정된 여러 데이터 값들로부터 진동의 주기값 한 가지를 추출하는 것은 주로 데이터를 이론적 곡선에 맞추는 곡선 근사^{curve fitting}를 통해 이루어진다. 곡선 근사란 곡선을 표현하는 함수에 몇 가지 변수를 부여하고, 이 함수가 주어진 데이터에 최대한 가까워지도록 이 변수들을 조절하는 것이다. 일반적인 사인파형을 \(x(t) =A \sin (\omega t + \phi) + x_0\)의 형태로 표현한다면 사인파의 진폭(\(A\))과 주파수(\(\omega\)), 위상(\(\phi\)), 잔류 편차(offset, \(x_0\))가 이들 변수에 해당한다. 곡선 근사 방법 역시 다양하지만 가장 일반적인 원리는 다음과 같다. 우선 각 변수에 값을 부여하여 얻은 사인파 곡선과 각 데이터 사이의 차이 값들을 계산한다. 그 차이 값들의 표준 편차를 계산한 후에, 변숫값을 바꾸어 동일한 계산을 반복한다. 최종적으로 차이 값의 표준편차가 최소가 되는 변숫값을 찾는다.

곡선 근사를 통해 얻은 주파수 값 역시 통계적 값이므로 주파수에도 측정 불확도가 존재한다. [그림6]에서 우리가 수행하는 1단계 측정값인 위치와 시간의 측정 오차가 작으면 작을수록 주파수의 측정 불확도 역시 작을 것이라 짐작할 수 있다. 그런데 우리가 원하는 수준의 주파수 불확도를 얻었다면 그것만으로 원하는 수준의 질량 불확도를 얻을 수 있을까? 지금까지 우리는 별 의심 없이 용수철 상수 \(k\)를 알고 있다는 전제를 깔고 있었다. 그렇지만 용수철 상수 \(k\)는 하늘에서 저절로 떨어지는 값이 아니고, 모종의 실험을 통해 측정하여야 한다. 즉 용수철 상수 역시 평균값 \(\bar{k}\)와 불확도 \(u_k\)를 갖는 양(\(\bar{k} \pm u_k\))이다.

우리가 최종적으로 측정하고자 하는 질량값은 \(m =\frac{k}{4 \pi^2 f^2}\)의 식을 이용하여 계산할 수 있는데, 여기서 \(k\)의 측정값과 \(f\)의 측정값은 고유한 값이 아니라 앞서 언급한 바와 같이 \(\bar{k} \pm u_k\)와 \(\bar{f} \pm u_f\)의 범위 안에 있을 확률이 68%인 양으로 정의된다. 용수철 상수와 진동 주파수 측정은 각각 독립적인 측정이므로—정밀 측정의 특성상 각각의 불확도 \(u_i\)가 측정 평균값 \(\bar{I}\)보다 훨씬 작다면—질량 m은 \(\bar{m} = \frac{\bar{k}}{4 \pi^2 \bar{f}^2}\)을 중심으로 \(\pm \bar{m} \left(\frac{u_k}{\bar{k}} + 2\frac{u_f}{\bar{f}} \right)\)의 범위 안에 존재할 확률이 68%이다. 여기서 주목할 것은 용수철 상수 측정과 진동 주파수 측정의 불확도가 더해진다는 점이다. 즉, 어떤 물리량을 직접 측정하는 것이 아니라 측정 함수를 이용한 2단계 또는 3단계 측정을 해야 하는 경우에는 측정 함수에 포함된 여러 물리량의 불확도가 복합되어 나타난다. 이처럼 여러 측정을 결합했을 때 불확도 역시 결합되는 것을 불확도 전파라고 한다. 그리고 불확도가 전파될 때는 각각 측정의 불확도가 합산되는 특성상 측정 불확도가 가장 높은 물리량에 의해 최종 측정 불확도 역시 대부분 결정된다. 앞선 예에서 질량을 초정밀 측정하기를 원한다면 주파수만을 아주 높은 정밀도로 측정하는 것만으로는 충분하지 않고, 용수철 상수 역시 아주 높은 정밀도로 측정할 수 있어야 한다는 의미이다. 지난 글에서 우리는 가장 직접적인 1단계 측정이 가능한 물리량은 몇 가지 없다고 했다. 즉, 우리가 측정하고자 하는 대부분의 물리량은 측정 함수를 포함한 2단계 내지는 3단계, 또는 그 이상의 측정을 통해서만 알아낼 수 있고, 측정 불확도를 낮게 유지하는 초정밀 측정을 수행하려면 그만큼 측정의 난이도 역시 높아진다.

앞으로 이 연재물을 통해서 이런 고난이도 측정 몇 가지에 대해 자세히 살펴볼 계획이다. 각 물리량 측정에 있어서 전문가들의 글을 통해 원자시계의 주파수 \(\nu\), 광속 \(c\), 플랑크 상수 \(h\), 전자의 전하에 해당하는 기본 전하 \(e\), 미세구조 상수 \(\alpha\), 그리고 마지막으로 볼츠만 상수 \(k\)를 측정하는 방법과 각 상수 측정이 도달할 수 있는 정밀도의 수준에 대해서 알아볼 것이다. 이런 상수들을 정밀하게 측정할 수 있었기에, 이 상수값을 새롭게 정의하고, 그렇게 정의된 값들을 바탕으로 시간, 길이, 질량과 온도의 단위 역시 새롭게 정의하는 것이 가능해졌다. 이와 관련된 단위 정의의 원리와 그 외에 이런 초정밀 측정들이 어떤 쓸모가 있는지에 대해서도 살펴보겠다. 연재의 시작으로, 인간이 수행할 수 있는 측정 중 가장 작은—무려 \(10^{-19}\)에 달하는—불확도를 갖는 원자시계의 주파수 측정에 대해 알아볼 예정이니, 지난 두 편의 글을 통해 이 쉽사리 상상되지 않는 초정밀 측정의 세계에 독자들도 함께 뛰어들 준비가 되어 있기를 희망해 본다.