I have not failed. I’ve just found 10,000 ways that won’t work.
-Thomas Edison

 

실패의 역사가 있다. 우리는 보통 성공의 역사만을 기억하지만 실패에도 역사가 있고, 종종 성공보다 실패로부터 훨씬 더 많은 것을 배울 수 있다. 

물리학의 역사는 거칠게 보면 “물질은 무엇인가”라는 질문에 답을 하는 과정이다. 이 과정에서 물리학은 수많은 실패를 겪어 왔다. 다행히 물리학은 이러한 수많은 실패에도 불구하고, 아니 실패를 통해서 배운 교훈 덕분에 물질의 실체에 점점 더 가까이 다가서고 있다. 물리학이 물질의 실체를 밝히는 과정에서 어떠한 실패의 역사가 있었는지 알아보자.

물질은 무엇인가라는 질문은 거의 모든 문명의 초창기에 나타났다. 동일한 질문이 나타났다는 것도 재미있지만, 더욱더 놀라운 사실은 질문에 대한 답도 상당 부분 같았다는 것이다. 예를 들어 그리스, 페르시아, 바빌론, 티벳, 인도 등지에서 발생한 고대 문명에서는 물질이 좁게는 4가지, 넓게는 5가지 종류의 기본 원소element로 이루어진다고 믿었다. 흔히 말하는 4원소설과 제5원소이다. 4원소설에서 원소는 흙earth, 물water, 공기air, 불fire이다. 그리고 여기에 더해지는 마지막 제5원소는 에테르aether 혹은 빈 공간을 의미하는 “공void”이다.

과학이 발전하기 전에 살았던 고대인들의 입장으로 돌아가서 물질을 구성하는 기본 원소를 꼭 4가지를 꼽아야 한다면, 앞서 언급한 원소들은 나름대로 꽤 그럴듯해 보인다. 우선 4원소는 고대인들이 자연으로부터 얻는 가장 친숙하고 중요한 “물질”이다. 우리는 흙, 즉 땅을 디디고 있으며 땅에서 자라나는 식물들로부터 곡식을 얻어 살아간다. 물과 공기는 두 말할 필요도 없이 우리 생명에 필수불가결하다. 불은 추위로부터 우리를 보호하고 음식을 익혀 먹을 수 있게 해 준다.

물론 현대적인 관점에서 보면 4원소는 물질을 미시적으로 구성하는 원소, 즉 원자atom가 아니다. 굳이 의미를 붙이자면, 4원소는 물질의 거시적인 상태를 표현하는 비유에 가깝다. 즉, 흙, 물, 공기는 각각 물질의 3가지 상태인 고체, 액체, 기체를 표현하는 것으로 생각할 수 있다. 불은 물질의 상태를 표현하는 이러한 원소들과 결이 조금 다르기는 하지만 아마도 고대인들이 생각하기에 물질의 상태를 변화시킬 수 있는 모종의 “힘”, 즉 에너지를 은유적으로 표현하는 것으로 생각할 수 있다.

그런데 제5원소는 나머지 4가지 원소와는 다르게 매우 추상적이다. 제5원소는 흙, 물, 공기처럼 물질도 아니고 불처럼 에너지도 아니다. 말하자면 제5원소는 나머지 4가지 원소가 존재하는 공간 자체를 의미한다. 어찌 보면 제5원소는 그 자체로 존재한다기보다는 물질이 없음을 통해서 존재하는 배경인 것이다. 이렇듯 애매모호한 실체를 지니는 제5원소를 꼭 물질의 기본 원소에 포함시켜야 하는 것일까?

플라톤은 그래야만 한다고 생각했다.


플라톤이 그렇게 생각한 이유는 물질을 구성하는 기본 원소가 완벽해야 한다고 믿었기 때문이다. 조금 더 구체적으로 말해서, 기본 원소는 3차원 공간에서 완벽한 입체 구조를 가져야 한다고 믿었다. 그렇다면 3차원 공간에서 완벽한 입체 구조란 무엇인가? 플라톤은 그것이 정다면체regular polyhedron, 즉 모든 면이 정삼각형, 정사각형, 정오각형과 같은 정다각형regular polygon으로 이루어진 입체 구조라고 생각했다.

 

재미있는 점은 3차원에서 구현 가능하면서 볼록한 정다면체는 정확히 5개라는 사실이다. 우선 4개의 정삼각형으로 이루어진 정사면체regular tetrahedron가 있다. 그보다 한 단계 많은 수의 정다각형으로 이루어지는 정다면체는 6개의 정사각형으로 이루어진 정육면체regular hexahedron or cube이다. 그다음 정다면체로는 8개의 정삼각형으로 이루어진 정팔면체regular octahedron와 12개의 정오각형으로 이루어진 정십이면체regular dodecahedron가 있다. 마지막 정다면체는 20개의 정삼각형으로 이루어진 정이십면체regular icosahedron이다. 참고로 이러한 5개의 정다면체를 “플라톤의 입체Platonic solid”라고 부른다.

자, 이제 그럼 각각의 정다면체는 어떤 원소에 대응되는 것일까?

플라톤은 물은 자유롭게 흐를 수 있으므로 구에 가장 가까운 정이십면체에 대응되고, 물에 정반대인 성질을 지니는 불은 가장 날카로운 구조를 지니는 정사면체에 대응된다고 생각했다. 그리고 흙은 단단하게 공간을 채울 수 있어야 하므로 정육면체에 대응되고, 공기는 불처럼 날카롭지는 않지만 그와 비슷하게 쉽게 움직일 수 있는 정팔면체에 대응된다고 생각했다.

마지막으로 남은 것은 정십이면체이다. 플라톤은 완벽한 입체 구조가 낭비될 리 없다고 생각했다. 반드시 정십이면체에 대응되는 원소가 자연에 존재해야만 한다고 생각했다. 그 원소가 바로 제5원소이다.

플라톤의 원자론은 물론 실패했다. 물질의 기본 원소, 즉 원자의 형성은 정다면체와는 전혀 상관이 없다. 하지만 현대 물리학의 관점에서 보았을 때, 플라톤의 원자론은 놀라울 정도로 현대적이다. 무릇 원자론의 핵심은 원자가 더 이상 쪼갤 수 없는 물질의 기본 단위라는 것이다. 그러기 위해서 원자는 모종의 근본적인 원리에 의해서 보장되는 안정적인 구조를 지녀야 한다. 플라톤은 그 원리가 완벽한 입체 구조라고 생각했다. 양자역학에서 그 원리는 파동 함수가 정상파를 형성하는 조건이다.

참고로 이렇게 모종의 근본적인 원리에 의해서 새로운 입자가 존재해야 한다고 예측하는 것은 현대 입자 물리학을 이끄는 가장 중요한 원동력 중의 하나이다. 최근의 예를 하나 들자면, 힉스 입자Higgs particle가 바로 그렇게 해서 발견된 입자이다.

이제 다시 본 논의로 돌아가서, 플라톤의 원자론이 조금 더 실질적인 자연과학으로 대체되기 위해서 인류는 뉴턴 역학의 출현을 기다려야 했다. 잘 알다시피 뉴턴 역학은 태양계 속 행성들의 궤도를 예측하는 과정에서 탄생하게 된다. 역사적으로 볼 때 태양계는 원소와 비슷하게, 혹은 그 이상으로 모종의 근본적인 원리에 의해서 형성되었다는 믿음이 있어왔다.

어찌 보면 당연하게 플라톤의 입체는 태양계의 구조를 설명하는 데에도 중요한 역할을 하게 된다.

 

 

플라톤의 입체와 케플러의 실패한 태양계 모형

16세기까지 태양계는 지구와 5개의 행성인 수성Mercury, 금성Venus, 화성Mars, 목성Jupiter, 토성Saturn으로 구성된다고 알려져 있었다. 그런데 묘하게도 지구를 제외하고 행성의 개수는 하필이면 또 5이다.

1596년 독일의 천문학자 요하네스 케플러Johannes Kepler는 이 사실에 주목했다. 케플러는 5개의 플라톤의 입체들 사이에 딱 맞는 구를 끼워 넣는 상황을 생각해 보았다. 구체적으로 처음에 작은 구가 하나 있다고 하자. 이 구를 정팔면체로 딱 맞게 감싸도록 하자. 그리고 나서 이 정팔면체를 또 다른 구로 딱 맞게 감싸자. 그 다음으로는 정이십면체를 끼고, 다시 또 다른 구로 딱 맞게 감싸자. 이렇게 비슷한 과정을 다른 플라톤의 입체에 대해서 적절하게 반복해서 적용하면 다음과 같다.

“구(1), 정팔면체, 구(2), 정이십면체, 구(3), 정십이면체, 구(4), 정사면체, 구(5), 정육면체, 구(6)

아무 의미 없는 숫자 놀음 같지만, 놀랍게도 구(1)-구(6)의 상대적인 반경은 각각 수성, 금성, 지구, 화성, 목성, 토성의 궤도의 상대적인 반경과 나름 정확하게 맞아떨어진다. 물론 이러한 케플러의 태양계 모형은 당시에도 그랬지만 특별한 과학적인 근거가 없다. 그저 우연히 숫자들이 맞은 것이다.

게다가 조금만 생각해 보면 케플러의 태양계 모형은 태생부터 치명적인 약점을 지니고 있다. 플라톤의 입체가 5가지밖에 안 되기 때문에 나중에 발견되는 천왕성과 해왕성, 그리고 최근에 행성의 지위가 박탈되기는 했지만 명왕성은 전혀 설명할 수 없었던 것이다.

케플러 본인은 행성들의 궤도가 완벽한 원이 아니라 찌그러진 타원임을 알게 되어 자신의 이론을 버리게 된다. 즉, 17세기 초, 구체적으로는 1609년에서 1619년까지 걸친 기간 동안에 케플러는 티코 브라헤Tycho Brahe의 관측 자료를 치밀하게 분석하여 뉴턴 역학과 중력 법칙의 토대가 되는 케플러의 행성 운동에 관한 3법칙, 줄여서 케플러의 법칙Kepler’s laws을 발견하게 된다. 행성의 궤도가 타원이라는 사실은 케플러의 제1법칙이다.

곰곰이 잘 생각해 보면, 케플러의 “플라톤의 입체” 태양계 모형은 그 자체로 실패할 수밖에 없는 이론이었다. 하지만 케플러의 태양계 모형은 지구가 다른 행성들과 마찬가지로 태양의 주위를 돈다는 지동설을 바탕으로 두고 있었다. 그 당시까지 아직 지동설과 천동설이 대립하고 있었던 사실을 생각해 볼 때, 케플러의 태양계 모형은 비록 행성들의 궤도를 정량적으로 예측하는 데에는 실패했지만, 큰 그림으로 보면 바른 길로 들어서게 된 중요한 계기였던 것이다.       

그렇다면 과연 태양계 속 행성들의 궤도의 반경을 성공적으로 예측하는 이론은 존재하는가?

 

 

티티우스-보데 법칙과 필자의 실패한 원자 모형

케플러의 법칙은 태양계 속 행성들의 궤도가 지니는 여러 성질들을 정밀하게 예측할 수 있었다. 하지만 그럼에도 불구하고 행성들의 궤도의 반경이 얼마나 될지를 예측하는 것은 불가능했다. 이것은 1687년 『프린키피아The Principia』, 원제목으로는 『자연철학의 수학적 원리Philosophia Naturalis Principia Mathematica』를 통해서 뉴턴 역학과 중력 법칙이 발견된 이후에도 여전히 불가능했다.

뉴턴 역학의 관점에서 바라보면, 태양계 속 행성들의 궤도의 반경은 태양계가 형성될 당시에 주어지는 초기 조건에 의해서 결정된다. 따라서 초기 조건에 특별한 의미가 있지 않는 한 행성 궤도의 반경을 결정하는 근본적인 원리를 찾는 것은 불가능하다. 물론 원칙적으로 태양계를 구성하는 많은 물질들이 복잡하고 묘한 상호작용을 하여, 결과적으로 행성들의 궤도가 특별한 법칙에 의해서 기술될 수는 있다. 하지만 언뜻 생각하기에 그럴 가능성은 높아 보이지 않는다.

그런데 놀랍게도 태양계 속 행성들의 궤도의 반경을 상당히 정확하게 예측하는 법칙이 실제로 존재한다. 바로 “티티우스-보데 법칙Titius-Bode’s law”이다.

티티우스-보데 법칙은 원래 1766년 독일의 천문학자 J. D. 티티우스Johann Daniel Titius가 발견한 법칙으로 1772년 베를린 천문대의 J. E. 보데Johann Elert Bode가 세상에 발표함으로써 널리 알려졌다.

필자가 티티우스-보데 법칙을 처음 접한 것은 중학교를 다닐 때였다. 어느 날 필자의 학교에 지구과학 교생 선생님 한 분이 오셨다. 교생 선생님은 당시로는 파격적으로 학생들에게 지구과학에 관계된 내용 중에서 본인이 관심 있는 내용을 자발적으로 조사해서 발표하는 프로젝트를 실시하였다. 같은 반 친구들은 주로 태양계에 속한 개별 행성, 위성 혹은 혜성 등에 대해서 조사했다. 그런데 필자는 왜 그랬는지 모르겠지만, 개별 천체의 구체적인 현상보다는 태양계의 전체적인 구조와 관련해서 무엇인가 근본적인 원리가 있는지 궁금했다. 그렇게 해서 우연히 알게 된 법칙이 바로 티티우스-보데 법칙이다.

구체적으로 티티우스-보데 법칙에 따르면 지구 궤도의 평균 반경, 엄밀하게는 타원 궤도의 긴반지름semi-major axis을 기본 단위인 1 천문 단위astronomical unit, AU라고 할 때, 각 행성 궤도의 긴반지름 \(a\)는 다음 공식에 의해서 기술된다.

\(a= 0.4 +0.3\times 2^n\)

여기서 \(n\)은 \(-\infty, 0, 1, 2, 3, \cdots\)이다. 구체적으로 숫자를 넣어보면 다음과 같다.

\(a= 0.4,\;\; 0.7,\;\; 1,\;\; 1.6,\;\; 2.8,\;\; 5.2,\;\; 10,\;\; 19.6,\;\; \cdots\)

티티우스-보데의 법칙이 발표된 시점까지 알려진 행성은 케플러 시대와 동일하게 수성, 금성, 지구, 화성, 목성, 토성으로 총 6개였다. 앞서 예고했듯이 기본 단위로 정해진 지구 궤도의 긴반지름을 제외하고 나머지 5개 행성들의 궤도의 긴반지름은 티티우스-보데의 법칙의 예측과 거의 정확하게 일치했다. 구체적으로 수성은 \(a=0.4\) \((n=-\infty)\), 금성은  \(a=0.7\) \((n=0)\), 지구는 \(a=1\) \((n=1)\), 화성은  \(a=1.6\) \((n=2)\), 목성은 \(a=5.2\) \((n=4)\), 토성은 \(a=10\) \((n=5)\)에 해당한다. 혹시 눈썰미 좋은 독자들은 눈치챘는지 모르겠지만, 여기서 \(a=2.8\) \((n=3)\)에 해당하는 행성은 없다. 이 문제는 아래에서 조금 더 자세하게 이야기하게 될 것이다.  

물론 이미 알려진 결과를 잘 고안한 공식으로 꿰어 맞추는 것은 언제나 가능할 것이다. 진짜 어려운 일은 미래를 예측하는 것이다. 당시 천문학자들은 티티우스-보데 법칙이 과연 새로운 행성을 예측할 수 있는지 궁금해했다. 

그러던 중 1781년 윌리엄 허셜William Herschel이 천왕성Uranus을 발견한다. 그리고 놀랍게도 새롭게 발견된 천왕성의 궤도의 긴반지름은 거의 정확하게 \(a=19.6\) \((n=6)\)에 해당했다. 이 사실에 고무된 보데와 일군의 천문학자들은 당장 \(n=3\)에 해당하는 행성을 찾기로 한다. 마침내 1801년 팔레르모 천문대장인 쥬세페 피아치Giuseppe Piazzi는 \(n=3\)에 해당하는 위치에서 소행성을 발견하고 세레스Ceres라는 이름을 붙인다. 나중에 알려진 사실이지만, \(n=3\)에 해당하는 위치 주변에는 세레스뿐만 아니라 수많은 다른 소행성으로 이루어진 소행성대asteroid belt가 존재한다.

천왕성과 세레스의 발견으로 티티우스-보데 법칙은 학계에서 큰 각광을 받는다. 하지만 불행하게도 1846년 해왕성Neptune이 발견되면서 티티우스-보데 법칙의 명성에는 큰 금이 가게 된다. 해왕성의 위치가 티티우스-보데 법칙의 예상으로부터 너무 많이 벗어났기 때문이다. 더군다나 이제는 행성의 지위를 놓치기는 했지만 명왕성Pluto의 위치도 티티우스-보데 법칙의 예상과는 많이 달랐다. 참고로 [그림2]를 보라.

결국 나중에 정확도가 떨어지기는 했지만 티티우스-보데 법칙은 당시 중학생이었던 어린 필자에게 깊은 인상을 남겼다. 깊은 인상은 필자를 떠나지 않았고, 어느덧 고등학생이 된 필자는 물리와 화학 수업을 통해서 원자론에 대해서 배우게 된다. 그때 필자가 배우기를, 원자는 기본적으로 전자들이 원자핵의 주변을 도는 작은 태양계와 같다고 했다. 하지만 원자 속 전자들의 궤도는 태양계 속 행성들의 궤도와 다르게(?) 띄엄띄엄 불연속적으로 양자화된다고 했다.

필자는 원자 속 전자들의 궤도가 태양계 속 행성들의 궤도와 다르다는 선생님의 가르침을 살짝 무시했다. 그리고 생각했다.

“흠, 혹시 원자 속 전자들의 궤도도 태양계 속 행성들의 궤도와 비슷하게 티티우스-보데 법칙, 혹은 그와 비슷한 법칙에 의해서 양자화되는 것이 아닐까?”

그때는 이름만 들어 보았지만, 필자는 양자역학이란 다름 아니라 미시적인 공간에 적용되는 티티우스-보데 법칙이라고 생각했다. 말하자면 이것은 필자의 원자 모형이었다.

물론 필자의 원자 모형은 틀렸다.

지금 이 글을 읽고 있는 독자 중에서 많은 사람들은 필자를 포함해서 예전 천문학자들이 티티우스-보데 법칙과 같이 근본적인 원리 없이 관측 결과를 꿰어 맞추는 “숫자 놀음”을 너무 진지하게 받아들인 것은 아닌가라고 생각할 것이다. 물론 그렇다. 단순한 숫자 놀음에 놀아나서는 안 될 것이다. 

그런데 정말 아이러니하게도 양자역학은 실제로 티티우스-보데 법칙과 크게 다를 바 없는 숫자 놀음에서 탄생하게 된다.

 

 

발머 공식과 보어의 원자 모형

1885년 스위스의 한 수학교사였던 요한 발머Johann Balmer는 물리학자인 친구가 있었다. 그 친구는 발머에게 농담 삼아 수소의 스펙트럼을 설명할 수 있는 공식을 한 번 생각해 보는 것이 어떻겠냐고 제안한다. 당시 물리학계의 가장 큰 과제 중의 하나는 가열된 수소 원자에서 나오는 빛이 띄엄띄엄 불연속적인 파장을 가진다는 사실을 이해하는 것이었다. 참고로 수소 원자에서 나오는 빛은 가시 광선 영역에서 [그림3]과 같은 파장을 가진다.

 

 

여기서 nm은 나노미터nanometer로서 \(10^{-9}\)미터, 즉 10억 분의 1미터를 의미한다.

독자들은 위 숫자들을 보면 무슨 생각이 드는가? 어떻게 그럴 수 있는지 상상하기 힘들지만, 발머는 마치 신탁을 받은 것처럼 위 숫자들 사이에 묘한 수학적인 관계가 존재한다는 사실을 눈치챈다.

다시 말해서 발머는 모종의 단위 파장이 존재하며, 위 파장들은 이 단위 파장에 적절한 분수를 곱하면 얻을 수 있다는 사실을 깨닫는다. 구체적으로 단위 파장을 364.6 nm라고 할 때, 위 파장들은 다음과 같은 분수 비율을 가진다.

\(\frac{9}{5},\;\; \frac{4}{3},\;\; \frac{25}{21},\;\; \frac{9}{8}\)

처음 보면 이 분수들은 무작위적으로 주어지는 숫자들처럼 보인다. 하지만 발머는 이 분수들이 모두 다음과 같이 정수의 제곱과 관련이 있다고 생각했다.   

\(\frac{3^2}{3^2-2^2},\;\; \frac{4^2}{4^2-2^2},\;\; \frac{5^2}{5^2-2^2},\;\; \frac{6^2}{6^2-2^2}\)

결론적으로 발머는 수소 원자로부터 나오는 가시 광선 영역에 속하는 빛의 파장을 하나의 공식으로 깔끔하게 정리할 수 있었다.

\(\lambda=B\frac{m^2}{m^2-2^2}\)

여기서 \(B\)는 앞에서 언급한 모종의 단위 파장으로서 364.6 nm이다. \(m\)은 2보다 큰 정수이다. 이 공식의 이름은 “발머 공식Balmer formula”이다.

발머 공식은 스웨덴의 물리학자인 요하네스 뤼드베리Johannes Rydberg에게 깊은 영감을 주었다. 왜냐하면 그 당시 뤼드베리 자신도 수소 원자의 스펙트럼 문제에 대해서 깊게 고민하고 있었기 때문이었다. 특히, 뤼드베리는 자신만의 직관에 따라서 발머 공식을 다음과 같이 살짝 바꾸어 보기로 한다.

\(\frac{1}{\lambda}=R_H\left(\frac{1}{2^2}-\frac{1}{m^2}\right)\)

여기서 \(R_H=4/B\)는 뤼드베리 상수Rydberg constant라고 불린다. 아무것도 아닌 것 같지만 뤼드베리는 문자 그대로 발머 공식을 거꾸로 뒤집음으로써 발상을 뒤집었다. 그리고 더 나아가서 뤼드베리는 괄호 안 첫 번째 분수의 분모인 \(2^2\)을 다음과 같이 일반화시키기로 한다.

\(\frac{1}{\lambda}=R_H\left(\frac{1}{n^2}-\frac{1}{m^2}\right)\)

여기서 \(n\)은 \(m\)보다 작은 정수이다. 이것이 바로 그 유명한 뤼드베리 공식Rydberg formula이다.

뤼드베리 공식이 양자역학을 촉발시킨 이야기는 “믿기 힘든 양자 Incredible Quantum [7]: 두 상태 이야기”에서 자세하게 설명했다. 하지만 기억을 되살리기 위해서 다시 한번 짧게 정리해 보면 다음과 같다.

닐스 보어Niels Bohr는 뤼드베리 공식을 유도하기 위해서 재미있는 가정을 하나 한다. 그 가정은 바로 각운동량angular momentum이 플랑크 상수Planck constant  \(h=6.63\times 10^{-34}\; {\rm m}^2{\rm kg}/{\rm s}\)의 정수배가 된다는 것이다.

\(L=n\hbar\)

여기서 \(n\)은 정수이고 \(\hbar=h/2\pi\)는 환원된 플랑크 상수reduced Planck constant라고 불린다. 참고로 이 가정은 보어의 양자화 조건이라고 알려지게 된다. 자신의 양자화 조건으로 뤼드베리 공식을 성공적으로 설명한 보어는 단숨에 물리학계의 세계적인 스타가 된다.

이제 질문은 “각운동량은 왜 양자화되는가”이다. 보어의 양자화 조건이 무엇을 의미하는지를 처음 깨달은 사람은 아인슈타인Einstein이었다. 구체적으로 그는 보어의 양자화 조건이 다름 아니라 모종의 파동이 원형 궤도에 국한될 때 정상파가 형성되는 조건과 정확히 같다는 사실을 깨닫는다.

\(2\pi r = n\lambda\)

여기서 \(r\)은 원형 궤도의 반지름이고 \(\lambda\)는 파동의 파장이다. 보어의 양자화 조건이 원형 궤도에서 정상파가 형성되는 조건과 연결되는 이유는 드브로이de Broglie의 파동-입자 이중성wave-particle duality에 기인한다.

\(\lambda=\frac{2\pi\hbar}{p}\)

여기서 \(p\)는 전자의 운동량이다. 이제 위 두 공식을 결합하면 보어의 양자화 조건을 얻을 수 있다. (힌트: \(L=rp\))

이로써 원자의 핵심 원리는 보어의 양자화 조건을 통해서 이해된 것 같았다. 하지만 곰곰이 잘 생각해 보면 보어의 양자화 조건은 태생적으로 불완전할 수밖에 없었다. 그 이유는 보어의 양자화 조건이 각운동량이라는 매우 특정한 물리량에 의존했기 때문이다. 다시 말해서, 회전 대칭성이 없는 시스템은 처음부터 각운동량이 보존되지 않는다. 이러한 시스템에서 보어의 양자화 조건을 논의하는 것은 애초부터 의미가 없다. 그렇다면 도대체 일반적으로 무엇이 양자화되어야 하는 것일까?

각운동량 대신에 일반적인 상황에서 양자화되는 물리량을 찾으려는 시도는 보어의 원자 모형 이후에 물리학에서 가장 중요한 과제가 된다. 이 과제는 독일의 물리학자 아놀드 조머펠트Arnold Sommerfeld에 의해서 궁극적으로 불완전하기는 했지만 부분적으로 해결된다. 나중에 “보어-조머펠트 양자화 조건Bohr-Sommerfeld quantization condition”이라고 불리게 되는 이 해결책을 이해하기 위해서, 쉬운 예를 하나 생각해 보자.

구체적으로 1차원 퍼텐셜 우물potential well에 갇힌 입자의 동역학을 생각해 보자.

\(E=\frac{p^2}{2m}+U(x)\)

 

여기서 \(E\)는 전체 에너지, \(p\)는 운동량, \(U(x)\)는 공간 변수 \(x\)에 의존하는 퍼텐셜 에너지이다. 직관적으로 말해서, 이 상황에서 입자는 전체 에너지와 퍼텐셜 에너지에 의해서 결정되는 범위 내에서 앞뒤로 움직이며 진동하게 될 것이다. 참고로 [그림4]를 보라.

이때 보어-조머펠트 양자화 조건은 다음과 같이 주어진다.

\(\oint p dx =nh\)

여기서 적분 기호 \(\oint\)는 입자가 앞뒤로 움직이며 진동하는 한 주기에 대해서 적분을 하는 것을 의미한다.

언뜻 복잡해 보이는 보어-조머펠트 양자화 조건은 도대체 물리적으로 무엇을 의미하는 것일까? 사실 보어-조머펠트 양자화 조건은 각운동량이 양자화되는 것과 비슷한 기하학적인 의미를 지니고 있다. 구체적으로 [그림4]를 보면, 보어-조머펠트 양자화 조건은 \(x\)와 \(p\)의 함수로 만들어지는 폐곡선 안에 담긴 면적이 양자화되는 것을 의미한다. 조금 더 구체적으로, 앞선 에너지 공식을 이용해서 \(p\)를 \(x\)의 함수로 표현하고, \(x\)의 적분 구간을 구체적으로 표시해서 보어-조머펠트 양자화 조건을 다시 쓰면 다음과 같다.

\(2\int_{x_1}^{x_2} \sqrt{2m(E-U(x))} dx =nh\)

여기서 \(x_1\)과 \(x_2\)는 각각 입자의 최소와 최대 위치를 의미한다.

여기서 지면 관계상 자세하게 보일 수는 없지만, 위에서 제시한 보어-조머펠트 양자화 조건은 사실 수소 원자 문제에 있어서 보어의 원자 모형과 정확히 같은 해로 귀결된다. 그뿐만 아니라 보어-조머펠트 양자화 조건은 상당히 일반적인 문제에 적용될 수 있었으며, 실제로 다양한 문제를 성공적으로 해결하게 된다. 이렇듯 보어-조머펠트 양자화 조건은 보어의 원자 모형을 벗어나 진정한 양자역학의 세계로 넘어가는 과정에서 중요한 가교 역할을 한다.

참고로 현대적인 관점에서 보면 보어-조머펠트 양자화 조건은 이후 발견되는 본격적인 양자역학을 근사적으로 이해하는 방법 중의 하나인 소위 “WKBWentzel-Kramers-Brillouin 근사”에 해당하게 된다.

하지만 보어-조머펠트 양자화 조건은 궁극적으로 실패한다. 그런데 재미있게도 보어-조머펠트 양자화 조건이 실패하게 되는 이유는 묘하게도 고전역학의 가장 어려운 문제와 맞닿아 있었다.

구체적으로 보어-조머펠트 양자화 조건은 암묵적으로 입자의 궤도가 주기적으로 반복되는, 소위 닫힌 궤도closed orbit가 된다는 것을 가정한다. 하지만 입자의 개수가 많은 다체 문제many-body problem에서는 입자의 궤도가 반드시 닫힌다는 보장이 없다. 소위 카오스chaos 현상이 일어날 수 있기 때문이다. 카오스 현상이 일어나는 가장 대표적인 예로는 유명한 “3체 문체three-body problem”가 있다.

간단하게 말해서, 3체 문제란 3개의 물체가 서로 상호작용하는 시스템에 관한 문제이다. 고전역학적인 예로는 쌍성계binary star system, 즉 2개의 별로 구성된 항성계star system 속 행성의 궤도에 관한 문제가 있다. 양자역학적인 예로는 수소 분자, 즉 2개의 수소 원자가 결합해서 만들어지는 분자 속 전자의 궤도, 엄밀하게 오비탈orbital에 관한 문제가 있다. 특히, 수소 분자에서 전자 하나가 이온화되는 수소 분자 이온은 2개의 원자핵과 1개의 전자를 가지는 전형적인 3체 문제가 된다. 불행히도 이 문제는 앞서 말했듯이 고전역학적으로 카오스 현상이 일어나기 때문에 보어-조머펠트 양자화 조건을 적용하는 것이 근본적으로 불가능하다.

조머펠트는 이 불가능한 문제를 당시 자신의 학생 한 명에게 박사 학위 논문의 주제로 맡긴다. 그 학생은 바로 볼프강 파울리Wolfgang Pauli였다. 알다시피 파울리는 나중에 배타 원리exclusion principle를 발견한 공로로 노벨 물리학상을 받게 되는 대단한 물리학자였지만, 수소 분자 이온 문제를 보어-조머펠트 양자화 조건을 써서 푸는 데에는 실패하게 된다. 이것은 물론 파울리의 실패라기보다는 아직 양자역학이 제대로 정립되지 않았기 때문이었다.

파울리를 괴롭혔던 수소 분자 이온 문제의 해결은 본격적인 양자역학을 필요로 한다. 그리고 알다시피 본격적인 양자역학은 슈뢰딩거 방정식을 통해서 구현된다.

이어지는 섹션에서 우리는 수소 분자 이온 문제를 해결하기 위해서 우선 수소 원자를 양자역학적으로 정확하게 이해하고자 한다.

 

 

수소 원자의 본격적인 양자화

앞서 설명했듯이, 수소 원자는 양자역학을 촉발시킨 가장 중요한 계기였다. 자, 이제 우리는 수소 원자를 본격적으로 양자화하고자 한다. 우리의 당면 목표는 수소 원자를 보어의 양자화 조건을 쓰는 것이 아니라 슈뢰딩거 방정식을 정확히 풀어서 이해하는 것이다.

슈뢰딩거 방정식은 “믿기 힘든 양자 Incredible Quantum [3]: 파동 방정식”에서 유도된 바 있다. 구체적으로 수소 원자를 위한 슈뢰딩거 방정식은 다음과 같다.

\(E\psi({\bf r})=\left(-\frac{\hbar^2}{2\mu}\nabla^2-\frac{e^2}{r}\right)\psi({\bf r})\)

여기서 \(\mu\)는 전자의 환원된 질량reduced mass이고, \(r\)은 원자핵과 전자 사이의 거리이다. 참고로 위 슈뢰딩거 방정식은 에너지 고유값energy eigenvalue \(E\)를 가지는 에너지 고유함수eigenfunction 혹은 고유상태eigenstate가 만족하는 “시간 독립적인 슈뢰딩거 방정식time-independent Schrödinger equation”이다. 위에서 보듯이 최종적인 공식만 놓고 보면 수소 원자를 위한 슈뢰딩거 방정식은 나름 간단하게 보인다. 하지만 언제나 그렇듯이 슈뢰딩거 방정식을 실제로 구체적으로 푸는 것은 그리 쉽지 않다.

우선 기억을 되살려 보면 공간에 대한 두 번 미분인 라플라시안은 다음과 같이 주어진다.

\(\nabla^2=\frac{\partial^2}{\partial x^2}+\frac{\partial^2}{\partial y^2}+\frac{\partial^2}{\partial z^2}\)

위에서 쓰인 라플라시안은 소위 데카르트 좌표Cartesian coordinates인 \(x, y, z\)의 2차 미분 연산자로 표현되었다.

그런데 수소 원자에서와 같이 퍼텐셜 에너지가 전자와 원자핵 사이의 거리에만 의존하는 경우에는 데카르트 좌표 대신에 구면 좌표spherical coordinates를 쓰는 것이 훨씬 더 편리하다. 구면 좌표인 \(r, \theta, \varphi\)는 데카르트 좌표인 \(x, y, z\)와 다음과 같이 연결된다.

\(x=r\sin{\theta}\cos{\varphi}\)

\(y=r\sin{\theta}\sin{\varphi}\)

\(z=r\cos{\theta}\)

위에서 \(r, \theta, \varphi\)는 각각 반지름radius, 편각polar angle, 방위각azimuthal angle이라고 불린다. 직관을 얻기 위해서 [그림5]를 보라.

이제, 여기서 자세한 유도 과정을 보여줄 수는 없지만, 미분의 연쇄 법칙chain rule을 쓰면 구면 좌표계에서 라플라시안을 다음과 같이 다시 표현할 수 있다.

\(\nabla^2=\frac{1}{r^2}\frac{\partial}{\partial r}\left(r^2\frac{\partial}{\partial r}\right)+\frac{1}{r^2\sin{\theta}}\frac{\partial}{\partial \theta}\left(\sin{\theta}\frac{\partial}{\partial \theta}\right)+\frac{1}{r^2\sin^2{\theta}}\frac{\partial^2}{\partial \varphi^2}\)

자, 이제 쉽지 않지만, 다음과 같이 구면 좌표로 표현된 3차원 슈뢰딩거 방정식을 실제로 풀어야 한다. 

\(E\psi({\bf r})=\left\{-\frac{\hbar^2}{2\mu}\left[\frac{1}{r^2}\frac{\partial}{\partial r}\left(r^2\frac{\partial}{\partial r}\right)+\frac{1}{r^2\sin{\theta}}\frac{\partial}{\partial \theta}\left(\sin{\theta}\frac{\partial}{\partial \theta}\right)+\frac{1}{r^2\sin^2{\theta}}\frac{\partial^2}{\partial \varphi^2} \right]-\frac{e^2}{r}\right\}\psi({\bf r})\)

위 공식은 슈뢰딩거 방정식의 복잡성을 제대로 보여준다. 하지만 다행히도 우리는 유능한 선배 물리학자 및 수학자들의 노력으로 인해서 이렇게 복잡한 슈뢰딩거 방정식을 정확하게 푸는 방법을 알고 있다.

우선 마음을 비우고 위에 주어진 3차원 슈뢰딩거 방정식을 자세히 관찰해 보자. 그러다 보면 3차원 슈뢰딩거 방정식을 3개의 1차원 슈뢰딩거 방정식으로 쪼갤 수 있다는 사실을 깨달을 수 있다. 왜 그럴까?

약간 동어반복인 것 같지만, 그 이유는 전체 파동 함수를 구면 좌표계의 각 변수에 독립적으로 의존하는 세 함수들의 곱으로 쓸 수 있기 때문이다.

\(\psi({\bf r})=R(r)P(\theta)Q(\varphi)\)

수학적으로 말해서, 이렇게 여러 변수에 의존하는 함수를 1개의 변수에만 의존하는 함수들의 곱으로 분해하는 것을 “변수 분리separation of variables”라고 부른다. 이제 변수 분리된 파동 함수들은 각각의 변수에 대해서 독립적으로 정상파가 될 수 있다.

이제 구체적으로 각각 변수 분리된 파동 함수들이 만족하는 파동 방정식은 무엇인지 알아보자.

우선 방위각 \(\varphi\)에 의존하는 함수인 \(Q(\varphi)\)는 방위각에 대한 미분 연산자하고만 작용한다.따라서 앞선 슈뢰딩거 방정식에서 방위각에 의존하는 부분만 따로 떼어내어 \(Q(\varphi)\)가 다음과 같은 정상파 조건을 만족한다고 생각해 볼 수 있다.

\(-i\frac{\partial}{\partial\varphi}Q(\varphi)=mQ(\varphi)\)

만약 위 조건을 만족한다면, 슈뢰딩거 방정식에서 미분 연산자 \(-i\partial/\partial \varphi\)는 그냥 숫자인 \(m\)으로 치환될 수 있다. 즉, 슈뢰딩거 방정식은 다음과 같이 다시 쓰일 수 있다.

\(E\psi({\bf r})=\left\{-\frac{\hbar^2}{2\mu}\left[\frac{1}{r^2}\frac{\partial}{\partial r}\left(r^2\frac{\partial}{\partial r}\right)+\frac{1}{r^2\sin{\theta}}\frac{\partial}{\partial \theta}\left(\sin{\theta}\frac{\partial}{\partial \theta}\right)-\frac{m^2}{r^2\sin^2{\theta}} \right]-\frac{e^2}{r}\right\}\psi({\bf r})\)

이제 같은 논리를 편각에 의존하는 부분에 적용하면, 편각 \(\theta\)에 의존하는 함수인 \(P(\theta)\)는 다음과 같은 정상파 조건을 만족한다고 생각해 볼 수 있다.

\(-\left[\frac{1}{\sin{\theta}}\frac{\partial}{\partial \theta}\left(\sin{\theta}\frac{\partial}{\partial \theta}\right)-\frac{m^2}{\sin^2{\theta}} \right]P(\theta)=\lambda P(\theta)\)

만약 위 조건을 만족한다면, 최종적으로 반지름 \(r\)에 의존하는 함수인 \(R(r)\)은 다음과 같은 정상파 조건을 만족하면 된다.

\(\left[-\frac{\hbar^2}{2\mu}\frac{1}{r^2}\frac{\partial}{\partial r}\left(r^2\frac{\partial}{\partial r}\right)+\frac{\hbar^2}{2\mu}\frac{\lambda}{r^2}-\frac{e^2}{r}\right]R(r)= E R(r)\)

 

위에서 \(m, \lambda, E\)는 각각 변수 분리된 파동 방정식에 의해서 결정되는 모종의 고유값eigenvalue들이다. 아래 더 자세히 보겠지만, 이 세 고유값들은 완전히 독립적이지 않고 특정한 조건으로 서로 연결된다. 하지만 어쨌든 이제 슈뢰딩거 방정식은 각각의 구면 좌표에 의존하는 3개의 1차원 미분 방정식으로 분리되었다. 
 

이제 각각 변수 분리된 슈뢰딩거 방정식의 물리적인 의미를 생각해 보자.

위 세 파동 방정식 중에서 첫 번째는 이해하기 쉽다. 왜냐하면 이 파동 방정식은 다름 아니라 보어의 원자 모형이기 때문이다. 즉, 첫 번째 파동 방정식은 원형 궤도에서 파동의 양자화를 기술하는 방정식, 즉 주어진 축에 대한 각운동량이 양자화되는 공명 조건을 주는 방정식이다. 이 사실을 이해하기 위해서 각운동량에 대해서 다시 생각해 보자.

각운동량은 위치 벡터와 운동량 벡터의 외적으로 표현된다.

\({\bf L}={\bf r}\times{\bf p}\)

특히, \(z\) 축을 중심으로 회전하는 운동에 대한 각운동량 \(L_z\)는 다음과 같이 주어진다.

\(L_z=x p_y – y p_x\)

여기서 \(p_x\)와 \(p_y\)는 각각 \(x\)와 \(y\) 방향으로의 운동량이다.

이제 운동량을 공간에 대한 미분 연산자로 치환하면 다음과 같다.

\(L_z=-i\hbar \left(x\frac{\partial}{\partial y}-y\frac{\partial}{\partial x}\right)=-i\hbar\frac{\partial}{\partial\varphi}\)

위에서 맨 마지막 등식은 구면 좌표계의 정의와 미분의 연쇄 법칙을 써서 얻어졌다. 결론적으로 \(L_z\)는 방위각 \(\varphi\)에 대한 미분 연산자이다.

그렇다면, 앞서 기술된 첫 번째 파동 방정식은 \(L_z\)가 양자화되는 조건이다.

\(L_z Q(\varphi)=m\hbar Q(\varphi)\)

여기서 \(m\)은 정수이다. 그런데 \(m\)이 정수가 되는 조건은 다름 아니라 보어의 원자 모형이다! 즉, 각운동량이 양자화되는 조건은 원형 궤도에 국한된 파동이 정상파를 이루는 공명 조건이다. 참고로 \(m\)은 “자기 양자수magnetic quantum number”라고 불린다. 자기 양자수라고 불리는 이유는 자기장을 걸면 서로 다른 \(m\)값을 가지는 정상파들을 구분할 수 있기 때문이다.

참고로 \(Q(\varphi)\)의 수학적인 형태는 오일러의 공식에 의해서 주어진다.

\(Q(\varphi)=e^{im\varphi}\)

두 번째 파동 방정식은, 결론부터 말하면, 전체 각운동량의 제곱, 즉 \({\bf L}^2=L_x^2+L_y^2+L_z^2\)이 양자화되는 공명 조건이다. 각운동량의 양자화는 양자역학에서 가장 중요한 문제 중의 하나이다. 아래 이어지는 섹션에서는 각운동량의 양자화에 대해서 자세하게 이야기해 보고자 한다.

 

 

각운동량의 양자화

여기서 자세한 유도 과정을 보여줄 수는 없지만, 꼼꼼히 잘 계산해 보면 전체 각운동량의 제곱은 구면 좌표계에서 다음과 같이 주어진다.

\({\bf L}^2=L_x^2+L_y^2+L_z^2=-\hbar^2\left[\frac{1}{\sin{\theta}}\frac{\partial}{\partial \theta}\left(\sin{\theta}\frac{\partial}{\partial \theta}\right)-\frac{m^2}{\sin^2{\theta}} \right]\)

위에서 \(L_z^2\)은 앞선 섹션에서 얻은 자기 양자수의 양자화 조건을 써서 \((m\hbar)^2\)으로 치환되었다. 이제 위 공식과 두 번째 파동 방정식을 비교해 보면, 두 번째 파동 방정식이 전체 각운동량의 제곱이 다음과 같이 양자화되는 조건과 정확히 같다는 것을 알 수 있다.

\({\bf L}^2 P(\theta)=\lambda\hbar^2 P(\theta)\)

여기서 질문 하나. 새로운 고유값 \(\lambda\)도 \(m\)처럼 정수일까?

아래 보겠지만, 답은 “그렇다”이다. 하지만 모든 정수 값이 다 허용되는 것은 아니다. 특정한 값만 허용되는 이유는 근본적으로 \(\lambda\hbar^2\)이 전체 각운동량의 제곱, 즉 \({\bf L}^2\)의 고유값이기 때문이다.

그렇다면 혹시 \(\lambda\)는 \(x, y, z\)방향의 각운동량인 \(L_x, L_y, L_z\)의 고유값을 각각 제곱한 후에 다 더한 값이 아닐까?

\(\lambda \stackrel{?}{=} m_x^2+m_y^2+m_z^2\)

여기서 \(m_x, m_y, m_z\)는 각각 \(L_x, L_y, L_z\)의 고유값(엄밀하게는  \(\hbar\)를 곱하면)이다. 앞선 방위각에 대한 양자화 조건에 의하면 \(m_z=m\)이다. 이러한 상황에서 단순하게 생각한다면, \(m_x, m_y\)는 \(m\)에 상관 없는 임의의 정수 값을 가질 수 있을 것이다.

그럴듯하다. 하지만 불행하게도 이 추측은 틀리다.

그 이유는 “믿기 힘든 양자 Incredible Quantum [7]: 두 상태 이야기”에서 설명했듯이, 양자역학적으로 \(L_x, L_y, L_z\)는 서로 독립적이지 않기 때문이다. 다시 말해서, \(L_x, L_y, L_z\)는 다음과 같이 특수한 교환 관계commutation relation를 만족한다.

\([L_x,L_y]=i\hbar L_z\)

\([L_y,L_z]=i\hbar L_x\)

\([L_z,L_x]=i\hbar L_y\)

참고로 여기서 교환자commutator는 다음과 같이 정의된다.

\([A,B]\equiv AB-BA\)

위 교환 관계는 \(L_x, L_y, L_z\)의 고유값을 동시에 결정할 수 없다는 것을 의미한다. 왜 그럴까?

기억을 되살리기 위해서 “믿기 힘든 양자 Incredible Quantum [6]: 양자 삼위일체 2부”로 돌아가 보자. 핵심은 다음과 같다. 2개의 연산자가 서로 교환되지 않으면, 즉 2개의 연산자 사이의 곱의 순서를 바꿀 때 그 결과가 같지 않으면, 해당 연산자들이 의미하는 물리량을 동시에 정확하게 결정할 수 없다. 이것은 다름 아니라 바로 하이젠베르크의 불완전성 원리이다. 결론적으로 독립적으로 결정 가능한 고유값은 해당 연산자들이 서로 교환될 때만 가능하다.

다행히 전체 각운동량의 제곱 \({\bf L}^2\)은 각 방향의 각운동량 연산자, 예를 들어서 \(L_z\)와 교환된다.

\([{\bf L}^2, L_z]=0\)

이제 우리가 해야 할 일은 \(L_z\)의 고유값이 \(m\hbar\)일 때 \({\bf L}^2\)의 고유값 \(\lambda \hbar^2\)이 무엇인지 찾는 일이다. 왠지 복잡한 미분 방정식을 풀어야 할 것 같지만(그리고 실제 그렇게 풀 수도 있지만), 놀랍게도 연산자들 사이의 교환 관계를 잘 이용하면 \({\bf L}^2\)의 고유값 \(\lambda \hbar^2\)을 깔끔하게 구할 수 있다.

그러기 위해서 다음과 같은 새로운 연산자를 정의해 보자.

\(L_+=L_x +iL_y\)

\(L_-=L_x -iL_y\)

아래 금방 보게 될 이유로 인해서 \(L_+, L_-\)는 전체적으로 사다리 연산자ladder operator, 각각 올림 연산자raising operator와 내림 연산자lowering operator라고 불린다.

사다리 연산자의 의미를 이해하기 위해서 올림 및 내림 연산자의 교환 관계를 알아보자. 우선 올림 연산자와 내림 연산자 사이의 교환자는 다음과 같다.

\([L_+, L_-]=2\hbar L_z\)

그 다음으로 \(L_z\)와 \(L_+\) 혹은 \(L_-\) 사이의 교환자는 다음과 같다.

\([L_z, L_+]=\hbar L_+\)

\([L_z, L_-]=-\hbar L_-\)

편의상 위 2 교환자를 하나의 공식으로 표현하면 다음과 같다.

\([L_z, L_\pm]=\pm \hbar L_\pm\)

여기서 \(L_\pm\)는 \(L_+\)와 \(L_-\)를 같이 아우르는 기호이다. 마지막으로 올림 및 내림 연산자는 \({\bf L}^2\)와 교환된다.

\([{\bf L}^2, L_\pm]=0\)

이제, \({\bf L}^2\)의 고유값이 \(\lambda \hbar^2\)이고, \(L_z\)의 고유값(즉, 자기 양자수)이 \(m\hbar\)인 고유상태를 \(|\lambda,m\rangle\)이라고 정의하자. 다시 말해서 \(|\lambda,m\rangle\)은 다음과 같이 정의된다.

\({\bf L}^2|\lambda,m\rangle=\lambda \hbar^2|\lambda,m\rangle\)

\(L_z|\lambda,m\rangle=m\hbar|\lambda,m\rangle\)

우리가 해야 할 일은 \(|\lambda,m\rangle\)에 올림 및 내림 연산자를 작용하면 어떤 일이 벌어지는지 알아보는 것이다. 즉, 우리는 아래 파동 함수가 \(L_z\)에 대해서 고유상태인지, 그리고 그렇다면 어떤 고유값을 가지는지 알아보고자 한다.

\(L_{\pm}|\lambda,m\rangle\)

자, 그러기 위해서 이제 위 파동 함수에 \(L_z\)을 작용해 보자.

\(L_z L_{\pm}|\lambda,m\rangle\)

위 공식은 앞서 구한 교환자를 사용해서 정리하면 다음과 같다.

\(L_z L_{\pm}|\lambda,m\rangle=\left( [L_z, L_\pm]+L_\pm L_z \right) |\lambda,m\rangle=\left( \pm\hbar L_\pm+L_\pm L_z \right) |\lambda,m\rangle =(m\pm 1)\hbar L_\pm |\lambda,m\rangle\)

이것은 \(L_\pm |\lambda,m\rangle\)이 \(L_z\)의 고유상태이며, 고유값이 \((m\pm 1)\hbar\)인 고유상태라는 것을 의미한다.

반면에 \(L_\pm\)는 \({\bf L}^2\)와 교환되므로 \(L_\pm |\lambda,m\rangle\)는 \({\bf L}^2\)에 대해서 변함없이 고유상태일 뿐만 아니라, 고유값도 여전히 \(\lambda\hbar^2\)이 된다. 결론적으로 \(L_\pm\)는 정해진 \({\bf L}^2\)의 고유값을 가지는 고유상태에 대하여 \(L_z\)의 고유값을 올리거나 내리는 연산자이다.

다만, 주어진 \({\bf L}^2\)의 고유값에 대해서 무작정 \(L_z\)의 고유값을 올리거나 내릴 수는 없다. \({\bf L}^2\)는 \(L_z\)를 포함해서 전체 운동량의 제곱이기 때문이다. 즉, \(L_z\)의 고유값에는 최대치와 최소치가 있다.

이제 \(L_z\)의 고유값의 최대치와 최소치를 각각 \(m_{\rm max}\)와 \(m_{\rm min}\)이라고 하자. 그렇다면 그러한 \(L_z\)의 고유값을 가지는 고유상태, 즉 \(|\lambda,m_{\rm max}\rangle\)와 \(|\lambda,m_{\rm min}\rangle\)은 각각 다음과 같은 방정식을 만족해야 한다.

\(L_+|\lambda,m_{\rm max}\rangle=0\)

\(L_-|\lambda,m_{\rm min}\rangle=0\)

위에서 첫 번째 방정식은 \(m_{\rm max}\) 이상으로 \(L_z\)의 고유값을 올릴 수 없다는 것을 의미하고, 두 번째 방정식은 \(m_{\rm min}\) 이하로 \(L_z\)의 고유값을 내릴 수 없다는 것을 의미한다.

이제, 위에서 첫 번째 방정식에 \(L_-\)를 작용해 보자.

\(L_{-}L_{+}|\lambda,m_{\rm max}\rangle=0\)

여기서 \(L_{-}L_{+}\)는 올림 및 내림 연산자의 정의와 그들 사이의 교환 관계를 이용해서 다음과 같이 다시 쓸 수 있다.

\(L_{-}L_{+}=L_x^2+L_y^2-\hbar L_z={\bf L}^2-L_z^2-\hbar L_z\)

위 공식을 첫 번째 방정식에 넣고 정리하면 다음과 같다.

\(\left( {\bf L}^2-L_z^2-\hbar L_z \right) |\lambda,m_{\rm max}\rangle=\left( \lambda-m_{\rm max}^2-m_{\rm max} \right) \hbar^2 |\lambda,m_{\rm max}\rangle=0\)

위 방정식은 다음의 조건이 만족되면 풀린다.

\(\lambda=m_{\rm max}(m_{\rm max}+1)\)

이제, 비슷한 방법으로 두 번째 방정식을 풀면 다음과 같은 조건이 얻어진다.

\(\lambda=m_{\rm min}(m_{\rm min}-1)\)

결과적으로 위 2 조건은 다음을 의미한다.

\(m_{\rm max}=-m_{\rm min}\)

반면에 \(m_{\rm max}\) 상태와 \(m_{\rm min}\) 상태는 올림 및 내림 연산자를 어떤 특정한 수 만큼 작용하면 서로 연결된다. 이것이 의미하는 바는 \(m_{\rm max}\)와 \(m_{\rm min}\)의 차이가 0보다 크거나 같은 어떤 정수라는 것이다. 이 정수를 \(p\)라고 할 때, 우리는 다음과 같은 결론에 이를 수 있다.

\(m_{\rm max}-m_{\rm min}=2m_{\rm max}=-2m_{\rm min}=p\)

이제 편의 상 새로운 양자수 \(l\)을 \(l=p/2\)로 정의하면, 우리는 드디어 결론에 이를 수 있다. 즉, \({\bf L}^2\)의 고유값은 다음과 같이 양자화된다.

\(\lambda=l(l+1)\)

여기서 \(l\)은 “각운동량 양자수angular momentum quantum number”라고 불린다.

참고로 혹시 눈치 빠른 독자는 자기 양자수 \(m\)이 정수이어야 하므로 각운동량 양자수 \(l\)도 정수가 되어야 한다는 생각할 것이다. 하지만 사실 위 연산 과정의 어느 곳에서도 자기 양자수 \(m\)이 정수이어야 한다는 조건은 나오지 않는다. 유일한 조건은 \(p\)가 정수가 되는 것이다. 따라서 원칙적으로 말해서, 파동 함수가 방위각의 함수로 정상파를 만든다는 조건을 살짝 무시한다면, 각운동량 양자수 \(l\)은 정수 외에도 반정수half-integer, 즉 1/2, 3/2, 5/2 등의 값을 가질 수 있다. 과연 그럴 수 있을까?

재미있게도 정말 그럴 수 있다. 아니, 그럴 수 있을 뿐만 아니라 우리는 이미 각운동량 양자수가 반정수인 예를 하나 알고 있다. 그것은 바로 스핀이다. 자세한 내용은 “믿기 힘든 양자 Incredible Quantum [7]: 두 상태 이야기”“믿기 힘든 양자 Incredible Quantum [8]: 위상의 귀환”을 참조하기를 바란다.

지금까지 얻은 결과를 정리해 보자. 각운동량 양자수 \(l\)과 자기 양자수 \(m\)은 특정한 조건으로 서로 연결된다. 구체적으로 \(m\)값은 \(l\)과 \(-l\) 사이에 존재하는 정수 값만을 가질 수 있다.

\(m=-l, -l+1, \cdots, l-1, l\)

각운동량 양자수 \(l\)과 자기 양자수 \(m\)을 고유값으로 가지는 고유함수 \(P(\theta)\)의 구체적인 형태는 여기서 적지 않기로 한다. 그 형태가 복잡하기도 하거니와 이름도 생경한 소위 “특수 함수special function” 중 하나로 표현되기 때문이다. 다만, 참고를 위해서 언급하자면, 이 특수 함수의 이름은 “르장드르 다항식Legendre polynomial”이다. 수학적인 기호로 \(P(\theta)\)는 보통 다음과 같이 표시한다.

\(P(\theta)=P_l^m(\cos{\theta})\)

위 공식에서 알 수 있듯이 르장드르 다항식은 일반적으로 2개의 양자수 \(l\)과 \(m\)에 모두 의존한다.

이제 편의상 위에서 구한 \(P(\theta)\)와 \(Q(\varphi)\)를 곱해서 하나의 함수로 묶어 보자. 다시 말해서, 각각 서로 다른 각도 방향으로 공명 조건을 만족하는 2개의 파동 함수를 다음과 같이 하나로 묶을 수 있다.

\(Y_{lm}(\theta,\varphi)=P_l^m(\cos{\theta})Q(\varphi)\)

이 파동 함수는 구면 위에서 출렁거리는 정상파를 기술하는 파동 함수이다. 매우 유명한 이 파동 함수의 이름은 바로 구면 조화 함수spherical harmonics이다.


 

[그림6]은 구면 조화 함수의 실수 성분을 시각적으로 보여 준다. 우리는 구면 조화 함수를 통해서 구면 위에서 정상파가 출렁거리는 모습을 상상할 수 있다. 구체적으로 [그림6]에서 중심축을 따라서 아래로 내려가는 것은 \(m=0\)으로 고정된 상태에서 \(l\)의 크기가 커지는 것에 해당한다. 이때 구면 조화 함수는 편각 \(\theta\) 방향으로 더 많이 출렁거린다. 반면에 [그림6]에서 중심축을 기준으로 좌우로 이동하면 \(l\)의 크기가 고정된 상황에서 \(m\)의 절대값의 크기가 커지는 것에 해당한다. 이때 구면 조화 함수는 편각 방향으로의 출렁거림은 줄어드는 대신에 방위각 \(\varphi\) 방향으로의 출렁거림이 증가하게 된다.

결론적으로 각운동량 양자수 \(l\)이 커지면 전체적으로 구면 정상파가 출렁거리는 정도가 증가하고, 자기 양자수 \(m\)이 커지면 방위각 \(\varphi\) 방향으로의 출렁거림이 증가한다고 볼 수 있다. 역사적인 이유에서 구면 정상파는 각운동량 양자수에 따라서 각자 구분되는 이름을 가지고 있다. 구체적으로 \(l=0, 1, 2, 3\)인 구면 정상파는 각각 \(s, p, d, f\) 파동이라고 불린다.

지금까지 우리는 각도 방향에 관한 파동 방정식에 대해서 논의했다. 이어지는 섹션에서 우리는 마지막 세 번째 파동 방정식, 즉 반지름 변수에 관한 파동 방정식에 대해서 논의하고자 한다. 아래 보겠지만 최종적으로 이 파동 방정식이 바로 수소 원자의 에너지 준위를 결정한다.

 

 

주 양자수

우선 앞서 설명한 바와 같이 각운동량 양자수는 \(\lambda=l(l+1)\)로 양자화된다. 이 양자화 조건을 사용해서 변수 분리된 세 번째 파동 방정식을 다시 쓰면 다음과 같다.

\(\left[-\frac{\hbar^2}{2\mu}\frac{1}{r^2}\frac{\partial}{\partial r}\left(r^2\frac{\partial}{\partial r}\right)+\frac{l(l+1)\hbar^2}{2\mu r^2}-\frac{e^2}{r}\right]R(r)= E R(r)\)

이제 간단한 수학적인 요령을 이용해서 위 파동 방정식을 조금 더 편리한 형태로 바꾸어 보자. 다시 말해서, 파동 함수 \(R(r)\)을 다음과 같이 표현해 보자.

\(R(r)=\frac{u(r)}{r}\)

이제 \(u(r)\)이 만족하는 미분 방정식은 다음과 같다.

\(\left[ -\frac{\hbar^2}{2\mu}\frac{\partial^2}{\partial r^2}+\frac{l(l+1)\hbar^2}{2\mu r^2} -\frac{e^2}{r}\right] u(r)=E u(r)\)

위 슈뢰딩거 방정식은 기본적으로 반지름을 변수로 가지는 1차원 공간에서 출렁거리는 파동을 기술하는 슈뢰딩거 방정식이다. 특히, 위 슈뢰딩거 방정식은 다음과 같이 정리해 볼 수 있다.

\(\left[ -\frac{\hbar^2}{2\mu}\frac{\partial^2}{\partial r^2}+V_{\rm eff}(r)\right] u(r)=E u(r)\)

위 슈뢰딩거 방정식은 매우 직관적인 형태의 “유효 퍼텐셜 에너지effective potential energy” \(V_{\rm eff}(r)\)을 가지고 있다.

\(V_{\rm eff}(r)=\frac{l(l+1)\hbar^2}{2\mu r^2}-\frac{e^2}{r}\)

위 공식에서 첫 번째 항은 원심력centrifugal force에 의한 퍼텐셜 에너지이고, 두 번째 항은 쿨롱 상호작용Coulomb interaction에 의한 퍼텐셜 에너지이다. 편의상, 위 파동 방정식을 유효 슈뢰딩거 방정식, \(u(r)\)을 유효 파동 함수라고 부르기로 하자. 결론적으로 우리의 과제는 반지름의 함수로 주어지는 1차원 유효 슈뢰딩거 방정식을 푸는 것이다. 그리고 그렇게 할 수 있다면 드디어 원하던 수소 원자의 에너지 고유값 \(E\)를 찾을 수 있게 된다.

[그림7]은 전형적인 유효 퍼텐셜 에너지와 그로 인해서 발생할 수 있는 가장 낮은 에너지 고유상태를 보여준다. 직관적으로 말해서, 반지름의 함수로서 에너지 고유상태는 1차원 유효 퍼텐셜 우물에 갇혀서 출렁거리는 파동이라고 생각할 수 있다. 이 상황에서 가장 낮은 에너지 고유상태는 유효 퍼텐셜 우물에 갇힌 파동 중에서 가장 최소한으로 출렁거리는 정상파이다.

이제 구체적으로 반지름의 함수로 주어지는 유효 슈뢰딩거 방정식을 풀어 보자. 그러기 위해서는 유효 파동 함수 \(u(r)\)이 어떠한 함수 형태를 지닐지 추측해 보는 것이 편리하다.

우선 반지름 \(r\)이 굉장히 커지는 극한을 생각해 보자. 이 경우에는 퍼텐셜 에너지를 (거의) 완전히 무시할 수 있을 것이다. 그렇다면 유효 슈뢰딩거 방정식은 다음과 같이 근사할 수 있다.

\(-\frac{\hbar^2}{2\mu}\frac{\partial^2}{\partial r^2}u(r) \approx Eu(r)\)

참고로 우리는 수소 원자에 전자가 묶여 있는 상태, 즉 속박 상태bound state에 관심이 있다. 따라서 에너지 고유값 \(E\)는 음수가 되어야 한다. 이 경우에 유효 파동 함수는 다음과 같이 주어진다.

\(u(r) \approx e^{-\kappa r}\)

여기서 \(\kappa=\sqrt{2\mu|E|/\hbar^2}\)이다. (힌트: 지수 함수는 미분값이 자기자신에 비례한다.)

이제 반대로 반지름 \(r\)이 굉장히 작아지는 극한을 생각해 보자. 이 경우에는 유효 슈뢰딩거 방정식을 다음과 같이 근사할 수 있다.

\(\left[ -\frac{\partial^2}{\partial r^2} +\frac{l(l+1)}{r^2}\right] u(r) \approx 0\)

(힌트: 반지름 \(r\)이 굉장히 작아지면 원심력에 의한 퍼텐셜 에너지가 쿨롱 퍼텐셜 에너지나 상수인 에너지 고유값보다 매우 커지게 된다.) 곰곰이 잘 생각해 보면 위 방정식을 만족하는 유효 파동 함수는 다음과 같이 주어진다는 것을 알 수 있다.

\(u(r) \approx r^{l+1}\)

(참고로 반지름 \(r\)이 굉장히 작아질 때 파동 함수의 형태는 에너지 고유값에 의존하지 않는다. 이것이 의미하는 바는 에너지 고유값의 양자화는 반지름 \(r\)이 굉장히 커지는 극한의 성질에 따라서 결정된다는 것이다.)

최종적인 유효 파동 함수는 위 2 극한을 잘 연결하는 함수일 것이다. 그러한 함수로 우리는 다음과 같은 추측을 해 볼 수 있다.

\(u(r)=e^{-\rho}\rho^{l+1}(C_0+C_1\rho+C_2\rho^2+\cdots)=e^{-\rho}\rho^{l+1}\sum_k C_k \rho^k\)

여기서 \(\rho=\kappa r\)이다. (퀴즈: 위 추측이 그럴싸한 이유를 생각해 보자.) 이제 우리가 해야 할 일은 파동 함수를 전개하는 수열의 계수 \(C_k\)를 찾는 것이다.

그러기 위해서 위에서 추측한, 소위 시도 파동 함수trial wave function를 원래 유효 슈뢰딩거 방정식에 넣어보자. 꼼꼼히 잘 정리해 보면 우리는 수열의 계수가 다음과 같은 점화식recurrence relation을 만족한다는 사실을 발견할 수 있다.

\(\frac{C_{k+1}}{C_k}=\frac{2(k+l+1)-e^2 X}{(k+l+2)(k+l+1)-l(l+1)}\)

여기서 \(X\)는 다음과 같이 정의된다.

\(X=\sqrt{\frac{2\mu}{\hbar^2|E|}}\)

그런데 위 수열은 계속 무한대로 이어지면 안 된다. 왜 그럴까?

그 이유는 다음과 같다. 우선 만약 수열이 계속 무한대로 이어진다면 충분히 큰 에 대해서 점화식은 다음과 같이 근사될 수 있다.

\(\frac{C_{k+1}}{C_k} \approx \frac{2}{k}\)

그런데 이것은 수열이 다음과 같이 \(\rho\)가 커질 때 지수함수적으로 발산한다는 것을 의미한다.

\(\sum_k C_k \rho^k \approx \sum_k \frac{2^k}{k!} \rho^k =e^{2\rho}\)

파동 함수는 발산하면 안 된다. 따라서 발산을 막아야 한다. 다시 말해서, 수열이 계속 무한대로 이어지면 안 된다. 그러기 위해서는 수열의 고리가 끊어져야 한다.

수열의 고리가 끊어지기 위해서는 어떤 \(k\)단계에서 계수 \(C_k\)가 0이 되면 된다. 즉, 앞선 점화식에서 분자가 0이 되면 된다.

\(2(k+l+1)-e^2 X=0\)

이것은 결국 에너지 고유값이 다음과 같이 결정된다는 것을 의미한다.

\(E=-|E|=-\frac{\mu e^4}{2\hbar^2}\frac{1}{(k+l+1)^2}\)

여기서 새로운 양자수 \(n\)을 다음과 같이 정의하자.

\(n=k+l+1\)

참고로 \(n\)은 “주 양자수principal quantum number”라고 불린다. 그렇다면 에너지 고유값은 최종적으로 다음과 같이 주어진다.

\(E=-\frac{R_y}{n^2}\)

여기서 \(R_y=\mu e^4/2\hbar^2\)는 “믿기 힘든 양자 Incredible Quantum [7]: 두 상태 이야기”에서 언급된 적이 있는 뤼드베리 에너지 단위Rydberg unit of energy이다. 이미 예상했겠지만, 위 공식은 보어의 원자 모형을 써서 구한 공식과 정확히 일치한다!

참고로 주 양자수 \(n\)과 각운동량 양자수 \(l\)은 이전에 각운동량 양자수와 자기 양자수가 연결되듯이 특정한 조건으로 연결된다. 즉, 각운동량 양자수 \(l\)은 주 양자수 \(n\)보다 항상 작아야 한다. 

\(l=n-k-1=0, 1, \cdots, n-2, n-1\)

(힌트: \(k\)는 항상 0보다 커야 한다.)

여기서 반지름의 함수로 에너지 고유상태를 기술하는 파동 함수 \(u(r)\)의 구체적인 형태는 적지 않을 것이다. 앞선 편각 방향의 파동 함수와 비슷하게 또 다른 “특수 함수special function”로 표현되기 때문이다. 참고로 이 특수 함수의 이름은 “라게르 다항식Laguerre polynomial”이다.

드디어 우리는 수소 원자의 에너지 준위를 구했다. 앞서 언급했듯이, 슈뢰딩거 방정식을 꼼꼼히 풀어서 얻은 결과는 보어의 원자 모형이 말해주는 결과와 정확히 일치한다.

그런데 잠깐! 무엇인가 이상하지 않은가?

보어의 원자 모형에서 수소 원자의 에너지 준위는 특정한 축, 예를 들어서 \(z\)축을 중심으로 하는 각운동량이 양자화되는 조건, 즉 자기 양자수가 양자화되는 조건을 통해서 얻어졌다. 그런데 에너지 준위를 결정하는 양자수는 자기 양자수가 아니라 주 양자수이다. 직접적으로 상관이 없는 두 양자수가 우연히 같은 결과를 가져온 것이다. 참으로 묘한 우연의 일치에 의해서 보어의 원자 모형은 정확한 답을 가져올 수 있었던 것이다!

역사적으로 보면 보어의 원자 모형이 성공했기 때문에 많은 물리학자들은 양자 이론이 맞아야 한다고 믿었다. 그리고 이러한 믿음은 결국 본격적인 양자역학을 만들어 낼 수 있었다. 그런데 보어의 원자 모형은 최종적으로 완성된 양자역학의 입장에서 보면 정확하게 맞을 이유가 전혀 없었다. 그저 우연히 딱 맞아떨어진 것뿐이다. 과학의 발전은 이렇듯 오묘하다…

오묘한 여운을 뒤로하고, 이제 다시 수소 원자의 에너지 준위에 대한 논의로 다시 돌아가 보자.

여러 정상파 중에서 에너지가 가장 낮은 상태, 즉 바닥 상태ground state는 특히 중요하다. 수소 원자의 바닥 상태를 기술하는 파동 함수는 다음과 같이 주어진다.

\(\psi_{\rm gr}=\frac{1}{\sqrt{\pi a_0^3}}e^{-r/a_0}\)

여기서 \(a_0=\hbar^2/\mu e^2\)은 보어 반지름Bohr radius라고 불린다. 다시 말해서 수소 원자의 바닥 상태는 주 양자수가 1, 각운동량 양자수가 0, 자기 양자수가 0이라는 양자수를 가지는 에너지 고유상태이다. 위 공식을 통해서 알 수 있듯이 바닥 상태의 파동 함수는 편각과 방위각에 전혀 의존하지 않으며, 반지름의 함수로 지수 함수이다. 따라서 전자를 발견할 확률은 모든 각도 방향으로 균질하며, 원자핵으로부터 멀어질수록 지수 함수적으로 감소한다.

지수 함수는 출렁거림 없이 단조 감소하는 함수이다. 따라서 바닥 상태는 모든 각도와 반지름의 함수로 최소한의 출렁거림을 가지는 상태이다. 이러한 바닥 상태에 여분의 출렁거림이 더해지면 들뜸 상태excited state가 얻어진다. 직관적으로 말해서, 파동 함수의 출렁거림이 많아질수록 에너지가 높아진다.

지금까지 우리는 수소 원자의 전자 구조에 관해서 심도있게 알아보았다. 수소 원자에 대해서 심도있게 알아본 이유는 다른 원자들의 경우에도 그것들의 전자 구조를 기본적으로 수소 원자의 예를 통해서 이해할 수 있기 때문이다.

구체적으로 수소와 다른 원자들 사이의 가장 큰 차이점은 원자핵의 전하량 \(Ze\)이다. 원자수atomic number라고 불리는 \(Z\)는 원자핵 내 양성자의 개수를 나타낸다. 이러한 원자핵의 전하량의 차이로 인해서 개별 전자는 더 강하게 전자핵으로 이끌린다. 이러한 상황에서 에너지 준위는 수소의 에너지 준위에 원자핵의 전하량 부분을 적절하게 보정해 주면 된다.

하지만 이야기가 이렇게 쉽게 끝나지는 않는다. 전하량이 큰 원자핵을 가지는 원자는 전체 전하를 중성으로 맞추기 위해서 더 많은 수의 전자를 가지고 있다. 따라서 우리는 전자 사이에 존재하는 상호작용을 고려해야 한다.

그러기 위해서 가장 우선적으로 알아야 할 중요한 원리가 있다. 이 원리의 이름은 파울리의 배타 원리Pauli’s exclusion principle이다.

 

 

파울리의 배타 원리

모든 전자들은 정확하게 동일하다. 그 어떤 방법을 쓰더라도 개별적인 전자들은 서로 구별할 수 없다. 이 사실은 전자뿐만 아니라 모든 근본적인 입자에도 마찬가지로 적용된다. 이렇게 구별할 수 없는 입자들이 여럿 존재하는 상황을 기술하는 파동 함수는 그 형태에 모종의 제한이 가해진다. 이 제한은 입자의 “통계statistics”라고 불린다.

구체적으로 \(N\)개의 구별 불가능한indistinguishable 입자들로 이루어진 시스템의 파동 함수를 생각해 보자.

\(\Psi({\bf r}_1, {\bf r}_2, \cdots, {\bf r}_N)\)

여기서 \({\bf r}_1, {\bf r}_2, \cdots, {\bf r}_N\)은 각각 1, 2, …, \(N\)번 전자의 위치를 나타내는 벡터이다. 물론 앞에서 말했듯이 이렇게 개별적인 입자들을 구별하는 것은 의미가 없다. 따라서 예를 들어서 1번과 2번 전자의 위치를 바꾸어도 파동 함수는 물리적으로 바뀌면 안 된다.

파동 함수가 물리적으로 바뀌지 않는다는 것은 무슨 의미인가? “믿기 힘든 양자 Incredible Quantum [4]: 게이지 대칭성”에서 설명했듯이, 물리적으로 의미 있는 확률은 파동 함수의 절대값의 제곱에 의해서 주어진다. 그런데 확률은 파동 함수에 임의의 위상 인자를 곱해도 전혀 변하지 않는다. 따라서 1번과 2번 전자의 위치를 바꾸기 전과 후에 파동 함수는, 물리적으로 완벽히 동일한 상황을 기술하기 위해서, 최대한 위상 인자의 차이만 있어야 한다. 즉, 위상 인자 말고는 아무것도 차이 나면 안 된다.

\(\Psi({\bf r}_2, {\bf r}_1, \cdots, {\bf r}_N)=e^{i\theta}\Psi({\bf r}_1, {\bf r}_2, \cdots, {\bf r}_N)\)

물론 이 상황에서 입자 교환으로 인한 위상 \(\theta\)는 일반적으로 모든 입자들의 위치에 의존하는 매우 복잡한 함수일 수 있다.

하지만 자연은 우리에게 가장 단순한 두 경우만 허용한다. 즉, 우주의 모든 입자는 입자 교환으로 인한 위상 인자가 \(+1\)이든지 \(-1\)이든지, 두 경우 중의 하나에만 속하게 된다. 입자 교환으로 인한 위상 인자가 \(+1\)인 입자를 보존boson이라고 부르고, \(-1\)인 입자를 페르미온fermion이라고 부른다. 예를 들어 광자는 보존이고 전자는 페르미온이다.

참고로 입자 교환으로 인해서 발생하는 위상 인자가 \(\pm 1\)이 아니라 임의의 복소수 인자가 되는 경우를 이론적으로 상상해 볼 수 있다. 아직까지 실험적으로 엄밀하게 증명되지는 않았지만, 이러한 특별한 통계는 2차원에서 가능할 수 있다. 이러한 통계를 따르는 입자를 “애니온anyon”이라고 부른다.

이제 다시 본론으로 돌아가서, 페르미온인 전자는 소위 페르미-디랙 통계를 만족한다. 즉, 두 전자의 위치를 교환하면 파동 함수에 \(-1\)이 붙는다.

\(\Psi({\bf r}_2, {\bf r}_1, \cdots, {\bf r}_N)=-\Psi({\bf r}_1, {\bf r}_2, \cdots, {\bf r}_N)\)

이 조건 하에서 1번과 2번 전자의 위치가 같아진다고 하자. 즉, \({\bf r}_1={\bf r}_2\)이 된다고 하자. 그러면 위 조건은 파동 함수가 0이 된다는 것을 의미한다. 다시 말해서, 두 개 이상의 구별 불가능한 전자는 같은 위치에 존재할 수 없다. 이것이 파울리의 배타 원리이다.

사실 위치가 꼭 중요한 것은 아니다. 이제 독자들이 잘 알고 있듯이 어차피 입자는 한 점에 위치하지 않고 공간에 퍼져있다. 따라서 입자를 교환한다는 것은 꼭 위치뿐만 아니라 입자의 상태를 구별할 수 있는 그 어떤 물리량이라도 모두 교환한다는 것을 의미한다. 결론적으로 파울리의 배타 원리가 말해주는 바는 관찰 가능한 모든 물리량에 의해서 규정되는 하나의 “양자 상태”에 두 개 이상의 페르미온이 같이 존재할 수 없다는 것이다.

그렇다면 위치 외에 관찰 가능한 물리량에는 무엇이 있을까?

“믿기 힘든 양자 Incredible Quantum [7]: 두 상태 이야기”에서 설명했듯이 전자는 위치에 의해서 규정되는 소위 궤도 자유도orbital degree of freedom에 덧붙여 스핀spin이라고 부르는 내부 자유도internal degree of freedom를 가진다. 따라서 앞에서 1번과 2번 전자를 교환한다고 했을 때, 사실은 그것들의 위치뿐만 아니라 스핀 상태까지 같이 교환해야 한다. 이렇게 궤도와 스핀 양자 상태를 모두 교환할 때 비로소 파울리의 배타 원리를 만족한다.

정리해 보자. 전자는 페르미온이다. 여러 전자들로 이루어진 시스템을 기술하는 파동 함수는 파울리의 배타 원리를 만족해야 한다. 만약 파울리의 배타 원리를 제외하고 전자 사이에 존재하는 상호작용의 효과를 완전히 무시할 수 있다면, 이제 우리는 일반적인 원자 속 전자 구조를 이해할 수 있다. 우선 일반적인 원자의 에너지 준위는 수소 원자의 에너지 준위로부터 원자핵의 전하량을 적절하게 보정해서 얻어진다. 이렇게 얻어진 각 에너지 준위는 바닥 상태부터 전자가 소진되는 들뜸 상태까지 스핀 업과 다운을 지니는 2개의 전자로 차곡차곡 채워진다.  

위에서 기술한 상황은 많은 종류의 원자의 경우에 꽤 잘 들어맞는다. 물론 전자 사이에 존재하는 상호작용의 효과를 무작정 계속 무시할 수는 없다. 원자핵의 전하량이 커지면 커질수록 원자의 전자 구조는 점점 더 복잡해지고, 이는 결국 원자 자체의 불안전성으로 이어지게 된다. 여기서는 지면 관계상 이 문제에 대해서 더 이상 깊게 들어가지 않기로 한다.

대신 이어지는 섹션에서는 고체와 같은 응집물질condensed matter을 만들기 위해서 원자들이 어떻게 결합되는지 알아보고자 한다.  

 

 

원자 결합: 수소 분자 이온에서 고체까지

원자들은 어떻게 결합하는가?

원자들이 어떻게 결합하는지 이해하기 위해서 앞서 언급한 파울리를 괴롭혔던 수소 분자 이온 문제로 돌아가 보자. 기억을 되살려 보면, 수소 원자 이온이란 2개의 양성자와 1개의 전자로 이루어진 3체 문제이다. 편의상, 양성자는 전자에 비해서 매우 무거우므로 자체적인 움직임이 없는 정지된 입자로 생각할 수 있다.

이러한 상황에서 우리의 과제는 두 양성자가 어떤 특정한 거리 \(R\)을 두고 떨어져 있을 때 전자의 고유상태와 그것의 에너지 고유값을 찾는 것이다. 수소 분자 이온이 형성되기 위해서는, \(R\)의 함수로 결정되는 전자의 에너지 고유값이 두 양성자가 서로 밀어내는 쿨롱 에너지 \(e^2/R\)을 극복할 수 있어야 한다. 즉, 전자의 에너지 고유값과 두 양성자 사이의 쿨롱 에너지의 합으로 주어지는 전체 에너지가 0보다 작아야 한다.

두 양성자 사이의 거리 \(R\)을 임의로 바꾸어 가면서 전자의 고유상태를 찾는 것은 원리적으로 가능하다. 하지만 구체적으로 그러한 계산을 수행하는 것은 쉽지 않다. 대신 여기서는 문제를 간단하게 만들기 위해서 \(R\)이 충분히 큰 상황에 집중하기로 하자. 이 상황에서 전자는 대략적으로 두 수소 원자의 바닥 상태 사이를 왔다 갔다 뛰어다닌다고 근사할 수 있다.

다시 말해서, 수소 분자 이온 문제는 두 양성자가 만들어 내는 일종의 “이중 우물 퍼텐셜double well potential”에 갇힌 전자의 문제가 된다. 기억을 되살려보면, 1차원 이중 우물 퍼텐셜 문제는 “믿기 힘든 양자 Incredible Quantum [7]: 두 상태 이야기”에서 다루었다. 수소 분자 이온 문제는 1차원은 아니지만 기본적으로 같은 문제이다. 직관을 얻기 위해서 3차원 퍼텐셜 에너지를 2차원으로 투영해서 표현하면, 수소 분자 이온 문제에서 나타나는 이중 우물 퍼텐셜 에너지는 [그림8]과 같이 묘사된다.

구체적으로 전자가 왼쪽과 오른쪽 양성자에 묶여 있는 파동 함수를 각각 \(\psi_L({\bf r})\)과 \(\psi_R({\bf r})\)이라고 할 때, 최종적인 파동 함수는 2개의 파동 함수의 중첩 상태가 된다.      

\(\psi_\pm({\bf r})=\frac{1}{\sqrt{2}}(\psi_L({\bf r})\pm\psi_R({\bf r}))\)

여기서 \(\psi_L({\bf r})\)과 \(\psi_R({\bf r})\)은 예를 들어서 앞선 섹션에서 얻은 수소 원자 속 전자의 고유상태 중에서 바닥 상태를 기술하는 파동 함수 \(\psi_{\rm gr}\)이라고 할 수 있다. 참고로 위에서 \(\psi_L({\bf r})\)과 \(\psi_R({\bf r})\) 사이의 부호가 양이 되는 \(\psi_+({\bf r})\)는 “결합 상태bonding state,” 음이 되는 \(\psi_-({\bf r})\)는 “반결합 상태anti-bonding state”라고 불린다.

여기서 구체적인 수치를 제시하지는 않겠지만, 실제로 계산해 보면 위 두 상태 중에서 에너지가 낮은 결합 상태의 에너지 고유값은 두 양성자 사이의 쿨롱 에너지를 극복하고 전체 에너지의 최소값을 0보다 작게 만들 수 있다. 결론적으로 전자는 결합 상태에서 두 양성자를 붙이는 접착제의 역할을 할 수 있게 된다.

자, 이제 수소의 원자핵, 즉 양성자를 단지 2개가 아니라 계속해서 차곡차곡 붙이는 상황을 생각해 보자. 다시 말해서, 이제 우리는 수소 분자 이온 문제를 일반적인 고체 문제로 확장하고자 한다. 사실 이 문제는 “믿기 힘든 양자 Incredible Quantum [10]: 더 높은 차원으로”에서 자세하게 다루었다. 즉, 이중 우물 퍼텐셜 문제라는 두 상태 문제에서 격자 문제라는 많은 상태 문제로 차원을 올리고자 한다.

그때 배우기를, 주기적으로 반복되는 격자 구조 위에서 운동하는 전자는 블로흐 파동Bloch wave의 형태로 격자 속을 자유롭게 뛰어다닐 수 있다. 특히, 블로흐 파동은 그것의 운동 에너지가 단순히 운동량의 제곱에 비례하는 것이 아니라, 격자 구조에 따라서 다양하고 복잡한 관계를 가질 수 있다. 전문적으로, 운동 에너지와 운동량의 관계를 분산 관계dispersion relation라고 부른다. 예를 들어서 “믿기 힘든 양자 Incredible Quantum [10]: 더 높은 차원으로”에서 배운 바와 같이, 벌집 격자honeycomb lattice를 이루는 그래핀은 질량이 없는 “상대론적인” 분산 관계를 가질 수 있다.

그런데 사실 되돌아보면 그때 우리가 진지하게 고민해 보지 않은 질문이 하나 있다.

“과연 애초에 격자 구조는 어떻게 생길 수 있는가?”

즉, 원자핵들은 서로 같은 부호의 전하를 가지기 때문에 서로 밀어낼 것이다. 따라서 원자핵들이 격자 구조로 묶이기 위해서는 모종의 접착제가 필요하다.

이제 우리는 이 질문에 대해서 답을 알고 있다. 답은 전자들이 블로흐 파동의 형태로 원자핵들로 이루어진 격자 위를 자유롭게 뛰어다님과 동시에 원자핵들을 묶어주는 접착제의 역할을 한다는 것이다. 전문적으로 이러한 원자 결합 메커니즘을 “금속 결합metallic bonding”라고 한다. 참고로 수소는 높은 압력 하에서 실제로 금속이 될 수 있다!

사실 금속 결합은 여러 다양한 원자 결합 메커니즘 중의 하나이다. 원자 결합 메커니즘은 원하는 만큼 다양하게 구분해 볼 수도 있겠지만 크게 3가지로 나누어 볼 수 있다. 즉, 위에서 이야기한 금속 결합 외에 공유 결합covalent bonding과 이온 결합ionic bonding이 있다. 공유 결합과 이온 결합은 다양한 분자의 형성에 매우 중요한 역할을 하지만 여기서는 지면 관계상 더 이상 자세하게 논의하지 않기로 한다.

다시 본 논의로 돌아가 보자. 앞서 우리는 논의의 편의상 전자들이 각각의 원자핵에 묶일 때 바닥 상태에 있다고 가정했다. 하지만 전자들이 꼭 바닥 상태에만 있을 필요는 없다. 다시 말해서, 전자들은 들뜸 상태excited state에 있을 수 있고, 이러한 들뜸 상태를 통해서도 블로흐 파동이 형성될 수 있다. 그리고 이렇게 들뜸 상태를 통해서 형성되는 블로흐 파동은 바닥 상태를 통해서 형성되는 블로흐 파동과는 서로 다른 에너지 범위에서 분산 관계를 가진다. 즉, 들뜸 상태와 바닥 상태를 통해서 형성되는 블로흐 파동은 같은 운동량에 대해서 서로 다른 범위에 속하는 에너지 구간, 즉 “에너지 띠energy band”를 구성하게 된다.

만약 파울리의 배타 원리 외에 전자 사이에 존재하는 상호작용을 완전히 무시할 수 있다면, 이제 우리는 일반적인 고체 속 전자 구조를 이해할 수 있다. 즉, 전자들은 마치 전하량이 큰 원자에서 그랬던 것처럼 운동 에너지가 낮은 상태로부터 높은 상태로 각각의 에너지 띠를 차곡차곡 스핀 업과 다운으로 채워 올라갈 것이다. 전문적으로, 이와 같은 상태를 마치 바닷물처럼 전자들이 운동량 공간을 채운다는 비유를 써서 “페르미 바다Fermi sea” 혹은 “페르미 액체Fermi liquid”라고 부른다. 결론적으로 고체(특히 금속)란 규칙적으로 반복되는 원자핵의 격자 구조 위에서 전자들이 페르미 바다를 이루고 이를 통해서 원자핵들이 결합됨으로써 형성된다.  

이것으로 고체에 관한 우리의 이야기는 끝나는 것인가? 아니다. 아직 중대한 문제가 하나 남아있다.

우리는 페르미 바다의 형성에 있어서 전자 사이에 존재하는 상호작용을 완전히 무시했다. 이것은 타당한 가정인가?

 

 

페르미 액체

앞서 우리는 다음과 같은 질문을 했다.

“페르미 바다에서 전자 사이에 존재하는 상호작용은 무시될 수 있는가?”

답은 “거의 그렇다”이다. 왜 그럴까?

우선 페르미 바다의 깊숙한 밑바닥에 자리 잡은 전자들은 아무리 쿨롱 상호작용이 있더라도 거의 변화가 없다. 움직일 수 있는 운동량 공간에 여유가 없기 때문이다. 즉, 페르미 바다의 깊숙한 밑바닥에 있는 운동량 상태들은 이미 전자들로 꽉 채워져 있다. 파울리의 배타 원리에 의하면 이미 채워져 있는 상태에는 다른 전자가 들어갈 수 없다. 따라서 쿨롱 상호작용이 있을 때 생길 수 있는 변화는 페르미 바다의 표면 근처에서만 가능하다.

이제 페르미 바다의 표면에서 무슨 일이 생기는지 생각해 보자. 우선 페르미 바다의 표면에 주어진 전자가 하나 있다고 하자. 이 전자는 그 주변의 다른 전자를 페르미 바다의 바깥, 즉 운동 에너지가 약간 더 높은 상태로 쳐 낼 수 있다. 대신 내쳐진 전자가 원래 있던 운동량 상태는 비게 된다. 결론적으로 주어진 전자는 페르미 바다의 속에 빈 공간을 하나 만들고, 바깥에 전자를 하나 만듦으로써 들뜸 상태를 일으킬 수 있다. 참고로 페르미 바다 속에 생긴 빈 공간을 정공hole이라고 부른다.

이렇게 만들어진 페르미 바다 속의 정공과 바깥의 전자는 마치 거품bubble처럼 생겼다 없어지기를 반복하면서 애초에 들뜸 상태를 일으킨 전자를 따라 다니게 된다. 실제로 전자와 정공이 만드는 쌍을 전문적으로 “전자-정공 거품electron-hole bubble”이라고 부른다.

그런데 이 전자-정공 거품은 마치 쌍극자dipole와 같아서 애초에 자신을 만들어낸 전자를 둘러싸려고 한다. 그리고 이렇게 전자가 쌍극자들의 거품으로 둘러싸이게 되면 멀리서 볼 때 전자의 전하는 완전히 가려져서 없어진 것처럼 보이게 된다. 결과적으로, 멀리 떨어진 전자들은 상대방을 서로 전하가 전혀 없는 중성의 입자인 것처럼 “착각”하게 된다. 다시 말해서, 전자 사이의 쿨롱 상호작용은 사라지고, 페르미 바다, 즉 페르미 액체는 안정화된다.

사실 페르미 액체가 안정화된다는 사실은 응용적인 측면에서도 매우 중요하다. 왜냐하면 기본적으로 반도체 공학 전체가 고체 속 전자들이 페르미 액체를 구성한다는 사실에 기반을 두고 있기 때문이다.

물론 페르미 액체가 항상 안정되는 것은 아니다. 전자 사이의 상호작용이 무지막지하게 커지는 극한의 상황에서는 페르미 액체도 붕괴될 수 있다. 예를 들어서 페르미 액체는 물이 얼음으로 얼 듯이 고체로 얼 수 있다. 다시 말해서, 전자도 얼 수 있다! 이러한 전자 얼음을 처음 그 아이디어를 제시한 물리학자인 유진 위그너Eugene Wigner의 이름을 따서 “위그너 결정Wigner crystal”이라고 부른다.

페르미 액체가 붕괴하여 위그너 결정으로 변하는 현상은 전자가 언다는 관점에서 매우 신기한 현상이다. 하지만 이 현상은 비유적으로 물이 얼음으로 어는 액체-고체 상전이 현상의 하나로 이해할 수 있다. 그런데 양자역학은 고전적인 비유를 통해서 전혀 이해할 수 없는 새로운 물질 상태를 만들어 낼 수 있다. 이러한 새로운 물질 상태를 양자 물질quantum matter이라고 부른다.

 

 

양자 물질

엄밀하게 말해서, 모든 물질은 양자 물질이다. 우선 원자가 존재하기 위해서 양자역학이 필요하다. 그리고 앞선 섹션에서 설명했듯이, 이러한 원자들이 결합하여 응집물질이 만들어지기 위해서 다양한 양자역학적인 원리, 가장 중요하게 파울리의 배타 원리가 필요하다. 따라서 물질은 양자역학 없이 존재할 수 없다.

다만 원자의 존재와 파울리의 배타 원리를 공리처럼 받아들인다면, 그 이후 양자역학의 효과는 거시적인 스케일에서 상당 부분 무시될 수 있다. 어찌 보면 이렇게 양자역학의 효과가 거시적인 스케일에서 무시될 수 있다는 사실은 양자역학이 거시적인 스케일에서 고전역학으로 대체된다는 원리, 소위 대응 원리correspondence principle를 의미하는지 모른다.   

그럼에도 불구하고 때때로 양자역학의 효과가 거시적인 스케일에서 사라지지 않는 특별한 경우가 발생할 수 있는데, 이것이 바로 진정한 의미에서 양자 물질이다. 거칠게 말해서, 양자 물질이란 파동 함수가 복소수라는 성질, 즉 위상의 효과가 거시적인 스케일에서 살아남는 물질이다.

이어지는 다음 장에서 보겠지만, 위상의 효과는 입자의 개수가 많은 다체계many-body system에서 입자 사이에 존재하는 상호작용의 도움을 받아서 살아남을 수 있다.

박권
전)HORIZON 편집위원, 고등과학원 물리학부 교수 
위촉 기간 : 2017. 06. 01. ~ 2019. 05. 31.