1. 개요
Klein-Gordon equation슈뢰딩거 방정식의 상대론적 일반화 과정에서 얻어지는 방정식이다. 다만 현대에 이르러서는 상대성 이론을 베이스로 하는 장론에서 기본적으로 튀어나오는 스칼라 장을 기술하는 방정식으로 해석되기도 하며[1], 양자장론 등에서 활용이 되고 있다.
2. 역사
밑의 계산 과정을 보면 알겠지만, 클라인-고든 방정식은 뭔가 굉장한 사고의 전환이 필요한 것도 아니고, 가정이 몇 개 추가되어야 비로소 얻어지는 결과도 아니고, 그냥 특수 상대론에서의 에너지 식과 물리량-연산자 치환만 알고 둘을 잘 끼워 맞추면 어렵지 않게 튀어나오는 식이다. 그렇다면 슈뢰딩거는 특수 상대론에서의 에너지 식을 몰라서 이 방정식을 자신의 이름으로 발표하지 못하고 고전적 에너지 보존 법칙에 바탕한 슈뢰딩거 방정식을 발표한 것일까?클라인과 고든이 클라인-고든 방정식을 발표한 것은 1926년인데, 사실 슈뢰딩거는 1925년 말에 이미 이 식을 알고 있었다(...). 슈뢰딩거는 이 방정식을 이용하여 수소 원자에 대해 설명하려고 시도하였다. 그러나 클라인-고든 방정식은 전자의 스핀을 고려하지 않은 방정식이기 때문에 이러한 설명은 실패한다.[2] 하지만 슈뢰딩거는 이 방정식의 비상대론적 극한이 매우 쓸모있음을 깨닫고, 1926년 1월에 그 방정식, 슈뢰딩거 방정식을 발표한다.
슈뢰딩거 방정식이 발표되고 난 뒤 많은 물리학자들은 슈뢰딩거 방정식을 얻은 방법을 이용해 클라인-고든 방정식을 얻을 수 있다는 것을 깨달았는데, 방정식에 자신의 이름을 갖다 붙인 클라인과 고든은 물론이고 물질파 이론의 드 브로이, 테오필 드 동데르, 프란스-H. 반 덴 던겐 등 많은 과학자들이 비슷한 주장을 하였다.
3. 개요: 슈뢰딩거 방정식
슈뢰딩거 방정식은 고전 물리학에서 다음과 같은 에너지 법칙인 해밀토니언과 대응한다.[math( E = T + V )]
이 식에서 [math(E)]는 총 에너지, [math( \displaystyle T = \frac{p^2}{2m} )]는 운동 에너지, [math( V)]는 위치 에너지를 의미한다. 이 에너지 법칙의 각 물리량을 양자 역학에서의 대응하는 연산자
[math( \displaystyle E \rightarrow i\hbar \frac{\partial }{\partial t} )]
[math( \displaystyle p \rightarrow -i\hbar \nabla)]
[math( \displaystyle V(x) \rightarrow V(x) )]
로 치환하면 시간의존적 슈뢰딩거 방정식
[math( \displaystyle i \hbar \frac{\partial}{\partial t} \Psi(x,t)= \left( -\frac{\hbar^2}{2m}\nabla^2 + V(x,t) \right) \Psi(x,t))]
을 얻을 수 있다. 위치 에너지가 존재하지 않는 자유 입자의 경우 [math(V(x) = 0)]이므로 다음과 같이 표현된다.
[math( \displaystyle i \hbar \frac{\partial}{\partial t} \Psi(x,t)= -\frac{\hbar^2}{2m}\nabla^2 \Psi(x,t))]
4. 유도
4.1. 방법 1: 슈뢰딩거 방정식의 상대론화
위에서 사용한 에너지 방정식은 고전적 에너지 법칙이다. 그렇다면 이것을 상대론적으로 바꾸어 본다면 어떨까? 특수 상대성 이론에서는 자유 입자의 에너지를 다음과 같이 쓸 수 있다.[math( E = \sqrt{p^2 c^2 + m^2 c^4} )]
슈뢰딩거 방정식을 유도하기 위해 사용했던 방법처럼 물리량을 연산자로 치환해 보면
[math( \displaystyle i\hbar \frac{\partial }{\partial t} \Psi = \sqrt{ (-i\hbar \nabla)^2 c^2 + m^2 c^4} \Psi )]
를 얻는다. 아무래도 오른쪽의 연산자는 제곱근이 들어가 있어 계산하기 힘들 것 같다. 게다가 이 방정식은 비국소적[3]이다. 그렇다면 특수 상대성 이론에서의 에너지 식의 양변을 제곱한 다음 연산자로 치환한다면 어떨까?
[math( \displaystyle E^2 ={p^2 c^2 + m^2 c^4} \rightarrow - \hbar^2 \frac{\partial^2 }{\partial t ^2} \Psi = ( -\hbar^2 \nabla^2 c^2 + m^2 c^4) \Psi)]
좀 더 알기 쉽게 정리하면
[math(\displaystyle \frac{1}{c^2} \frac{\partial^2}{\partial t^2} \Psi - \nabla^2 \Psi + \frac{m^2 c^2}{\hbar ^2} \Psi = 0)]
달랑베르 연산자[4]와 [math(c=\hbar=1)]이라는 규격을 사용하여 더욱 간단한 형태로 적을수도 있다.
[math((\square + m^2) \Psi = 0 )]
이것이 클라인-고든 방정식이다.
4.2. 자유롭게 움직이는 상대론적 점입자의 양자화
상대론에서 스핀과 전하가 없으며 [math(d)]-차원 민코프스키(Minkowski) 시공간 [math(\mathcal{M})] 에서 자유롭게 움직이는 점입자의 위치 [math(x^{\mu}(\tau),\ \mu = 0, 1, \dots, d-1)]에 관한 방정식은 다음과 같은 작용 [math(S)] 으로부터 얻어진다.[math(S = -m \int_{\mathcal{M}} d\tau \left(- \eta_{\mu \nu} \dot{x}^{\mu} \dot{x}^{\nu} \right)^{1/2})]
위 식에서
[math(\eta_{\mu \nu} = \left( \begin{array}{cccc} -1 & 0 & 0 & 0\\ 0 & 1 & 0 & 0\\ 0 & 0 & 1 & 0\\ 0 & 0 & 0 & 1 \end{array} \right))]
는 민코프스키 계량(metric)을 나타낸다.[5] 이 입자의 운동량 [math(p_{\mu}(\tau))] 은 다음과 같이 주어진다.
[math( p_{\mu} = \frac{\partial L}{\partial \dot{x}^{\mu}} = m \left(- \eta_{\lambda \rho} \dot{x}^{\lambda} \dot{x}^{\rho} \right)^{-1/2} \eta_{\mu \nu} \dot{x}^{\nu} )]
여기서 [math(\dot{x}^{2} = \eta_{\mu \nu} \dot{x}^{\mu} \dot{x}^{\nu})]. 위 운동량 [math(p_{\mu} )] 다음과 같은 제한(constraint)을 가지게 되고,
[math(\eta^{\mu \nu} p_{\mu} p_{\nu} = p^{2} = - m^{2})]
이를 양자화하면 물리적인 양자적 상태 [math( \vert \psi \rangle )] 는 다음과 같이 정의된다.
[math( (\hat{p}^{2} + m^{2}) \vert \psi \rangle = 0 )]
여기서 [math(\hat{p}_{\mu})] 양자화 된 운동량 연산자이다. 이 연산자는 시공간 기저(basis) [math(\vert x \rangle)] 에 대해 다음과 같이 표현되며 ([math(c = \hbar = 1)])
[math(\hat{p}_{\mu} = -i \frac{\partial}{\partial x^{\mu}}\ ,)]
따라서 물리적인 양자적 상태가 되기 위한 조건은 다음과 같은 클라인-고든 방정식으로 주어진다.
[math( (\hat{p}^{2} + m^{2}) \psi(x) = \left[ \left(\frac{\partial}{\partial x^{0}}\right)^{2} -\sum_{i = 1}^{d-1} \left(\frac{\partial}{\partial x^{i}}\right)^{2} + m^{2} \right] \psi(x) )]
여기서 [math(\psi(x))] 는 양자적 상태 [math(\vert \psi \rangle)] 에 대한 파동함수로 다음과 같다.
[math(\psi(x) = \langle x \vert \psi \rangle )]
4.3. 유도 2: 상대론적 장론에서의 관점
그런데 사실 파동함수 대신에 상대성 이론 체계를 만족하는 장 방정식으로 이 방정식을 유도할 수 있다. 여기서 라그랑지언을 활용하여 방정식을 유도할 것이다.먼저 스칼라 장 [math(\phi(t, \vec{x}))]가 있다고 하자. 상대론적 장론에서 다루는 장인데, 스칼라 장임므로 이 장은 좌표 변환 [math(x \to x' = \Lambda x)]에 대하여 (여기서 [math(x)]는 4-벡터) 다음과 같이 변환되어야 한다.
[math(\displaystyle \phi(x) \to \phi(x') = \phi(\Lambda x).)]
좌표 말고는 뭐가 바뀐 게 없다.
벡터의 크기가 스칼라인점을 떠 올리면 굳이 스칼라장이라 이름을 붙인 이유를 알 수 있을 것이다. 벡터에 회전변환이나 평행이동변환[6] 가해도 벡터의 크기는 바뀌지 않고, 이와 같이 변환에 대해 불변한 양을 스칼라라 부르듯, 양자장이 이러한 변환에 대해 불변하므로 스칼라장이란 이름이 붙은 것이다.[7]
예를 들어 벡터 장은 [math(A^\mu(x) \to (\Lambda^{-1})^\mu_{\;\nu} A^\nu(\Lambda x))]와 같이 변환되는 건데, 스칼라 장은 그 중에서도 그 변환이 제일 단순한 경우다.[8][9]
이제 이걸 가지고 라그랑지언을 만들어 보자. 이런 경우 보통 라그랑지언은 로런츠 변환에 대하여 공변이다 못해 불변인 항들만 붙인다. 그런데 스칼라 장 자체가 일단 불변이다. 따라서 일단 상수, [math(\phi, \phi^2, \phi^3, \cdots)]가 라그랑지언에 들어갈 수 있을 것으로 보인다. 그런데 사실 3차 이상의 항이 라그랑지언에 들어가면 해당 장은 스스로와 상호작용을 하는 (self-interaction) 장이 된다.[10] 지금 관심 있는 경우는 사실 아무런 상호작용도 하지 않는 장, 즉 자유로운 장(free field)인데, 따라서 지금 라그랑지언에는 상수, [math(\phi, \phi^2)]만 들어갈 수 있다. 즉, [math(a\phi^2 + b\phi + c)] 꼴이 들어간다. 그런데 이건 사실 [math(a(\phi + p)^2 + q)] 꼴로 쓸 수 있으며, [math(\phi + p)]를 [math(\phi)]로 바꿔도 별 문제는 없을 것이다. 마지막으로 라그랑지언에서 상수는 있으나마나 한 것이다. 결국[math(\phi)]의 거듭제곱 꼴들 중에서 최종적으로 라그랑지언에 들어가게 되는 항은 [math(\phi^2)] 뿐이라고 볼 수 있겠다.
하지만 이것만으로는 부족하다. 장의 동역학을 표현하려면 뭔가 더 필요한데, 바로 [math(\phi)]의 변화가 필요하다. 즉, [math(\phi)]의 도함수가 필요하다. 일반적으로[11] 1차 내지 2차 미분이 들어간 것만 필요하다. 그리고 로런츠 변환에 공변이어야 할 것이다. (일단 공변인 것들을 가지고 있으면 축약(contraction) 등으로 얼마든지 공변인 것들을 만들 수 있다.) 이를 만족하는 건 [math(\partial_\mu \phi)]와 [math(\partial_\mu \partial^\mu \phi = \partial^2 \phi = \square \phi)] 정도일 것이다. 일단 전자는 불변이지 않지만 스스로와의 축약(contraction)을 통해 불변한 꼴로 만들 수 있는데, [math(( \partial_\mu \phi )( \partial^\mu \phi ) = (\partial_\mu \phi)^2)]이 그것이다. 한편 후자의 경우에는 어차피 공변이므로 바로 라그랑지언 '밀도'에[12] 넣어도 될 것 같으나, 주의할 게 뭐냐면 사실 라그랑지언 밀도에 [math(\partial_\mu A^\mu)] 같은 걸 넣어 봤자 어차피 0가 된다는 것이다. 이것은 4차원에서의 가우스 법칙에 의한 것이다. 따라서 [math(\partial_\mu \partial^\mu \phi)] 이 자체는 라그랑지언 밀도에 못 들어간다. 대신에 여기다 [math(\phi)]를 곱한 것, 즉 [math(\phi \partial^2 \phi)]는 더 이상 [math(\partial_\mu A^\mu)] 꼴이지 않으며 불변이기까지 하다. 따라서 또 하나의 후보를 찾은 것 같긴 하다. 그런데 이건 사실 첫번째 녀석인 [math((\partial_\mu \phi)^2)]와 똑같은 녀석으로 볼 수 있다. 왜냐하면 [math(\phi \partial^2 \phi = \partial_\mu (\phi \partial^\mu \phi) - ( \partial_\mu \phi )( \partial^\mu \phi ))]이고 여기서 첫번째 항은 앞서 말한 이유로 인하여 라그랑지언 안에서 사라지는 녀석이기 때문이다.[13] 결론적으로 미분이 들어간 항으로는 [math((\partial_\mu \phi)^2)]가 전부라고 볼 수 있다. 여기서 더 많은, 즉 3개 이상의 [math(\phi)]가 들어가는 항은 위 문단에서 설명했던 것과 같은 이유로 인하여 여기서는 무시한다.
결국 최종적으로 라그랑지언에 들어갈 수 있는 항은 [math(\phi^2)], [math((\partial_\mu \phi)^2)]가 전부이다. 즉, 라그랑지언은 이제 다음과 같이 쓸 수 있다.
[math(\displaystyle \mathscr{L} = a(\partial_\mu \phi)^2 + b\phi^2)].
물론 전체 공통 계수는 적당히 [math(\phi)] 안에 흡수시킬 수 있으므로 무시해도 된다. 이는 곧 [math(a, b)] 둘 중 하나는 아무 거나로 고정해도 상관 없다는 것이다. 이에 입각하여 자유 스칼라 장에 대한 라그랑지언은 보통 다음과 같이 쓴다.
[math(\displaystyle \mathscr{L} = \frac{1}{2} (\partial_\mu \phi)^2 - \frac{1}{2} m^2 \phi^2)].[14]
결국 자유 스칼라 장의 라그랑지언을 구했다. 그리고 이걸 오일러-라그랑주 방정식 [math(\partial_\mu \frac{\partial \mathscr{L}}{\partial (\partial_\mu \phi)} - \frac{\partial \mathscr{L}}{\partial \phi} = 0)]에 대입하면 다음을 얻게 된다.
[math(\displaystyle \partial_\mu \partial^\mu \phi + m^2 \phi = 0.)]
정확하게 클라인-고든 방정식을 얻었다. 따라서 클라인-고든 방정식은 사실 상대론적 (자유) 스칼라 장을 기술하는 방정식임을 알아낸 것이다. 이와 정확하게 똑같은 방법으로 맥스웰 방정식과[15] 디랙 방정식을 유도할 수 있다. 항목들을 참고하자. 파동함수를 상대론적으로 확장하여 얻은 결과가 상대론적 자유 스칼라 장의 장방정식과 똑같은 꼴인 게 의미심장해 보이긴 하다. 사실 파동함수 꼴이 애초부터 스칼라 꼴이라는 것으로부터 이건 당연한 결과겠지만. 이에 대한 해석은 맨 아래 설명을 참고하자.
5. 해
클라인-고든 방정식의 파동함수 [math(\Psi(\vec{r}, t))]를 가장 표준적인[math(\Psi(r, t) = e^{i(\vec{k} \cdot \vec{r} - \omega t)})]
[math(c=\hbar=1)] 규격을 사용한 클라인-고든 방정식에 대입하면 다음을 얻는다.
[math( -\omega^2 + |k| ^2 + m^2 = 0 )]
평면파 파동함수의 운동량 기대값과 에너지 기대값은 각각 [math(\hbar k)]와 [math(\hbar \omega)]이므로 (그리고 [math(\hbar = 1)] 규격을 이용하고 있으므로) 다음이 성립한다.
[math( \langle E\rangle ^2 = \langle P\rangle ^2 + m^2 )]
이는 특수 상대론에서의 에너지 식과 일치한다!
위의 식에서 제곱을 풀면 에너지가 양수와 음수가 모두 등장한다는 문제가 발생한다. 즉, [math(\omega \sim \langle E \rangle)] 라는 해석이 타당하지 않게 되는 것이다. 사실 negative frequency mode를 없애는 과정에서 반입자가 등장하게 된다
6. 특징과 한계(?)
클라인-고든 방정식은 특수 상대성 이론에 양자역학적 도구를 끼워 맞춘 형태이다. 따라서 자유 입자 이론의 경우 특수 상대성 이론을 만족시키는 모든 입자의 파동방정식은 클라인-고든 방정식을 만족시킨다. 하지만 상호작용을 하는 경우 입자의 스핀에 대해 고려하지 않았기 때문에 역은 성립하지 않는다. 따라서 0이 아닌 스핀을 가진 입자들의 운동을 설명하기 위해 디랙 방정식 등의 방정식이 생겨나게 된다. 이런 방정식들의 해는 클라인-고든 방정식의 해이지만, 역은 성립하지 않는다.위에서 살펴봤듯이 음수 에너지를 갖는 해가 존재한다는 것으로 인해 클라인-고든 방정식은 태어나자마자 철저하게 외면 받았다. 하지만...
7. 부활: 양자장론
이 방정식이 그렇다고 쓸모가 없느냐고 하면 결코 그렇지 않다. 다만 이게 제대로 작동하는 걸 보려면 학부 때 배우던 파동역학을 벗어나야 한다. 다름 아닌 양자장론 프레임에서만 이게 제대로 동작하기 때문. 해당 문서를 보면 알겠지만 이 프레임에서 음수 에너지 해는 전혀 다른 방식으로 동작하게 된다. 여기서 간단하게 설명하자면, 음수 에너지 해 부분은 양자역학 시간에 배웠던 조화진동자에서 써먹는 사다리 연산자(ladder operator)들 중 소멸자(annihilator)에 해당하는 부분으로 그 역할이 바뀌게 된다. 이렇게 되면 물리적으로 음의 에너지 같은 문제가 전혀 안 일어난다. 이 해석을 쓰면 디랙의 바다 같은 걸 도입하지 않아도 보손이든 페르미온이든 관계 없이 모든 입자를 다 기술할 수 있다는 장점이 있다. 이 프레임은 현재에도 입자물리학을 포함한 많은 영역에서 널리 쓰이고 있다.물론 클라인-고든 방정식이 스핀이 0인 입자, 즉 스칼라 입자만 기술하는 건 여전하다. 스핀 1/2인 전자는 디랙 방정식으로 기술되어야 하고 스핀 1인 (그리고 질량이 없으며 U(1) 게이지 대칭성을 갖는) 광자는 맥스웰 방정식으로 기술되어야 한다.[18] 즉, 가장 간단한 양자장의 형태를 설명하고 있는 방정식. 그래서 여전히 전자기 상호작용을 다룰 때에는 별로 쓸모가 없다. 클라인-고든 방정식은 양자장론 책들을 보면 연습 겸 사고실험 용도의 장난감 모델(toy model) 취급을 받는다. 그래도 파이온 같은 중간자의 운동을 근사적으로 기술하기 때문에 나름 쓸모는 있다. 이 녀석이 제대로 진가를 발휘하는 장면이 입자물리 책들의 거의 끝에 가서 등장하는데, 다름 아닌 스칼라 입자인 힉스 보손을 다룰 때이다.[19] 초창기에 쓸모 없다고 여겨졌던 클라인-고든 방정식이 알고 보니 최후에 발견된 힉스 입자를 기술하는 녀석이었던 것이다.
[1]
도상록, 핵안에서 핵립자운동의 고전마당론적취급, 과학원통보, 26, (6), 284 (1978).
[2]
전자의 스핀을 고려하면
디랙 방정식이 나타난다.
[3]
국소적인 미분방정식은 임의의 아주 작은 점 근처에서의 정보가 주어진다면 함수의 모든 정보를 알 수 있다. 반대로, 비국소적인 미분방정식은 한 점에서 그 미분방정식이 옳은지 확인하고 싶다면 그 점으로부터 멀리 떨어진 점의 정보가 필요하다.
[4]
수식이 깨진 게 아니라 기호 모양이 '네모'이다.
[5]
4차 단위행렬에서 1항 1열의 부호만 반대이다.
[6]
더 나아가서 위치좌표를 반전하는(parity)변환도 이에 해당한다.
[7]
여담으로 회전변환과 평행이동 변환에 대해서 불변하여 스칼라같지만, parity 변환과 같이 불연속 변환에 대해서 부호가 -가 되는 스칼라 또한 존재한다. 이 스칼라를 pseudo-scalar라고 부른다.
[8]
벡터장이라고 부르는 이유도, 시공간벡터처럼 변환되기 때문에 벡터장이라 부르는 것이다.
[9]
앞선 첨삭에서 언급한 것 같이, 회전변환과 평행이동 변환에 대해서 벡터처럼 변환하지만, parity 변환과 같이 불연속 변환에 대해서 부호가 여전히 유지되는 벡터 또한 존재한다. 이 벡터를 pseudo-vector라고 부르며, 대표적인 물리량으로는 각운동량이 있다.
[10]
단적으로 고차 항을 넣은 다음 나중에 오일러-라그랑주 방정식을 구해보면 방정식이 더 이상 [math(\phi)]에 대하여 선형이지 않게 된다. 비선형 방정식은 스스로와 상호작용하는 대상을 다루는 대표적인 케이스이다.
[11]
다양한 이유를 댈 수 있다. 양자장론에서는 재규격화(renormalization)을 위한 제약조건 때문이라고 설명하기도 한다.
[12]
귀찮아서 그런지 물리학자들은 라그랑지언 '밀도'를 그냥 라그랑지언이라고 보통 부른다.
[13]
다만 몇 가지 수학적 트릭을 써먹기 위하여 일부러 이 꼴로 라그랑지언을 변환하기도 한다.
[14]
부호가 바뀌었는데, 이 부호가 아니면 질량이 허수 질량인 것처럼 행동해서 그렇다. 실제로 이 경우 해당 스칼라 장의 입자를 타키오닉(tychionic) 입자라고 부른다. 하지만 이름과는 다르게 이 입자는 절대 초광속으로 날아가지 않는다.
[15]
다만 맥스웰 방정식은 게이지 대칭성을 추가로 요구해야 얻을 수 있다.
[16]
슈뢰딩거 방정식에 특수상대론적인 보정을 한 것이 클라인-고든 방정식이기 때문에, dispersion relation이 특수 상대론에서의 에너지 식과 일치하는 것은 당연하다.
[17]
역사적으로는 클라인-고든 방정식이 슈뢰딩거 방정식보다 먼저 나왔다. 슈뢰딩거도 처음에는 클라인 고든 방정식으로 수소원자 모델을 기술하려고 시도하였으나, 어떻게 해도 타당한 값을 찾을 수 없어 타협하여 발표한 방정식이 슈뢰딩거 방정식이다. 이후에 슈뢰딩거 방정식은 놀라울 정도로 수소원자의 빛 스펙트럼이 특정 주파수만을 가지며 실험값과 거의 완벽하게 일치하게 되면서, 방정식이 주목받게 된 것이다.
[18]
양자장론 프레임에서 이러한 입자들에 해당하는 슈뢰딩거 방정식 쯤 되는 게 사실 맥스웰 방정식이라고 생각해도 괜찮을 것이다.
[19]
다만, 약간의 변형이 필요하다. 먼저 실수 장을 다루는 클라인-고든 방정식을 복소수 장을 다루는 방정식으로 확장해야 하고, 추가로 SU(2) × U(1) 게이지를 주기 위해 복소수 스칼라 장을 하나가 아닌 두 개를 마련한다. 복소수 장은 반입자를 가지므로 이제 방정식은 반입자 포함 총 네 개의 입자를 한꺼번에 다루는 방정식으로 변형이 된다. 그래서 원래대로라면 네 개의 힉스 입자가 있는 것처럼 보일 것이나... 자발적 대칭성 붕괴는 이 방정식을 비틀어 버려 네 개의 입자들 중 세 개를 다른 데로 보내버린다. 다름 아닌 W와 Z의 제 3 자유도에 해당하는 상태로 보내는 것이다. 그렇게 해서 W와 Z은 질량을 가지고, 남은 하나의 입자는 원래 클라인-고든 방정식으로 기술되는 입자가 되는데, 이 녀석이 우리가 아는 바로 그 힉스 입자이다.