상대성 이론 Theory of Relativity |
|||
{{{#!wiki style="margin:0 -10px -5px" {{{#!wiki style="word-break: keep-all;" {{{#!folding [ 펼치기 · 접기 ] {{{#!wiki style="margin:-6px -1px -11px" |
<rowcolor=#2A1A5B> | 특수 상대성 이론 | 일반 상대성 이론 |
<colcolor=#00a0de><colbgcolor=#2A1A5B> 배경 | 상대성 이론/역사 · 맥스웰 방정식 · 마이컬슨-몰리 실험 | ||
기초 가설 | 상대성 원리 · 광속 불변의 원리 | 등가 원리( 중력 · 관성력) | |
이론 체계 | 시공간( 세계선 · 고유 시간 · 고유 길이 · 민코프스키 다이어그램 · 아인슈타인 표기법) · 미분기하학( 리만 다양체) | ||
로런츠 변환( 로런츠 인자) · 로런츠 군 |
아인슈타인 방정식 ·
힐베르트 액션 ( 슈바르츠실트 계량 · 라이스너-노르드스트룀 계량 · 커 계량/커-뉴먼 계량) |
||
현상 | 동시성의 상대성 · 시간 지연 · 길이 수축 · 질량-에너지 등가원리 · 상대론적 효과( 도플러) | 중력 렌즈 효과 · 중력파 · 적색편이 | |
응용 및 심화 | 기본 상호작용 · 상대론적 역학 · 상대론적 전자기학 · 양자 전기역학 · 천체물리학( 천문학 둘러보기) · 통일장 이론 · 루프 양자 중력 이론 · 타임 패러독스 · 중력 자성 | ||
쌍둥이 역설 · 막대와 헛간 역설 · 아광속 · 초광속 · 타키온 | 중력자 · 블랙홀( 블랙홀 둘러보기 · 사건의 지평선 · 중력 특이점 · 양자블랙홀) · 우주론 · 우주 상수 | }}}}}}}}}}}} |
1. 개요
로런츠 군[1]Lorentz group
상대성 이론의 결과 중 하나는 모든 관성 좌표계 간의 좌표 변환이 로런츠 변환으로 주어진다는 것이었다. 로런츠 변환들은 변환들의 합성을 이항연산(binary operator)으로 잡으면 로런츠 변환들을 모두 모은 집합은 군(group) 구조를 이룬다. 이 군을 가리켜 로런츠 군이라고 부른다.
로런츠 군과 관련하여 가장 중요한 것은 다른 것도 있지만 로런츠 군을 표현하는 방법에 있다고 볼 수 있다. 로런츠 군을 표현하는 방법을 다 아는 것을 통해 가능한 물리량의 형태가 무엇이 있는가를 말할 수 있기 때문이다. 그 결과로, 굳이 크게 나누자면 텐서[2]와 스피너로 가능한 물리량들을 나눌 수 있다.
그리고 이러한 분류는 가능한 장(field)의 종류가 무엇인가를 결정해 주며, 이는 양자장론에서 중요한 대목이기도 하다.
2. 정의
로런츠 변환을 봤으면 알겠지만 로런츠 변환 [math(A)]는[3] 다음을 만족하는 변환이다.[math(A^T J A = J.)]
여기서 [math(J)]는 대각 성분이 1, -1, -1, -1인[4] 대각 행렬이다. 이런 행렬들을 모두 모은 집합을 이렇게 표기한다.
[math(O(1, 3) = \{A \;|\; A^T J A = J\}.)]
특히 이 집합은 행렬의 곱에 대하여 닫혀 있다. 쉽게 확인할 수 있는 사실. 그리고 단위 행렬도 저 집합 안에 들어 가 있고 임의의 [math(A \in O(1, 3))]에 대해 [math(A)]는 역행렬을 가지며[5] 그 역행렬이 [math(O(1, 3))] 안에 들어가 있다는 것을 밝힐 수 있다. 따라서 이 집합과 행렬의 곱을 묶으면 군(group)이 된다는 것을 알 수 있다. 이것을 로런츠 군(Lorentz group)이라고 부른다.
참고로 [math(O(1, 3))]의 1과 3은 각각 [math(J)]의 0이 아닌 성분들 중에서 1의 개수와 -1의 개수를 나타낸다. 예를 들어 [math(O(3, 0))]는 [math(J)]가 단순히 단위행렬인 3차 행렬들을 모은 것이 된다. 그런데 이 집합은 다름 아닌 직교 행렬들을 모두 모은 군이다. 실제로 어떤 공간이든 회전 변환은 [math(O(m, n))] 꼴임을 보일 수 있다. 이런 식으로 좌표 회전 변환이 일반화가 되는 것이다. 이 관점에서 봤을 때 로런츠 군 역시 회전들을 모은 군이라고 볼 수 있는 것이다.
특히 이 군의 곱셈과 역행렬로 보내는 사상([math(A \in O(1, 3))]를 [math(A^{-1})]로 보내는 함수 또는 사상)은 미분 가능하다.[6] 따라서 이 군은 리 군(Lie group)이 된다. 더군다나 로런츠 군은 단순 리 군(simple Lie group) 중 하나이다. 이 성질은 매우 중요하다. 왜냐하면 단순 리 군과 그 표현 방법은 전부 다 밝혀져 있으니까.
한편 로런츠 군은 크게 다음과 같이 네 부분으로 쪼갤 수 있다.[7]
[math(\{ \Lambda \in O(1, 3) \;|\; \det{\Lambda} > 0, (\Lambda)^0_0 > 0 \}, )]
[math(\{ \Lambda \in O(1, 3) \;|\; \det{\Lambda} < 0, (\Lambda)^0_0 > 0 \}, )]
[math(\{ \Lambda \in O(1, 3) \;|\; \det{\Lambda} > 0, (\Lambda)^0_0 < 0 \}, )]
[math(\{ \Lambda \in O(1, 3) \;|\; \det{\Lambda} < 0, (\Lambda)^0_0 < 0 \}.)]
여기서 첫번째 부분과 두번째 부분을 묶어서 orthochronous 로런츠 군이라고 부르고, 첫번째 부분과 세번째 부분을 묶어서 참 로런츠 군(proper Lorentz group)이라고 부르며, 첫번째 부분과 네번째 부분을 묶어서 orthochorous 로런츠 군이라고 부른다. (orthochronous와 orthochorous의 공식 번역이 없는 관계로 영단어만 쓰였다.) 이 네 부분들 각각은 연결집합이지만 서로 연결되어 있지 않다. 그 말은 즉 연속적으로 로런츠 변환을 가할 때 처음에 첫번째 부분의 원소에서 출발했으면 계속 첫번째 부분의 원소이어야지 다른 부분의 원소로 변환이 가해질 수는 없다는 것이다.
또한 proper orthochronous 로런츠 군, 즉 첫번째 부분은 단위원을 포함하며, 단위원을 포함하는 연결집합 중에 제일 크다. 즉, 단위원을 포함하는 컴포넌트인 셈이다. 리 군 이론에 따르면 이 집합의 원소들은 다음과 같이 나타낼 수 있다.
[math(A = \exp{(iX)}.)]
여기서 [math(X)]는 미소 변환(infinitesimal transformation)을 나타낸다. 이러한 미소 변환들을 모으면 연산 [math([A, B] = AB - BA)]에 대하여 닫혀 있는 벡터 공간을 얻게 되는데[8], 이 공간을 가리켜 리 대수(Lie algebra)라고 부른다. 모든 리 군(의 단위원을 포함하는 컴포넌트)은 위와 같이 표현이 가능하다. 다르게 표현하자면 모든 리 군은 이에 대응하는 리 대수를 갖는다.
이 정의를 따를 때 [math(A)]가 실수 행렬이므로 여기에 복소 켤레를 취한 결과가 원래 행렬과 같아야 한다. 즉, [math(A^* = (\exp{(iX)})^* = \exp{(-iX^*)} = A)]이어야 하는 것인데, 이로부터 [math(X)]의 모든 성분들이 순허수, 즉 실수 성분이 0인 수이어야 한다는 것을 알 수 있다. 또한 [math(\det{\exp{(iX)}} = \exp{(tr \; (iX))})]인데, [math(\det{(A^T J A)} = (\det{A})^2 \det{J} = \det{J})]로부터 [math(tr \; X = 0)]이어야 함을 얻는다. 그리고 로런츠 군의 경우 로런츠 군의 정의에 의하여 다음이 성립한다.
[math(J = A^T J A = A^\dagger J A = \exp{(-i \epsilon X^\dagger)} J \exp{(i \epsilon X)} = \left( \sum_{r = 0}^\infty \frac{(-i \epsilon X^\dagger)^r}{r!} \right) J \left( \sum_{s = 0}^\infty \frac{(i \epsilon X)^s}{s!} \right))]
[math(\;\;\; = J + i\epsilon (-X^\dagger J + JX) + \epsilon^2(\cdots).)]
여기서 [math(\epsilon)]는 임의로 도입한 상수이다. 그런데 그 임의성 때문에 위 식으로부터 다음이 성립해야 한다는 것을 알 수 있다.
[math(JX = X^\dagger J.)]
이 조건과 앞서 설명한 [math(X)]가 순허수 행렬인 것, 그리고 [math(tr \; X = 0)]인 것이 바로 로런츠 군에 대응하는 리 대수의 한 원소일 조건들이다. 즉, 모든 [math(4 \times 4)]-행렬들 중에 저 조건을 만족하는 모든 행렬이 해당 리 대수의 원소이다. 이 조건들을 살펴보면 이 조건들을 만족하는 행렬들의 성분들 중 실질적으로 독립인 성분의 수들은 6개라는 것을 알 수 있는데, 이로부터 이 리 대수의 차원이 6차원이라는 것을 알 수 있다. 보다 자세한 내용은 아래에서 다루도록 하겠다.
로런츠 군의 원소들을 우리에게 익숙한 꼴로 다루는 것은 로런츠 변환에서 잘 설명해 두었다. 이 문서에서는 로런츠 군 그 자체의 고유한 성질을 다루겠다.
3. 직관
3.1. 왜 하필 로런츠 군을 쓰는가?
이는 앞서 로런츠 군의 정의를 보면 잘 알 수 있다. 연산자로서 주어진 두 대상에 대하여 행렬(혹은 텐서)를 전치 안 한 것 - 특정 대상 - 전치(transpose) 시킨 것 이렇게 샌드위치를 만들어버렸다.직관적으로 이게 뭔 의미일까? 이걸 의미하려면 선형 대수학을 열심히 공부한 다음 행렬식을 통해 고유값(eigenvalue)이 가지는 의미를 고찰하면 직관할 수 있다.
3.2. 로렌츠 군의 변환을 통해 분류한 장의 종류는 왜 중요한가?
대칭성을 지니기 때문이다. 로런츠 변환을 사용하여 장을 정의하는 상황을 가정해보자. 그리고 그게 어떤 상태를 나타내는 1, -1, (또는 0 까지)로 구성되어 있다고 해보자. 로런츠 군은 어쨌든 저쨌든 어떤 장의 속성을 정의하는데 한번 거쳐가면 일단 서로 "아 이 사람이 이런 의미로 썼구나."라고 서로 염두에 둘 수 있는 공통점이 생기기에 편리해진다.사실 정수의 1이라는 항등원(identity)과 항등원에 대한 음수, 양수 부호가 나타내는 컴비네이션, 그리고 그것을 통해 얻을 수 있는 함의가 매 숫자마다 정형화되어 있기 때문에 가능한 것이다. 직관적으로 다음과 같이 생각해볼 수 있다.
- 1
- -1
- 0
- 1/2
- -1/2
저들의 스칼라, 벡터, 텐서, 스피너, 곡률 등등 물리량에 대한 곱의 의미가 머리 속에 다양하게 스쳐지나가는 물리학자적 현상을 경험할 수 있다.
이걸 지지고 볶고 끓여도 보고 열심히 요리하는게 로런츠 군의 최종 목표이다.
4. 무한소 변환, 로런츠 대수
모든 리 군은 무한소 변환을 가지고 있다.[9] 직교군 [math(O(3))]에서도 찾을 수 있었던 것인데, 로런츠 군에서도 같은 방법으로 무한소 변환들을 찾을 수 있다.먼저 로런츠 군은 직교군을 부분군으로 갖는다. 그도 그럴 것이 공간 성분끼리만 '회전'시키는 것은 우리가 아는 3차원 회전이 맞기 때문이다. 더 구체적으로 임의의 [math(U \in O(3))]에 대해 다음과 같은 [math(4 \times 4)]-행렬을 생각해 보자.
[math(\tilde{U} = \left( \begin{array}{rr} 1 && \;\; 0 \\ 0 \;\; && U \end{array} \right).)]
그러면 임의의 4차원 벡터 [math(x)]에 대해 [math(\tilde{U} x)] 혹은 [math((\tilde{U})^\mu_\nu x^\nu)]는 시간 성분만 그대로 냅두고 나머지만 변환이 된 행렬이다. 더욱이 [math((\tilde{U} x)_\mu (\tilde{U} x)^\mu = x_\alpha (\tilde{U})^\alpha_\mu (\tilde{U})^\mu_\alpha x^\alpha = x_\mu x^\mu)]가 되어 [math(\tilde{U})]는 잘 정의된 로렌츠 변환에 해당하는 행렬임을 알 수 있다. 또는 [math(JX = X^T J)]임을 직접 확인할 수 있다. 한편 임의의 [math(U_1, U_2 \in O(3))]에 대하여 [math(U = U_1 U_2)]라고 표기하면 [math(\tilde{U_1} \tilde{U_2} = \tilde{U})]이며 [math(\tilde{U^{-1}} = (\tilde{U})^{-1})]임을 쉽게 확인할 수 있어 [math(\tilde{U})]들의 집합은 [math(O(3))]와 동형인 로런츠 군의 부분군임을 알 수 있다.
따라서 [math(o(3))]의 기본적인 무한소 변환 [math(J_1, J_2, J_3)] 같은 게 로런츠 군에도 있을 것이다. 실제로 이들은 다음과 같이 정의된다.
[math(\begin{matrix} J_1 &=& \left( \begin{array}{rrrr} 0 \;\; && 0 \;\; && 0 \;\; && 0 \\ 0 \;\; && 0 \;\; && 0 \;\; && 0 \\ 0 \;\; && 0 \;\; && 0 \;\; && -i \\ 0 \;\; && 0 \;\; && i \;\; && 0 \end{array} \right), \;\; \\J_2 &=& \left( \begin{array}{rrrr} 0 \;\; && 0 \;\; && 0 \;\; && 0 \\ 0 \;\; && 0 \;\; && 0 \;\; && i \\ 0 \;\; && 0 \;\; && 0 \;\; && 0 \\ 0 \;\; && -i \;\; && 0 \;\; && 0 \end{array} \right), \;\; \\J_3 &=&\!\!\!\left( \begin{array}{rrrr} 0 \;\; && 0 \;\; && 0 \;\; && 0 \\ 0 \;\; && 0 \;\; && -i \;\; && 0 \\ 0 \;\; && i \;\; && 0 \;\; && 0 \\ 0 \;\; && 0 \;\; && 0 \;\; && 0 \end{array} \right).\end{matrix})]
한편 이들 원소들은 [math(JX = X^\dagger J)]를 만족한다는 것 역시 알 수 있다. 물론 이건 리 군의 무한소 변환이면 모두 만족해야 할 성질이다. 따라서 [math(J_i)]들은 모두 로런츠 대수의 원소이다. 그리고 [math(O(3))]의 무한소 변환들도 그랬던 것처럼 이들 원소들도 다음을 만족한다.
[math([J_1, J_2] = iJ_3, \;\; [J_2, J_3] = iJ_1, \;\; [J_3, J_1] = iJ_2.)]
그렇다면 이들 말고도 다른 무한소 변환은 없는 것일까? 예를 들면 로런츠 부스트 같은 것들 말이다. 그걸 알아 보기 위해 로런츠 부스트에 해당하는 변환들을 살펴보자. 로런츠 부스트에 해당하는 로런츠 군의 원소는 다음과 같다.
[math(\begin{matrix} &&\left( \begin{array}{rrrr} \gamma \;\; && -\gamma \beta \;\; && 0 \;\; && 0 \\ -\gamma \beta \;\; && \gamma \;\; && 0 \;\; && 0 \\ 0 \;\; && 0 \;\; && 1 \;\; && 0 \\ 0 \;\; && 0 \;\; && 0 \;\; && 1 \end{array} \right),\\ &&\left( \begin{array}{rrrr} \gamma \;\; && 0 \;\; && -\gamma \beta \;\; && 0 \\ 0 \;\; && 1 \;\; && 0 \;\; && 0 \\ -\gamma \beta \;\; && 0 \;\; && \gamma \;\; && 0 \\ 0 \;\; && 0 \;\; && 0 \;\; && 1 \end{array} \right), \\ && \left( \begin{array}{rrrr} \gamma \;\; && 0 \;\; && 0 \;\; && -\gamma \beta \\ 0 \;\; && 1 \;\; && 0 \;\; && 0 \\ 0 \;\; && 0 \;\; && 1 \;\; && 0 \\ -\gamma \beta \;\; && 0 \;\; && 0 \;\; && \gamma \end{array} \right). \end{matrix})]
이들은 각각 x축, y축, z축 방향으로의 로런츠 부스트이다. 여기서 [math(\gamma = \frac{1}{\sqrt{1 - \beta^2}})]이다. 그런데 [math((\gamma)^2 - (\gamma \beta)^2 = 1)]이므로 [math(\gamma = \cosh{\xi}, \gamma \beta = \sinh{\xi})]에 해당하는 실수 [math(\xi)]가 존재한다. 이걸로 위 부스트들을 다시 표현해 보자.
[math(\begin{matrix}&&\left( \begin{array}{rrrr} \cosh{\xi} \;\; && -\sinh{\xi} \;\; && 0 \;\; && 0 \\ -\sinh{\xi} \;\; && \cosh{\xi} \;\; && 0 \;\; && 0 \\ 0 \;\; && 0 \;\; && 1 \;\; && 0 \\ 0 \;\; && 0 \;\; && 0 \;\; && 1 \end{array} \right),\\&& \left( \begin{array}{rrrr} \cosh{\xi} \;\; && 0 \;\; && -\sinh{\xi} \;\; && 0 \\ 0 \;\; && 1 \;\; && 0 \;\; && 0 \\ -\sinh{\xi} \;\; && 0 \;\; && \cosh{\xi} \;\; && 0 \\ 0 \;\; && 0 \;\; && 0 \;\; && 1 \end{array} \right), \\&&\left( \begin{array}{rrrr} \cosh{\xi} \;\; && 0 \;\; && 0 \;\; && -\sinh{\xi} \\ 0 \;\; && 1 \;\; && 0 \;\; && 0 \\ 0 \;\; && 0 \;\; && 1 \;\; && 0 \\ -\sinh{\xi} \;\; && 0 \;\; && 0 \;\; && \cosh{\xi} \end{array} \right).\end{matrix})]
사실 x축 방향으로의 로런츠 부스트 행렬은 다음과 같이 쓸 수 있다.
[math(\displaystyle 1 + \sum_{n = 1}^\infty \frac{\xi^{2n}}{(2n)!} \left( \begin{array}{rrrr} 1 \;\; && 0 \;\; && 0 \;\; && 0 \\ 0 \;\; && 1 \;\; && 0 \;\; && 0 \\ 0 \;\; && 0 \;\; && 0 \;\; && 0 \\ 0 \;\; && 0 \;\; && 0 \;\; && 0 \end{array} \right) + \sum_{n = 0}^\infty \frac{\xi^{2n + 1}}{(2n + 1)!} \left( \begin{array}{rrrr} 0 \;\; && -1 \;\; && 0 \;\; && 0 \\ -1 \;\; && 0 \;\; && 0 \;\; && 0 \\ 0 \;\; && 0 \;\; && 0 \;\; && 0 \\ 0 \;\; && 0 \;\; && 0 \;\; && 0 \end{array} \right))]
[math(\displaystyle = \sum_{n = 0}^\infty \frac{1}{n!} \left( \left( \begin{array}{rrrr} 0 \;\; && -1 \;\; && 0 \;\; && 0 \\ -1 \;\; && 0 \;\; && 0 \;\; && 0 \\ 0 \;\; && 0 \;\; && 0 \;\; && 0 \\ 0 \;\; && 0 \;\; && 0 \;\; && 0 \end{array} \right) \xi \right)^n = \exp{\left( i \left( \begin{array}{rrrr} 0 \;\; && i \;\; && 0 \;\; && 0 \\ i \;\; && 0 \;\; && 0 \;\; && 0 \\ 0 \;\; && 0 \;\; && 0 \;\; && 0 \\ 0 \;\; && 0 \;\; && 0 \;\; && 0 \end{array} \right) \xi \right)}.)]
y축, z축 방향으로의 나머지 행렬들에 대해서도 똑같은 작업을 할 수 있다. 결국 다음 행렬들이 각 로런츠 부스트의 무한소 변환에 해당하는 행렬들임을 알 수 있다.
[math(\begin{matrix}K_1 &=& \left( \begin{array}{rrrr} 0 \;\; && i \;\; && 0 \;\; && 0 \\ i \;\; && 0 \;\; && 0 \;\; && 0 \\ 0 \;\; && 0 \;\; && 0 \;\; && 0 \\ 0 \;\; && 0 \;\; && 0 \;\; && 0 \end{array} \right), \;\; \\K_2 &=& \left( \begin{array}{rrrr} 0 \;\; && 0 \;\; && i \;\; && 0 \\ 0 \;\; && 0 \;\; && 0 \;\; && 0 \\ i \;\; && 0 \;\; && 0 \;\; && 0 \\ 0 \;\; && 0 \;\; && 0 \;\; && 0 \end{array} \right), \;\; \\K_3 &=&\!\!\!\! \left( \begin{array}{rrrr} 0 \;\; && 0 \;\; && 0 \;\; && i \\ 0 \;\; && 0 \;\; && 0 \;\; && 0 \\ 0 \;\; && 0 \;\; && 0 \;\; && 0 \\ i \;\; && 0 \;\; && 0 \;\; && 0 \end{array} \right).\end{matrix})]
이때 다음이 성립한다는 것을 직접 확인할 수 있다.
[math([K_1, K_2] = -iJ_3, \;\; [K_2, K_3] = -iJ_1, \;\; [K_3, K_1] = -iJ_2, \;\; )]
[math([J_1, K_1] = 0, \;\; [J_1, K_2] = iK_3, \;\; [J_1, K_3] = -iK_2, \;\; )]
[math([J_2, K_1] = -iK_3, \;\; [J_2, K_2] = 0, \;\; [J_2, K_3] = iK_1, \;\; )]
[math([J_3, K_1] = iK_2, \;\; [J_3, K_2] = -iK_1, \;\; [J_3, K_3] = 0.\;\; )]
이걸 레비치비타 기호로 간단하게 쓸 수 있다. 기왕 쓰는 김에 [math([J_l, J_m])] 식들도 같이 정리해서 쓰자.
[math(\displaystyle [J_l, J_m] = i\sum_{n = 1}^3 \epsilon_{lmn} J_n, \;\; [K_l, K_m] = -i\sum_{n = 1}^3 \epsilon_{lmn} J_n, \;\; [J_l, K_m] = i\sum_{n = 1}^3 \epsilon_{lmn} K_n.)]
이런 교환자 관계를 얻는다. 이 관계들로부터 서로가 서로를 리 괄호(교환자)로 만드는 것을 볼 수 있다. 이는 곧 [math(J_n, K_n)]들이 리 대수를 이룬다는 것을 뜻한다. 즉, 이들 여섯 개의 성분들을 선형결합하여 만든 모든 원소들의 집합은 리 대수를 이룬다. 더군다나 [math(J_n, K_n)]들은 모두 다른 성분들을 가지고 있어 일차독립 집합을 이룬다. 그 말은 이 여섯 개 행렬들이 방금 전에 말한 리 대수의 기저(basis)임을 말하고, 따라서 이 리 대수의 차원은 6이다. 이로부터 이 리 대수가 로렌츠 대수와 같다는 것을 알 수 있다.
재밌는 것은 위 식들에서 [math(K_n)] 자리에 [math(iJ_n)]를 대신 써 넣어도 식들이 똑같이 성립한다는 것이다. 이 특성 때문에 로런츠 대수가 [math(sl_R(2, C))]라는 리 대수와 동형이라는 것을 밝힐 수 있다. 이 대수는 [math(O(3))]를 다룰 때 썼던 [math(sl(2))]에 [math(iH, iE, iF)]를 덧붙여서 만든 대수이다. 이런 새로운 형태를 이용해 로런츠 군의 많은 성질을 손쉽게 다룰 수 있다. 특히 (1/2-) 스피너를 다룰 때 매우 유용하다.
이러한 정의들로부터 로런츠 군에 있는 임의의 원소는 다음과 같이 쓸 수 있다는 것을 알 수 있다.
[math(A = \exp{(i\vec{\theta} \cdot \vec{J} + i\vec{\beta} \cdot \vec{K})}.)]
여기서 [math(\vec{J} = (J_1, J_2, J_3), \vec{K} = (K_1, K_2, K_3))]는 행렬을 성분으로 갖는 벡터로 사실 [math(\sum_{i = 1}^3 \theta_i J_i)]와 [math(\sum_{i = 1}^3 \beta_i K_i)]를 다 쓰기 귀찮아서 이렇게 쓴 것이다. 물론 [math(\theta_i, \beta_i)]는 임의의 실수들이다.
조금 전에 레비치비타 기호로 정리를 좀 했었다. 여기서 더 정리가 가능하다. 다음과 같이 기호를 정의해 보자.
[math(J^{01} = K_1, \;\; J^{02} = K_2, \;\; J^{03} = K_3, )]
[math(J^{23} = J_1, \;\; J^{31} = J_2, \;\; J^{12} = J_3, )]
[math(J^{\mu \nu} = -J^{\nu \mu}.)]
이렇게 기호를 정하고 마찬가지로 [math(\omega^{01} = -\beta_1, \omega^{02} = -\beta_2, \omega^{03} = -\beta_3)], [math(\omega^{23} = \theta_1, \omega^{31} = \theta_2, \omega^{12} = \theta_3)]로 표기하면 다음을 얻는다.
[math(\sum_{i = 1}^3 \theta_i J_i + \sum_{i = 1}^3 \beta_i K_i = \omega^{23} J^{23} + \omega^{31} J^{31} + \omega^{12} J^{12} - \omega^{01} J^{01} - \omega^{02} J^{02} - \omega^{03} J^{03})]
[math( = -\omega^{01} J^{01} - \omega^{02} J^{02} - \omega^{03} J^{03} + \omega^{12} J^{12} + (-\omega^{13}) (-J^{13}) + \omega^{23} J^{23})]
[math( = \sum_{\mu < \nu} (\eta_{\mu \alpha} \eta_{\nu \beta} \omega^{\alpha \beta}) J^{\mu \nu}) = \frac{1}{2} \sum_{\mu < \nu} (\eta_{\mu \alpha} \eta_{\nu \beta} \omega^{\alpha \beta}) J^{\mu \nu} + \frac{1}{2} \sum_{\nu < \mu} (\eta_{\nu \alpha} \eta_{\mu \beta} \omega^{\alpha \beta}) J^{\nu \mu})]
[math( = \frac{1}{2} \sum_{\mu < \nu} (\eta_{\mu \alpha} \eta_{\nu \beta} \omega^{\alpha \beta}) J^{\mu \nu} + \frac{1}{2} \sum_{\nu < \mu} (\eta_{\nu \alpha} \eta_{\mu \beta} (-\omega^{\beta \alpha})) (-J^{\mu \nu}))]
[math( = \frac{1}{2} \sum_{\mu = 0}^3 \sum_{\nu = 0}^3 (\eta_{\mu \alpha} \eta_{\nu \beta} \omega^{\alpha \beta}) J^{\mu \nu} = \frac{1}{2} \omega_{\mu \nu} J^{\mu \nu}.)]
이 표기를 쓰면 로런츠 군의 원소들을 이렇게 표기할 수 있다.
[math(A = \exp{\left( i\frac{1}{2} \omega_{\mu \nu} J^{\mu \nu}) \right)}.)]
더 간단해졌다. 교환자 관계도 한 식으로 정리할 수 있는데, 그 결과는 다음과 같다.
[math([J^{\mu \nu}, J^{\lambda \rho}] = i(\eta^{\mu \lambda} J^{\nu \rho} + \eta^{\mu \rho} J^{\nu \lambda} - \eta^{\nu \lambda} J^{\mu \rho} - \eta^{\nu \rho} J^{\mu \lambda}).)]
어쨌든 이렇게 한 식으로 정리할 수 있다. 이걸로 로런츠 대수를 정의하기도 한다.
5. 로런츠 군의 표현
5.1. 개요
우리가 아는 물리량은 스칼라, 벡터, 텐서 등이었다. 이들은 로런츠 군의 한 원소 [math(A = A^\mu_\nu)]에 대하여 다음과 같이 변환되었다.[math(S \to S, )]
[math(V^\mu \to A^\mu_\nu V^\nu, )]
[math(T^{\mu_1 \mu_2 \cdots \mu_m}_{\nu_1 \nu_2 \cdots \nu_n} \to A^{\mu_1}_{\alpha_1} \cdots A^{\mu_m}_{\alpha_m} (A^{-1})_{\nu_1}^{\beta_1} \cdots (A^{-1})_{\nu_n}^{\beta_n} T^{\alpha_1 \alpha_2 \cdots \alpha_m}_{\beta_1 \beta_2 \cdots \beta_n})]
사실 이런 물리량들은 고전역학에서도 잘 알려진 물리량들이었다. 그때에는 로런츠 군의 원소 대신 직교행렬(orthogonal matrix), 즉 직교 군(orthogonal group) [math(O(3))]의 원소들에 의한 변환이었다.[10] 그 물리량들을 그대로 상대성 이론에 맞도록 확장시킨 것 뿐이다. 여기서 다음과 같은 질문은 자연스럽다. 저런 식으로 말고 다른 방식으로 로런츠 변환이 되는 물리량이 있을까? 있다면 얼마나 될까?
그 질문의 답이 현대 수학에 있었다. 리 군(Lie group)과 리 대수(Lie algebra)로 대표되는 리 이론이 그것이었는데, 20세기 수학의 가장 큰 성과들 중에는 리 군 혹은 리 대수 중에서 단순한 것들, 즉 단순 리 군(simple Lie group)과 단순 리 대수(simple Lie algebra)이 무엇이 있는가를 완벽하게 분류(classification)했다는 것[11][12]이고 또 하나는 단순 리 군의 표현(represenatation)으로 무엇이 있는가를 모든 단순 리 군의 표현으로 무엇이 있는가를 모조리 다 분류해낸 것이다. 로런츠 군은 단순 리 군들 중 하나이니, 결국 조금 전의 질문은 수학에서 어렵지 않게 찾아낼 수 있는, 이미 답이 있는 질문이었던 것이다. 이 문서에서는 로런츠 군을 표현하는 가능한 모든 방식들이 무엇인가를 간략하게나마 살펴 볼 것이다.
'표현'에 괄호 치고 영문 번역을 넣은 것은 실제로 군과 같이 주어진 대수적 대상을 행렬이나 대칭 군(symmetric group) 등의 부분군 또는 부분공간 등등으로 나타내는 방법 등을 연구하는 분야를 가리켜 표현론(representation theory)라고 부르기 때문이다. 표현론은 대수학에서 매우 중요한 위상을 가진다. 주어진 대수학적 대상을 어떻게 표현할 줄 아느냐를 알면 그 대상을 다루기가 훨씬 수월해지기 때문이다.
하지만 이 문서에서는 로런츠 군의 표현론 자체에 대해 다루진 않을 것이다.[13] 여기서는 결론만 간단히 논할 것이다. 이해를 돕기 위해 몇 가지 어려운(...) 중간 단계들을 설명할 것이긴 하지만.
5.2. [math(O(3))]의 표현
로런츠 군의 표현을 알고자 한다면 먼저 [math(O(3))]의 표현부터 알아야 한다. [math(O(3))]의 표현으로부터 로런츠 군의 표현 자체 혹은 그 힌트를 얻을 수 있기에 이는 중요하다.[14][math(O(3))]의 표현을 구한다는 것은 사실 이 군에 해당하는 리 대수의 표현을 얻는다는 것과 동치이다. 주어진 리 군의 모든 원소들은 다음과 같이 표현될 수 있기 때문이다.
[math(g = g_1 \exp{(iA)}.)] [15][16]
여기서 [math(g_1)]는 1 혹은 1을 포함한 컴포넌트가 아닌 다른 컴포넌트[17]에 포함된 한 원소이고, [math(A)]는 리 군에 대응하는 리 대수의 한 원소이다. [math(g_1)]를 정하거나 표현하는 것은 별개이나 그리 대단한 것은 아니므로 사실 상 대응하는 리 대수, 즉 [math(A)]들을 어떻게 표현하느냐가 관건이다.
한 가지 짚고 넘아가자. 이미 우리는 [math(O(3))] 혹은 [math(o(3))]의 두 표현 방법을 알고 있다. 스칼라의 변환에 대한 표현과 벡터의 회전 변환에 대한 표현이 그것이다. 게다가 우리가 알고 있는 [math(O(3))]의 정의는 어떤 특정한 조건([math(O^T O = 1)])을 만족하는 [math(3 \times 3)]-행렬들이라는 것이다. 그런데 이 정의는 사실 벡터의 회전 변환에 대한 표현만 갖고 있고 스칼라의 변환에 대한 정보는 하나도 없다. 심지어 일반적인 텐서의 변환[18]에 대한 정보도 그렇다. 이러한 상황에서 '모든 표현'을 찾는 방법은 기존의 표현을 버리는 것인데, 이것은 말 그대로 추상화를 하겠다는 것이다. 여기서 주어진 리 군의 추상화를 한다는 것은 리 군의 원소들이 원래 행렬이었다는 정보 등을 싸그리 잊어버리고 오로지 이름만 남은 원소들과 그 곱셈 관계, 그리고 위상적 성질만 남겨두겠다는 것이다. 그러고 나서 이 정보를 담을 수 있는 '그릇'이 처음에 썼던 그릇([math(3 \times 3)]-행렬) 말고도 또 있는가를 찾는 것이다. 이러한 설명에서 '그릇'이 곧 '표현'인 셈이다.
그런데 리 군 자체로 표현을 찾는 것은 쉬운 일이 아니다. 다만 대안이 하나 있다. 바로 리 대수를 이용하는 것이다. 리 군이 가지는 최소한의 정보만 남겨 놓고 싹 다 버리게 되었을 때 리 대수 역시 정말 필요한 정보만 빼고 모든 내용을 다 버리게 되는데, 리 대수의 벡터 공간적 성질(차원 등)을 제외하고 남게 되는 정보가 바로 리 괄호 [math([\cdot, \cdot])]에 의한 연산 관계이다. 즉, 연산 [math([\cdot, \cdot])]이 주어진 어떤 벡터 공간이라는 뜻이다. 처음 정의대로였다면 이 리 괄호는 [math([A, B] = AB - BA)]로 정의되어 있었을 것이다. 하지만 추상화를 거치고 나면 저 괄호가 저런 형태였는지조차 모르게 된다.[19] 다만 [math([A, B])]가 어느 원소에 대응되는지 하는 정보와 리 괄호가 가져야 할 가장 기본적인 성질들인 이중선형성(bilinearity), 반대칭성(antisymmetry, [math([A, B] = -[B, A])]), 그리고 야코비 항등식(Jacobi identity, [math([A, [B, C]] + [B, [C, A]] + [C, [A, B]] = 0)])만이 남을 뿐이다. 자세한 것은 리 대수 문서 참조. 이런 게 왜 중요하냐면, 리 군보다 리 대수를 다루는 것이 훨씬 쉬우며, 더군다나 모든 정보를 다 지운 상태에서 주어진 리 군에 대응하는 리 대수만 다루는 것만으로도 리 군의 거의 모든 것을 다룰 수 있게 되기 때문이다.[20] 따라서 [math(O(3))]의 표현으로 무엇이 있는가를 알고 싶다면 [math(O(3))]에 대응하는, 그리고 추상화가 된 (모든 떨거지 정보들을 다 버린, 즉 리 괄호 관계 빼고 다 버려진) 리 대수 [math(o(3))]를 조사해 봐야 한다는 것이다.
[math(O(3))]에 해당하는 리 대수 [math(o(3))]는 다음을 만족하는 세 원소들의 선형 결합으로 표현된다.
[math([J_1, J_2] = iJ_3, \;\; [J_2, J_3] = iJ_1, \;\; [J_3, J_1] = iJ_2,)]
사실 [math(O(3))]의 원소들 중 행렬식이 1인 것들은 모두 [math(\exp{(i\sum_i J_i \theta_i)})]로 표현되는데, 이 변환은 [math(\vec{\theta} = (\theta_1, \theta_2, \theta_3))]와 같은 방향을 축으로 하여 [math(|\vec{\theta}|)]만큼의 각도(라디안)로 회전시키는 변환이다. 이렇게 표현했을 때 [math(J_i)]들의 리 괄호 관계는 정확하게 위와 같게 된다. 그리고 필요한 리 괄호 관계는 이 정도가 다이다.
앞서 말했듯이 이 정보와 리 괄호가 갖춰야 할 세 가지 조건 빼고 다른 건 아예 모른다고 할 것이다. 하지만 이 최소한의 정보만으로도 [math(o(3))], 혹은 [math(O(3))]의 어떤 표현이 가능한가를 모두 알아낼 수 있다.
여기서 다음을 생각해 보자.
[math(H = 2J_3, \;\; E = J_1 + iJ_2, \;\; F = J_1 - iJ_2.)]
그러면 다음이 만족된다.
[math([H, E] = 2E, \;\; [H, F] = -2F, \;\; [E, F] = H.)]
이제 이 리 대수의 표현을 이야기해 보자. 알아먹기 편하도록 하기 위해 벡터 공간과 선형 연산, 동형사상 같은 추상적인 언어 대신 행렬로 표현해 보겠다. 사실 유한 차원의 표현에서 행렬로 말하는 거나 추상적인 언어로 말하는 거나 사실 거의 같은 말이다. 선형 연산자 하나를 행렬로 표현하는 방법이 무한히 많다는 점만 뺀다면.[21] 다만 행렬로 표현한다고 했을 때 기존의 리 괄호 연산은 행렬에서의 교환자 연산에 그대로 전해져야 한다. 무슨 말이냐면 리 대수의 두 원소 [math(A, B)]의 행렬 표현 [math(\rho(A), \rho(B))]에 대하여 [math([A, B])]의 행렬 표현은 [math([\rho(A), \rho(B) ] = \rho(A) \rho(B) - \rho(B) \rho(A))]와 같아야 한다.
위에서 얻은 [math(H, E, F)]가 어떤 [math((n + 1) \times (n + 1))]-행렬로 표현된다고 가정하자. (편의 상 이들 행렬도 [math(H, E, F)]로 표기하기로 하자.) 관건은 각 자연수 [math(n)]에 대하여 가능한 표현이 얼마나 되는가를 알아보고자 하는 것이다. 여기서 만약 두 표현 [math((H_1, E_1, F_1))]과 [math((H_2, E_2, F_2))]에 대하여 어떤 행렬 [math(A)]가 존재하여 [math(H_2 = AH_1A^{-1}, E_2 = AE_1A^{-1}, F_2 = AF_1A^{-1})]가 성립한다면 두 행렬에 의한 표현은 같은 표현이라고 말한다. 이것은 선형 연산의 언어로 보면 당연한 얘기겠지만.
한편, 행렬로 리 대수를 표현하다 보면 이런 꼴로 행렬들이 표현될 수도 있을 것이다.
[math(H = \left( \begin{array}{rrrr} H_1 \;\; && 0 \;\; && \cdots \;\; && 0 \\ 0 \;\; && H_2 \;\; && \cdots \;\; && 0 \\ \vdots \;\; && \vdots \;\; && \ddots \;\; && \vdots \\ 0 \;\; && 0 \;\; && \cdots \;\; && H_r \end{array} \right), E = \left( \begin{array}{rrrr} E_1 \;\; && 0 \;\; && \cdots \;\; && 0 \\ 0 \;\; && E_2 \;\; && \cdots \;\; && 0 \\ \vdots \;\; && \vdots \;\; && \ddots \;\; && \vdots \\ 0 \;\; && 0 \;\; && \cdots \;\; && E_r \end{array} \right), F = \left( \begin{array}{rrrr} F_1 \;\; && 0 \;\; && \cdots \;\; && 0 \\ 0 \;\; && F_2 \;\; && \cdots \;\; && 0 \\ \vdots \;\; && \vdots \;\; && \ddots \;\; && \vdots \\ 0 \;\; && 0 \;\; && \cdots \;\; && F_r \end{array} \right).)]
여기서 각 [math(i = 1, 2, \cdots, r)]에 대해 [math(H_i, E_i, F_i)]는 다 크기가 같은 행렬들이며 심지어 [math([H_i, E_i] = 2E_i, [H_i, F_i] = -2F_i, [E_i, F_i] = H_i)]가 성립한다. 지금 우리가 다루고 있는 리 대수의 경우 항상 이렇게 분해(decomposition)가 될 수 있다는 매우 좋은 성질을 가지고 있다.[22][23] 사실 상 더 작은 '표현'들의 결합으로 표현될 수 있다는 것이다. 이걸 거꾸로 말해 보자. 이 리 대수의 표현들을 모두 알고 싶다면 더 작게 분해가 안 되는, 즉 위와 같이 분해하려고 해도 [math(r = 1)]인 결과 밖에 안 나오는 그런 표현들만 조사하면 된다. 어차피 다른 표현들은 이 분해가 안 되는 표현들의 결합일 것이기 때문이다. 이런 분해가 안 되는 표현들을 기약 표현(irreducible representation)이라고 부른다. 따라서 앞으로 다루게 될 내용은 기약 표현에만 한정할 것이다. 즉, 어떤 기약 표현이 가능한가를 분류해 보겠다는 것이다.
증명은 생략하겠지만 [math(H)]가 항상 대각화가 가능하다는 것을 보일 수 있다.[24] 그렇다는 것은 어떤 행렬 [math(A)]가 존재하여 [math(AHA^{-1})]가 대각행렬이라는 뜻이 된다. 이제 [math(AHA^{-1}, AEA^{-1}, AFA^{-1})]로 [math(H, E, F)]를 대신해서 쓰자. 이렇게 얻은 행렬 역시 올바른 표현이 맞다는 것을 바로 확인할 수 있다. 물론 이렇게 해서 얻은 새로운 표현은 앞서 설명했듯이 결국 처음 표현과 동일한 표현이겠지만.
[math(Hv_\lambda = \lambda v_\lambda)]인 [math(H)]의 한 고유벡터에 해당하는 [math((n + 1) \times 1)]-행렬 [math(v_\lambda)]를 생각해 보자. 그러면 다음을 얻을 수 있다.
[math(H(Ev_\lambda) = (HE)v_\lambda = ([H, E] + EH)v_\lambda = +2Ev_\lambda + E(Hv_\lambda) = (\lambda + 2)(Ev_\lambda), )]
[math(H(Fv_\lambda) = (HF)v_\lambda = ([H, F] + FH)v_\lambda = -2Fv_\lambda + F(Hv_\lambda) = (\lambda - 2)(Fv_\lambda).)]
이로부터 얻을 수 있는 결론은 [math(E)]와 [math(F)]가 각각 고유벡터를 두 칸 위로 옮기거나 혹은 아래로 옮기는 연산에 해당한다는 것을 알 수 있다. 즉, [math(Ev_\lambda = e_\lambda v_{\lambda + 2}, Fv_\lambda = f_\lambda v_{\lambda - 2})]에 해당한다는 것이다. 물론 [math(e_\lambda, f_\lambda)]가 아직 뭔지 모른다. 사실 [math(\lambda, e_\lambda, f_\lambda)]가 무슨 값을 가질 수 있는가를 조사하는 것으로 가능한 행렬 표현을 모두 구하는 문제를 풀 수 있다. 이것들을 구하면 [math(H, E, F)] 각각의 성분들을 모조리 알게 된 것과 같은 거니까.
이걸 구하기 전에 하나 더 살펴 보자. 지금 우리는 유한한 크기의 행렬을 다루고 있다. 그런데 만약 [math(Fv_\lambda = 0)]인 [math(v_\lambda)]가 존재하지 않는다면, 아무렇게나 잡힌 다음에 고정된 [math(\lambda)]에 대하여 [math(v_{\lambda - 2}, v_{\lambda - 4}, v_{\lambda - 6}, \cdots)]들이 모두 존재하게 되어 가능한 고유벡터들이 무한히 많아진다는 것을 알 수 있다. 이를 위해선 필요한 행렬의 크기가 무한히 커야 한다. 이런 모순이 일어나지 않으려면 적당한 고유값 [math(\lambda_0)]가 존재하여 [math(Fv_{\lambda_0} = 0)]이어야 한다. 한편 같은 이유로 모든 고유값 [math(\lambda)]에 대하여 [math(Ev_\lambda \ne 0)]일 수는 없다. 이로부터 어떤 자연수 [math(r)]가 존재해 [math(E^{r + 1} v_{\lambda_0} = 0)]이어야 한다는 것을 알 수 있다.
한편 이러한 [math(\lambda_0)]가 하나 더 존재한다고 가정해 보자. 이러한 고유값을 [math(\mu_0)]라고 표기하자. 즉, [math(Fv_{\mu_0} = 0)]라고 가정하자. [math(E^{s + 1} v_{\mu_0} = 0)]라고 가정하자. 이런 게 존재한다면 지금 다루고 있는 리 대수는 [math((v_{\lambda_0 + 0}, v_{\lambda_0 + 2}, \cdots, v_{\lambda_0 + 2r}))]와 [math((v_{\mu_0 + 0}, v_{\mu_0 + 2}, \cdots, v_{\mu_0 + 2s}))] 이렇게 둘로 쪼개서 얻은 벡터 공간들 각각에 독립적으로 리 대수의 표현으로 작용이 된다는 것을 알 수 있다. 이는 앞서 가정한 기약 표현 가정과 모순이다. 따라서 [math(\lambda_0)] 같은 것은 하나만 있어야 한다. 한편 [math(\lambda_0 + 2i)] ([math(i = 0, 1, 2, \cdots)])와 같은 꼴이 아닌 고유값 [math(\mu)]가 만약 존재한다면 앞에서 설명했던 방식에 의하여 [math(F^j v_\mu = 0)]인 자연수 [math(j)]가 존재해야 하며 이는 곧 [math(Fv_{\mu - 2j + 2} = 0)]를 의미하여 (물론 [math(F)]가 잘 정의되어 있기에 [math(\mu - 2, \mu - 4, \cdots, \mu - 2j + 2)]들 역시 고유값이다) 모순을 만든다. 따라서 [math(H)]의 고유값은 [math(\lambda, \lambda + 2, \lambda + 4, \cdots, \lambda + 2r)] 뿐임을 알 수 있다. 같은 방식으로 각 고유값에 해당하는 고유벡터는 (스칼라 곱에 의한 차이를 무시했을 때) 하나 뿐이라는 것을 알 수 있다. 만약 존재한다면 앞에서 보인 방식으로 지금 표현이 분해가 가능하다는 것을 보일 수 있기 때문이다. 추가로 행렬의 크기를 [math((n + 1) \times (n + 1))]로 잡았기에 [math(r = n)]라는 것을 알 수 있다.
이제 [math(\lambda_0, e_\lambda, f_\lambda)]가 어떤 값을 가질 수 있는지를 살펴 보자. 그 전에 먼저 [math(v_{\lambda_0}, v_{\lambda_0 + 2}, \cdots, v_{\lambda_0 + 2n})]를 잘 세팅해 보자. 각 자연수 [math(m)]에 대하여 [math(E^m v_{\lambda_0})]는 [math(v_{\lambda_0 + 2m})]의 스칼라 배이다. 게다가 각 [math(m)]에 대해 [math(v_{\lambda_0 + 2m})]는 (스칼라 배수를 무시했을 때) 유일하다. 따라서 [math(v_{\lambda_0 + 2m})] 대신 [math(E^m v_{\lambda_0})]를 갖다 놔도 별 문제가 없다는 것이다. 물론 [math(H, E, F)]의 행렬 표현이 좀 달라지겠지만 이 새로운 표현도 결국 처음 표현과 똑같은 표현이기에 ([math(H \to AHA^{-1})] 등으로 바뀐 것일 뿐이기에) 상관 없다. 다만 [math(E^m v_{\lambda_0})] 대신에 [math(v_m = a_m E^m v_{\lambda_0})]으로 교체하기로 한다. 여기서
[math(a_m = \frac{1}{\sqrt{m! (-\lambda_0)(-\lambda_0 - 1)(-\lambda_0 - 2) \cdots (-\lambda_0 - m + 1)}})]
로 정하겠다.[25] 그러면
[math(\frac{a_{m + 1}}{a_m} = \frac{1}{\sqrt{(m + 1)(-\lambda_0 - m)}})]
임을 이용하여 일단 다음을 얻는다.
[math(Hv_m = (\lambda_0 + 2m) v_m, \;\; Ev_m = \sqrt{(m + 1)(-\lambda_0 - m)} v_{m + 1}.)]
한편, 0이 아닌 [math(m)]에 대하여
[math(Fv_m = FE \left( \frac{1}{\sqrt{m(-\lambda_0 - m + 1)}} v_{m - 1} \right) = \frac{1}{\sqrt{m(-\lambda_0 - m + 1)}} (EF - [E, F]) v_{m - 1})]
[math(\;\;\;\;\;\;\; = \frac{1}{\sqrt{m(-\lambda_0 - m + 1)}} (EFv_{m - 1} - Hv_{m - 1}))]
[math(\;\;\;\;\;\;\; = \frac{1}{\sqrt{m(-\lambda_0 - m + 1)}} (EFv_{m - 1} - (\lambda_0 + 2m - 2)) v_{m - 1})]
임을 알 수 있는데, [math(m = 1)]이면 [math(Fv_{m - 1} = Fv_{\lambda_0} = 0)]임을 통해 위 식을 바로 계산할 수 있는 등, 수학적 귀납법을 통해 다음을 알 수 있다.
[math(Fv_m = \sqrt{m(-\lambda_0 - m + 1)} v_{m - 1} \;\;\; (m > 0, F v_0 = 0).)]
이 결과는 만약 [math(\lambda_0)]가 정해져 있다면 [math(H, E, F)]의 행렬 표현이 위의 식들에 의하여 유일하게 결정된다는 것을 말해준다. 마지막으로 [math(E^{n + 1} v_{\lambda_0} = 0)] 혹은 [math(Ev_n = 0)]을 이용해 다음 결과를 얻을 수 있다.
[math((\lambda_0 + 2n) v_n = Hv_n = (EF - FE) v_n = EF v_n = E \left( \sqrt{n(-\lambda_0 - n + 1)} v_{n - 1} \right))]
[math(\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\; = \sqrt{n(-\lambda_0 - n + 1)} (\sqrt{((n - 1) + 1)(-\lambda_0 - (n - 1))} v_n))]
[math(\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\; = \left( -n\lambda_0 - n(n -1) \right) v_n.)]
따라서, [math(\lambda_0 + 2n = -n \lambda_0 - n(n - 1))]를 얻게 되는데, 이는 항상 만족되어야 하는 식이고, 그러기 위해선 [math(\lambda_0 = -n)]이어야 함을 알 수 있다. 결국 [math(\lambda_0)]도 각 (0을 포함한) 자연수 [math(n)]에 대하여 유일하게 결정됨을 알 수 있다. 즉, 각 [math(n = 0, 1, 2, \cdots)]에 대하여 [math((n + 1) \times (n + 1))]-행렬로 쓰여지는 가능한 [math(o(3))]의 기약 표현은 (similar matrix 관계에 있는 표현들을 같은 걸로 치면) 유일하며, 그 결과는 위에서 구해진 식들, 즉
[math(Hv_m = \left( -n + 2m \right) v_m \;\; (m = 0, 1, 2, \cdots, n), )]
[math(Ev_m = \sqrt{(m + 1)(n - m)} v_{m + 1} \;\; (m = 0, 1, 2, \cdots, n - 1), \;\; Ev_n = 0, )]
[math(Fv_m = \sqrt{m(n - m + 1)} v_{m - 1} \;\; (m = 1, 2, \cdots, n), \;\; Fv_0 = 0)]
로 정해진다. 또한 앞서 언급했듯이 기약 표현이 아닌 다른 표현들은 적당한 기약 표현들의 결합으로 표현이 가능하다. 따라서 모든 표현을 구한 셈이다.
이 이론은 리 이론의 가장 기본이 되는 내용 중 하나이다. 사실 [math(H, E, F)]의 선형 결합들로 이루어진 공간은 잘 정의된 리 대수이고, 이 리 대수는 [math(sl(2))]로 표현된다. 이 리 대수는 단순 리 대수(simple Lie algebra)들 중 가장 작은 것이며, 이 리 대수로부터 모든 단순 리 대수에 대한 이론이 출발한다. 물론 맨 위의 관계를 봤을 때 [math(o(3))]와 [math(sl(2))]는 완전히 똑같은 리 대수이다.[26] 결과적으로 [math(o(3))]의 모든 표현을 구한 것이고, 이로부터 [math(O(3))]의 모든 표현을 구한 셈이다.
이제부터 각 [math(n)]에 해당하는 기약 표현에 대해 [math(s = \frac{n}{2})]를 부여하겠다. [math(s = 1)]인 경우는 우리에게 이미 친숙한 결과이다. 이 경우 행렬 표현은 다음과 같다.
[math(H = \left( \begin{array}{rrr} -2 \;\; && 0 \;\; && 0 \\ 0 \;\; && 0 \;\; && 0 \\ 0 \;\; && 0 \;\; && 2 \end{array} \right), \;\; E = \left( \begin{array}{rrr} 0 \;\; && 0 \;\; && 0 \\ \sqrt{2} \;\; && 0 \;\; && 0 \\ 0 \;\; && \sqrt{2} \;\; && 0 \end{array} \right), \;\; F = \left( \begin{array}{rrr} 0 \;\; && \sqrt{2} \;\; && 0 \\ 0 \;\; && 0 \;\; && \sqrt{2} \\ 0 \;\; && 0 \;\; && 0 \end{array} \right).)]
[math([H, E] = 2E, [H, F] = -2F, [E, F] = H)]를 간단하게 확인할 수 있다. 한편, [math(J_1' = \frac{1}{2} (E + F), J_2' = \frac{1}{2i} (E - F), J_3' = \frac{1}{2} H)]로 두면 이들은 다음과 같음을 알 수 있다.
[math(J_1' = \left( \begin{array}{rrr} 0 \;\; && \frac{1}{\sqrt{2}} \;\; && 0 \\ \frac{1}{\sqrt{2}} \;\; && 0 \;\; && \frac{1}{\sqrt{2}} \\ 0 \;\; && \frac{1}{\sqrt{2}} \;\; && 0 \end{array} \right), \;\; J_2' = \left( \begin{array}{rrr} 0 \;\; && \frac{1}{\sqrt{2}} i \;\; && 0 \\ -\frac{1}{\sqrt{2}} i \;\; && 0 \;\; && \frac{1}{\sqrt{2}} i \\ 0 \;\; && -\frac{1}{\sqrt{2}} i \;\; && 0 \end{array} \right), \;\; J_3' = \left( \begin{array}{rrr} -1 \;\; && 0 \;\; && 0 \\ 0 \;\; && 0 \;\; && 0 \\ 0 \;\; && 0 \;\; && 1 \end{array} \right).)]
그리고
[math(A = \left( \begin{array}{rrr} \frac{1}{\sqrt{2}} \;\; && 0 \;\; && -\frac{1}{\sqrt{2}} \\ \frac{i}{\sqrt{2}} \;\; && 0 \;\; && -\frac{i}{\sqrt{2}} \\ 0 \;\; && 1 \;\; && 0 \end{array} \right))]
라 두자. 그러면 [math(J_i = AJ_i'A^{-1})]는 각각 다음과 같게 된다.
[math(J_1 = \left( \begin{array}{rrr} 0 \;\; && 0 \;\; && 0 \\ 0 \;\; && 0 \;\; && -i \\ 0 \;\; && i \;\; && 0 \end{array} \right), \;\; J_2 = \left( \begin{array}{rrr} 0 \;\; && 0 \;\; && i \\ 0 \;\; && 0 \;\; && 0 \\ -i \;\; && 0 \;\; && 0 \end{array} \right), \;\; J_3 = \left( \begin{array}{rrr} 0 \;\; && -i \;\; && 0 \\ i \;\; && 0 \;\; && 0 \\ 0 \;\; && 0 \;\; && 0 \end{array} \right).)]
리 군 이론에 어느 정도 익숙한 사람이라면 이 행렬들이 익숙할 것이다. 만약 [math(U_i = \exp{(iJ_i \theta)})]를 계산한다면 다음을 얻을 것이다.
[math(U_1 = \left( \begin{array}{rrr} 1 \;\; && 0 \;\; && 0 \\ 0 \;\; && \cos{\theta} \;\; && \sin{\theta} \\ 0 \;\; && -\sin{\theta} \;\; && \cos{\theta} \end{array} \right), \;\; U_2 = \left( \begin{array}{rrr} \cos{\theta} \;\; && 0 \;\; && -\sin{\theta} \\ 0 \;\; && 1 \;\; && 0 \\ \sin{\theta} \;\; && 0 \;\; && \cos{\theta} \end{array} \right), \;\; U_3 = \left( \begin{array}{rrr} \cos{\theta} \;\; && \sin{\theta} \;\; && 0 \\ -\sin{\theta} \;\; && \cos{\theta} \;\; && 0 \\ 0 \;\; && 0 \;\; && 1 \end{array} \right).)]
정확하게 각 축에 대한 회전 변환을 나타내는 행렬들이다. 이런 식으로 [math(O(3))]의 3차원([math(s = 1)]인 경우)에서의 표현은 우리가 잘 아는 3차원 벡터 공간의 회전 변환으로 나타내어진다는 것을 알 수 있다.
위와 같이 괜히 어려운 것 같은 (...) 설명이 필요한 이유는 맨 위에서 설명했었다. 로런츠 변환의 종류를 알고 싶다면 로런츠 군의 표현 방법들을 모두 알아야 한다는 것이었다. 지금은 로런츠 변환보다 간단한 경우인 [math(O(3))]의 경우부터 다룬 것이다. 그리고 지금까지 다룬 결과에 따르면 우리가 아는 뉴턴 역학의 3차원 벡터들에 대한 관성 좌표계 변환이 [math(O(3))]의 표현들 중 [math(s = 1)]에 해당하는 표현으로 설명됨을 보았다. 한편, 텐서 곱(tensor product)[27]와 클렙시-고든 계수(Clebsch-Gordon coefficient)[28] 등을 이용하여 3차원에서의 텐서, 즉 회전 변환 행렬 [math(U)]에 대하여
[math(T_{r_1 r_2 \cdots r_m} \to \sum_{s_i} U_{r_1 s_1} U_{r_2 s_2} \cdots U_{r_m s_m} T_{s_1 s_2 \cdots s_m})]
와 같이 변환하는 물리량[29]들도 얻을 수 있게 된다. 물론 가장 간단한 스칼라의 경우는 [math(s = 0)]인 경우고.
그런데 위와 같은 방식으로 얻은 물리량들은 모두 [math(s)]가 정수인 표현으로 그 변환이 나타내어지는 물리량들이다. 스칼라([math(s = 0)])도 그렇고 벡터([math(s = 1)])도 그렇고 클렙시-고든 계수를 동원하여 조사해 보면 모든 텐서들에 쓰이는 표현은 [math(s)]가 정수인 경우 뿐임을 알 수 있다. 하지만 [math(s = \frac{n}{2})]의 [math(n)]은 짝수 뿐만 아니라 홀수까지 모두 가능한 값이다. 즉, [math(s)]가 (정수가 아닌) 반정수인 표현으로 나타내는 물리량은 없는 걸까?
이 질문을 최초로 생각해낸 사람이 바로 볼프강 파울리였다. 그는 [math(O(3))]의 표현들을 조사하면서 위와 같은 상황에 봉착한 것이다. 사실 위에서 쭉 설명한 내용들은 웬만한 학부 양자역학 교재에 실려 있는 각운동량 연산자들의 표현에 대한 설명이기도 하다. 실제로 그 내용과 거의 닮아 있음을 알 수 있다.[30] 이 연산자들의 교환자들이 신기하게도 [math(J_i)]들의 리 괄호 연산에 의한 관계와 똑같기 때문이다.[31] 3차원 슈뢰딩거 방정식을 해석적(analytic)으로 풀 때에는 [math(s)]가 정수인 표현에 해당하는 물리량만 나타난다는 것을 알 수 있고, 이는 양자역학 교재에도 잘 설명이 되어 있는 사실이다. 그런데 각운동량 연산자들만 놓고 위와 같이 대수적으로 접근하면 새로운 표현들이 가능하다는 것을 파울리는 눈여겨 본 것이다. 물론 그 수학적인 결과야 이미 오래 전에 밝혀진 것이긴 하지만 물리에 구체적으로 적용된 것은 파울리가 처음 시도한 것인 셈이다. 파울리는 이리저리 표현들을 뒤적인 결과로 어떤 새로운 종류의 각운동량이 있을 것이라고 예언했다. 소위 반정수 스핀이 그것이다. 그리고 이 예언은 그 유명한 슈테른-게를라흐 실험(Stern-Gerlach experiment)에 의하여 맞다는 것이 밝혀지게 된다. 즉, 반정수 스핀이 실재한다는 것을 발견한 것이다. 다르게 말하자면 [math(s)]가 반정수인 표현으로 변환이 되는 물리량이 존재한다는 것이 밝혀진 것이다.
5.3. 로런츠 군 표현하기
위에서 [math(O(3))]의 표현을 길게 다뤘었다. 그리고 반정수 스핀의 존재가 예언된다는 것까지 봤었다. 하지만 비상대론적인 상황에서나 [math(O(3))]만 고려해도 되는 것이지 진정한 물리 법칙이라면 [math(O(3))] 군이 아니라 로런츠 군의 지배를 받는 것이기에 [math(O(3))]가 아니고 로런츠 군의 표현을 다뤄야 하는 것이었다. 그럼 [math(O(3))]는 왜 다뤘나 싶을텐데, 사실 [math(O(3))]의 표현은 로런츠 군의 표현을 이해하는 데 있어서 매우 중요한 역할을 한다.위에서 했던 것처럼 로런츠 군에 대응하는 로런츠 대수를 추상화할 것이다. 이미 위에서 로런츠 대수를 찾았다. 로런츠 대수는 다음 리 괄호 식들로 정의가 된다.
[math(\displaystyle [J_l, J_m] = i\sum_{n = 1}^3 \epsilon_{lmn} J_n, \;\; [K_l, K_m] = -i\sum_{n = 1}^3 \epsilon_{lmn} J_n, \;\; [J_l, K_m] = i\sum_{n = 1}^3 \epsilon_{lmn} K_n.)]
참고로 다음 내용들에서 [math(J^{\mu \nu})]를 이용한 식을 쓸 일은 없을 것이다.
로런츠 대수의 기본적인 성질을 가지고 있으니, 이제 할 일은 추상화이다. 즉, 차원이 6이라는 것과 어떤 기저 [math((J_1, J_2, J_3, K_1, K_2, K_3))]가 존재해 위와 같은 리 괄호 관계를 갖는다는 사실만 제외하고 로런츠 대수에 관한 모든 정보를 싸그리 잊어버리는 것이다. 이제부터 우리는 위에서 얻은 [math(J_n, K_n)]의 행렬 꼴을 모르는 것이다. 이 추상화로부터 로런츠 대수와 로런츠 군의 모든 표현을 얻을 수 있는 것이다. 그리고 나중에 이 표현들 중 하나로부터 잊어버린 [math(J_n, K_n)]의 행렬 꼴을 다 복원할 것이다.
여기서는 이 새로운 대수를 거치기보다 바로 복소수 영역으로 로런츠 대수를 확장하려고 한다. 다음을 정의하자.
[math(A_n = \frac{1}{2} (J_n + iK_n), \;\; B_n = \frac{1}{2} (J_n - iK_n).)]
그러면 다음이 성립한다는 것을 계산해 볼 수 있다.
[math(\displaystyle [A_l, A_m] = i\sum_{n = 1}^3 \epsilon_{lmn} A_n, \;\; [B_l, B_m] = i\sum_{n = 1}^3 \epsilon_{lmn} B_n, \;\; [A_l, B_m] = 0.)]
이렇게 해 놓으니 복소수 영역에서 로런츠 대수는 정확하게 [math(o(3))] 대수 두 개로 쪼개진다는 것을 알 수 있다. 복소수 영역에서 [math(o(3))]와 [math(sl(2))]가 같다고 했으니, 결국 로런츠 대수를 복소수 영역으로 확장시킨 것은 [math(sl(2) \oplus sl(2))]와 같다. 여기서 [math(\oplus)]는 두 공간([math(sl(2))] 둘)이 붙어 있되, 서로 영향을 주지 않고 독립적으로 있는 채로 붙어 있다는 것을 말한다. 자세한 것은 direct sum을 찾아볼 것. 그냥 순서쌍의 집합인데 덧셈과 스칼라 곱에 대해서 벡터처럼 굴고 다른 성분들끼리의 리 괄호 연산은 항상 0으로 정해진다는 걸로만 알면 된다. 즉, [math(sl(2) \oplus sl(2))]의 원소들을 [math((X, Y))]로 표현하겠다는 것이다.
어쨌든 우리가 이미 그 표현을 완전히 다 아는 리 대수로 로런츠 대수를 표현할 수 있다. 우리의 목표는 로런츠 대수의 모든 표현들을 구하는 것이다. 그런데 리 대수 이론에 따르면 두 단순 리 대수를 저렇게 [math(\oplus)]로 붙여서 만든 대수의 모든 기약 표현(irreducible representation)은 처음 두 단순 리 대수 각각의 어떤 기약 표현들을 텐서 곱을 하여 만든 표현과 똑같다는 것이다.[32] 식으로 쓰자면, 각 단순 리 대수의 어떤 기약 표현들 [math(V_1, V_2)]가 존재하여 [math(V_1 \otimes V_2)]와 같다는 것이다. 텐서 곱은 그냥 벡터들을 '무식하게 성분들끼리 다 곱한' 것으로 생각하면 된다. 예를 들어 [math(V_1)]의 원소 [math(a_1 v_1 + a_2 v_2)]와 [math(V_2)]의 원소 [math(b_1 w_1 + b_2 w_2)](단 [math(a_1, a_2, b_1, b_2)]는 스칼라)에 대해 이런 원소를 생각할 수 있다.
[math((a_1 v_1 + a_2 v_2) \otimes (b_1 w_1 + b_2 w_2) )]
[math( = a_1 b_1 (v_1 \otimes w_1) + a_1 b_2 (v_1 \otimes w_2) + a_2 b_1 (v_2 \otimes w_1) + a_2 b_2 (v_2 \otimes w_2).)]
이런 식으로 성분들끼리 다 곱해서 만든 게 텐서 곱이다. 그리고 우리에게 필요한 텐서 곱은 [math(o(3))]의 두 표현을 텐서 곱한 것이다. 이때 [math(sl(2) \oplus sl(2))]에 들어있는 임의의 원소 [math((X, Y))]에 대해 다음이 성립한다고 정의가 된다.
[math((X, Y)(v \otimes w) = (Xv) \otimes w + v \otimes (Yw).)]
이런 텐서 곱으로 로런츠 대수, 곧 로런츠 군의 모든 표현을 기술할 수 있는 것이다. 위에서 설명했듯이 로런츠 군의 표현을 분류한다는 것은 물리량이 어떤 종류를 가질 것인가를 분류하는 작업과 같다고 했다. 왜냐하면 모든 (의미 있는) 물리량은 어떤 로런츠 변환을 가질 것이고, 이는 곧 이 물리량이 로런츠 군 혹은 로런츠 대수의 한 표현으로 기술될 수 있다는 것을 의미하기 때문이다. 사실 뉴턴 역학에서는 이런 개념이 거의 없었다. 하지만 상대성 이론에서는 로런츠 변환에 의해 물리량이 꽉 잡히기 때문에 표현론 같은 수학 이론까지 동원하면서 어떤 물리량이 수학적으로 가능한가를 말할 수 있게 되는 것이다.
이제 할 일은 맨 처음에 다뤘던 4차원 시공간의 벡터들이 과연 로런츠 대수의 한 표현에 들어가는가를 확인해 보는 것이다. 그 전에 표기부터 정리하자. [math(sl(2) \oplus sl(2))]의 기약 표현은 항상 [math(sl(2))] 또는 [math(o(3))]의 두 표현을 텐서 곱하여 얻은 것과 같다고 했다. 이때 두 표현은 각각 반정수 [math(\frac{m}{2}, \frac{n}{2})]를 갖는다는 것을 알고 있다. 이로부터 로런츠 대수의 모든 기약 표현에 [math((\frac{m}{2}, \frac{n}{2}))]와 같이 번호를 붙일 수 있을 것이다. 한편 두 벡터 공간의 텐서 곱은 벡터 공간인데, 그 차원은 처음 두 벡터 공간들의 차원을 곱한 것과 같다. 따라서 표현 [math((\frac{m}{2}, \frac{n}{2})]의 차원은 [math((m + 1)(n + 1))]이다.
우리가 찾고자 하는 표현은 4차원 공간이다.[33] 따라서 가능한 기약 표현으로 [math((\frac{1}{2}, \frac{1}{2}))]와 [math((\frac{3}{2}, 0))], [math((0, \frac{3}{2}))]를 생각할 수 있다. 하지만 [math(m \ne n)]인 경우는 실수로 표현되기 어렵다.[34] 따라서 가능한 경우는 [math((\frac{1}{2}, \frac{1}{2}))]이다. [math(o(3))]의 경우와 뭔가 달라 보이지만...
이제 할 일은 이 표현으로부터 [math(J_n, K_n)] 행렬들을 복원시키는 것이다. 먼저 [math(sl(2) \oplus sl(2))]의 [math(H, E, F)]에 해당하는 것들부터 생각해 보자. 이 리 대수에 [math(sl(2))]가 두 개 들어 있으니 [math(H, E, F)]도 두 개 들어있을 것이다. 이들 중 앞의 [math(sl(2))]에 들어있는 것은 [math((H, 0), (E, 0), (F, 0))]와 같이 쓸 수 있을 것이고 뒤의 [math(sl(2))]에 들어있는 것은 [math((0, H), (0, E), (0, F))]와 같이 쓸 수 있을 것이다. 그런데 저 위에서 [math(A_n, B_n)]를 정의하고 [math(sl(2) \oplus sl(2))]를 만든 과정을 생각하면 다음이 성립해야 할 것이다.
[math((H, 0) = 2A_3, \;\; (E, 0) = A_1 + iA_2, \;\; (F, 0) = A_1 - iA_2, )]
[math((0, H) = 2B_3, \;\; (0, E) = B_1 + iB_2, \;\; (0, F) = B_1 - iB_2.)]
따라서 [math((H, 0), (E, 0), (F, 0), (0, H), (0, E), (0, F))]의 행렬 표현들을 모두 얻으면 [math(A_n, B_n)]의 행렬 표현들을 모두 얻을 수 있을 것이고, 이로부터 [math(J_n, K_n)]의 행렬 표현들도 모두 얻을 수 있을 것이다.
한편 우리가 다루려는 표현은 [math((\frac{1}{2}, \frac{1}{2}))]이다. 이걸 다루려면 먼저 [math(o(3))]의 [math(s = \frac{1}{2})]에 해당하는 표현부터 알아야 한다. 이 표현에서 [math(H, E, F)]가 다음과 같은 행렬들로 쓸 수 있다는 것을 알고 있다.
[math(H = \left( \begin{array}{rr} -1 \;\; && 0 \\ 0 \;\; && 1 \end{array} \right), E = \left( \begin{array}{rr} 0 \;\; && 0 \\ 1 \;\; && 0 \end{array} \right), F = \left( \begin{array}{rr} 0 \;\; && 1 \\ 0 \;\; && 0 \end{array} \right).)]
사실 이렇게 써진다는 것은 어떤 (벡터 공간의) 기저 [math((v_1, v_2))]가 존재해 다음이 성립한다는 뜻이기도 하다.
[math(Hv_1 = -v_1, \;\; Hv_2 = v_2, \;\; Ev_1 = v_2, \;\; Ev_2 = 0, \;\; Fv_1 = 0, \;\; Fv_2 = v_1.)]
이제 이 벡터 공간 두 개의 텐서 곱을 생각해 보자. 이 텐서 곱이 로런츠 군의 [math((\frac{1}{2}, \frac{1}{2}))] 표현에 해당하는 공간이다. 이 벡터 공간의 기저 중 하나는 다음과 같다.
[math((v_1 \otimes v_1, v_1 \otimes v_2, v_2 \otimes v_1, v_2 \otimes v_2).)]
아까 이 텐서 곱으로 만들어진 공간에서 로런츠 군의 원소가 이 벡터에 어떻게 곱해지는가를 썼었다. 그 식을 통해, 예컨대 다음을 얻을 수 있다.
[math((H, 0)(v_1 \otimes v_1) = (Hv_1) \otimes v_1 + v_1 \otimes (0v_1) = -(v_1 \otimes v_1).)]
이런 식으로 다음을 계산할 수 있다.
[math((H, 0)(v_1 \otimes v_1) = -(v_1 \otimes v_1), \; (H, 0)(v_1 \otimes v_2) = -(v_1 \otimes v_2), )]
[math((H, 0)(v_2 \otimes v_1) = v_2 \otimes v_1, \;(H, 0)(v_2 \otimes v_2) = v_2 \otimes v_2.)]
그런데 이 계산 결과는 위와 같은 기저에서 [math((H, 0))]가 다음과 같은 행렬로 써진다는 것을 말해 준다.
[math((H, 0) = \left( \begin{array}{rrrr} -1 \;\; && 0 \;\; && 0 \;\; && 0 \\ 0 \;\; && -1 \;\; && 0 \;\; && 0 \\ 0 \;\; && 0 \;\; && 1 \;\; && 0 \\ 0 \;\; && 0 \;\; && 0 \;\; && 1 \end{array} \right).)]
같은 방법으로 [math((E, 0), (F, 0), (0, H), (0, E), (0, F))]의 행렬 꼴들을 모두 구할 수 있다. 정릐하면 다음과 같다.
[math((H, 0) = \left( \begin{array}{rrrr} -1 \;\; && 0 \;\; && 0 \;\; && 0 \\ 0 \;\; && -1 \;\; && 0 \;\; && 0 \\ 0 \;\; && 0 \;\; && 1 \;\; && 0 \\ 0 \;\; && 0 \;\; && 0 \;\; && 1 \end{array} \right), \;\; (E, 0) = \left( \begin{array}{rrrr} 0 \;\; && 0 \;\; && 0 \;\; && 0 \\ 0 \;\; && 0 \;\; && 0 \;\; && 0 \\ 1 \;\; && 0 \;\; && 0 \;\; && 0 \\ 0 \;\; && 1 \;\; && 0 \;\; && 0 \end{array} \right), \;\; (F, 0) = \left( \begin{array}{rrrr} 0 \;\; && 0 \;\; && 1 \;\; && 0 \\ 0 \;\; && 0 \;\; && 0 \;\; && 1 \\ 0 \;\; && 0 \;\; && 0 \;\; && 0 \\ 0 \;\; && 0 \;\; && 0 \;\; && 0 \end{array} \right), )]
[math((0, H) = \left( \begin{array}{rrrr} -1 \;\; && 0 \;\; && 0 \;\; && 0 \\ 0 \;\; && 1 \;\; && 0 \;\; && 0 \\ 0 \;\; && 0 \;\; && -1 \;\; && 0 \\ 0 \;\; && 0 \;\; && 0 \;\; && 1 \end{array} \right), \;\; (0, E) = \left( \begin{array}{rrrr} 0 \;\; && 0 \;\; && 0 \;\; && 0 \\ 1 \;\; && 0 \;\; && 0 \;\; && 0 \\ 0 \;\; && 0 \;\; && 0 \;\; && 0 \\ 0 \;\; && 0 \;\; && 1 \;\; && 0 \end{array} \right), \;\; (0, F) = \left( \begin{array}{rrrr} 0 \;\; && 1 \;\; && 0 \;\; && 0 \\ 0 \;\; && 0 \;\; && 0 \;\; && 0 \\ 0 \;\; && 0 \;\; && 0 \;\; && 1 \\ 0 \;\; && 0 \;\; && 0 \;\; && 0 \end{array} \right).)]
이제 이들 원소들과 [math(A_n, B_n)]의 앞에서 얻은 관계식을 통해 다음을 구할 수 있다.
[math(A_1 = \left( \begin{array}{rrrr} 0 \;\; && 0 \;\; && \frac{1}{2} \;\; && 0 \\ 0 \;\; && 0 \;\; && 0 \;\; && \frac{1}{2} \\ \frac{1}{2} \;\; && 0 \;\; && 0 \;\; && 0 \\ 0 \;\; && \frac{1}{2} \;\; && 0 \;\; && 0 \end{array} \right), \;\; A_2 = \left( \begin{array}{rrrr} 0 \;\; && 0 \;\; && \frac{i}{2} \;\; && 0 \\ 0 \;\; && 0 \;\; && 0 \;\; && \frac{i}{2} \\ \frac{-i}{2} \;\; && 0 \;\; && 0 \;\; && 0 \\ 0 \;\; && \frac{-i}{2} \;\; && 0 \;\; && 0 \end{array} \right), \;\; A_3 = \left( \begin{array}{rrrr} -\frac{1}{2} \;\; && 0 \;\; && 0 \;\; && 0 \\ 0 \;\; && -\frac{1}{2} \;\; && 0 \;\; && 0 \\ 0 \;\; && 0 \;\; && \frac{1}{2} \;\; && 0 \\ 0 \;\; && 0 \;\; && 0 \;\; && \frac{1}{2} \end{array} \right), )]
[math(B_1 = \left( \begin{array}{rrrr} 0 \;\; && \frac{1}{2} \;\; && 0 \;\; && 0 \\ \frac{1}{2} \;\; && 0 \;\; && 0 \;\; && 0 \\ 0 \;\; && 0 \;\; && 0 \;\; && \frac{1}{2} \\ 0 \;\; && 0 \;\; && \frac{1}{2} \;\; && 0 \end{array} \right), \;\; B_2 = \left( \begin{array}{rrrr} 0 \;\; && \frac{i}{2} \;\; && 0 \;\; && 0 \\ \frac{-i}{2} \;\; && 0 \;\; && 0 \;\; && 0 \\ 0 \;\; && 0 \;\; && 0 \;\; && \frac{i}{2} \\ 0 \;\; && 0 \;\; && \frac{-i}{2} \;\; && 0 \end{array} \right), \;\; B_3 = \left( \begin{array}{rrrr} -\frac{1}{2} \;\; && 0 \;\; && 0 \;\; && 0 \\ 0 \;\; && \frac{1}{2} \;\; && 0 \;\; && 0 \\ 0 \;\; && 0 \;\; && -\frac{1}{2} \;\; && 0 \\ 0 \;\; && 0 \;\; && 0 \;\; && \frac{1}{2} \end{array} \right).)]
마지막으로 다음을 구할 수 있다.
[math(J_1 = \left( \begin{array}{rrrr} 0 \;\; && \frac{1}{2} \;\; && \frac{1}{2} \;\; && 0 \\ \frac{1}{2} \;\; && 0 \;\; && 0 \;\; && \frac{1}{2} \\ \frac{1}{2} \;\; && 0 \;\; && 0 \;\; && \frac{1}{2} \\ 0 \;\; && \frac{1}{2} \;\; && \frac{1}{2} \;\; && 0 \end{array} \right), \;\; J_2 = \left( \begin{array}{rrrr} 0 \;\; && \frac{i}{2} \;\; && \frac{i}{2} \;\; && 0 \\ \frac{-i}{2} \;\; && 0 \;\; && 0 \;\; && \frac{i}{2} \\ \frac{-i}{2} \;\; && 0 \;\; && 0 \;\; && \frac{i}{2} \\ 0 \;\; && \frac{-i}{2} \;\; && \frac{-i}{2} \;\; && 0 \end{array} \right), \;\; J_3 = \left( \begin{array}{rrrr} -1 \;\; && 0 \;\; && 0 \;\; && 0 \\ 0 \;\; && 0 \;\; && 0 \;\; && 0 \\ 0 \;\; && 0 \;\; && 0 \;\; && 0 \\ 0 \;\; && 0 \;\; && 0 \;\; && 1 \end{array} \right), )]
[math(K_1 = \left( \begin{array}{rrrr} 0 \;\; && \frac{i}{2} \;\; && \frac{-i}{2} \;\; && 0 \\ \frac{i}{2} \;\; && 0 \;\; && 0 \;\; && \frac{-i}{2} \\ \frac{-i}{2} \;\; && 0 \;\; && 0 \;\; && \frac{i}{2} \\ 0 \;\; && \frac{-i}{2} \;\; && \frac{i}{2} \;\; && 0 \end{array} \right), \;\; K_2 = \left( \begin{array}{rrrr} 0 \;\; && \frac{-1}{2} \;\; && \frac{1}{2} \;\; && 0 \\ \frac{1}{2} \;\; && 0 \;\; && 0 \;\; && \frac{1}{2} \\ \frac{-1}{2} \;\; && 0 \;\; && 0 \;\; && \frac{-1}{2} \\ 0 \;\; && \frac{-1}{2} \;\; && \frac{1}{2} \;\; && 0 \end{array} \right), \;\; K_3 = \left( \begin{array}{rrrr} 0 \;\; && 0 \;\; && 0 \;\; && 0 \\ 0 \;\; && i \;\; && 0 \;\; && 0 \\ 0 \;\; && 0 \;\; && -i \;\; && 0 \\ 0 \;\; && 0 \;\; && 0 \;\; && 0 \end{array} \right).)]
저 위에서 구했던 행렬들과 한참 달라 보인다. 하지만 사실 똑같은 녀석들이다. 다음 행렬을 생각해 보자.
[math(A = \left( \begin{array}{rrrr} 0 \;\; && \frac{i}{\sqrt{2}} \;\; && \frac{-i}{\sqrt{2}} \;\; && 0 \\ \frac{i}{\sqrt{2}} \;\; && 0 \;\; && 0 \;\; && \frac{-i}{\sqrt{2}} \\ \frac{1}{\sqrt{2}} \;\; && 0 \;\; && 0 \;\; && \frac{1}{\sqrt{2}} \\ 0 \;\; && \frac{i}{\sqrt{2}} \;\; && \frac{i}{\sqrt{2}} \;\; && 0 \end{array} \right).)]
이제 방금 구한 [math(J_n, K_n)]들에 변환 [math(X \to AXA^{-1})]을 취해 보자. 예컨대 [math(J_1)] 대신에 [math(A J_1 A^{-1})]를 넣자는 것이다. 그러면 정확하게 다음을 얻는다.
[math(J_1 = \left( \begin{array}{rrrr} 0 \;\; && 0 \;\; && 0 \;\; && 0 \\ 0 \;\; && 0 \;\; && 0 \;\; && 0 \\ 0 \;\; && 0 \;\; && 0 \;\; && -i \\ 0 \;\; && 0 \;\; && i \;\; && 0 \end{array} \right), \;\; J_2 = \left( \begin{array}{rrrr} 0 \;\; && 0 \;\; && 0 \;\; && 0 \\ 0 \;\; && 0 \;\; && 0 \;\; && i \\ 0 \;\; && 0 \;\; && 0 \;\; && 0 \\ 0 \;\; && -i \;\; && 0 \;\; && 0 \end{array} \right), \;\; J_3 = \left( \begin{array}{rrrr} 0 \;\; && 0 \;\; && 0 \;\; && 0 \\ 0 \;\; && 0 \;\; && -i \;\; && 0 \\ 0 \;\; && i \;\; && 0 \;\; && 0 \\ 0 \;\; && 0 \;\; && 0 \;\; && 0 \end{array} \right), )]
[math(K_1 = \left( \begin{array}{rrrr} 0 \;\; && i \;\; && 0 \;\; && 0 \\ i \;\; && 0 \;\; && 0 \;\; && 0 \\ 0 \;\; && 0 \;\; && 0 \;\; && 0 \\ 0 \;\; && 0 \;\; && 0 \;\; && 0 \end{array} \right), \;\; K_2 = \left( \begin{array}{rrrr} 0 \;\; && 0 \;\; && i \;\; && 0 \\ 0 \;\; && 0 \;\; && 0 \;\; && 0 \\ i \;\; && 0 \;\; && 0 \;\; && 0 \\ 0 \;\; && 0 \;\; && 0 \;\; && 0 \end{array} \right), \;\; K_3 = \left( \begin{array}{rrrr} 0 \;\; && 0 \;\; && 0 \;\; && i \\ 0 \;\; && 0 \;\; && 0 \;\; && 0 \\ 0 \;\; && 0 \;\; && 0 \;\; && 0 \\ i \;\; && 0 \;\; && 0 \;\; && 0 \end{array} \right).)]
정확하게 맨 처음 로런츠 대수를 다룰 때 얻었던 행렬 꼴과 똑같다. 땨라서 [math((\frac{1}{2}, \frac{1}{2}))] 표현은 4차원 벡터에 해당하는 물리량들에 대응하는 표현인 것이다.
이런 식으로 4차원 벡터가 로런츠 군의 한 표현에 해당함을 알아내었다. 한편 표현 [math((\frac{m}{2}, \frac{n}{2}))]에서 [math(\frac{m}{2} + \frac{n}{2})]가 해당 물리량의 랭크와 같다는 것을 알 수 있다. 예를 들어 [math((0, 0))]의 경우 랭크는 0이고 이때 물리량은 스칼라이다. [math((\frac{1}{2}, \frac{1}{2}))]의 경우 랭크가 1인데, 이는 4차원 벡터에 해당하고 4차원 벡터의 랭크와 일치한다. 일반적으로 [math(\frac{m}{2} + \frac{n}{2})]가 정수인 표현들은 이 값을 랭크로 갖는 물리량들을 표현한다.
그런데 [math(\frac{m}{2} + \frac{n}{2})]가 정수가 아닌 반정수인 경우도 있다. 예를 들어 [math((\frac{1}{2}, 0))] 또는 [math((0, \frac{1}{2}))] 같은 경우도 있다. 이런 경우를 보면 랭크가 1/2인 물리량도 있는가 하는 질문을 던질 수 있다. 이는 [math(O(3))]의 표현을 이야기하면서 언급한 파울리의 질문과 직결되는 문제이고, 같은 이유로 이에 해당하는 물리량이 존재한다. 스피너가 바로 그것이다. 그런데 [math((\frac{1}{2}, 0))]에 해당하는 물리량, 사실 정확하게 말하자면 [math((\frac{1}{2}, 0) \oplus (0, \frac{1}{2}))]에 해당하는 물리량은 파울리의 생각과는 독립적인 방법으로 예언이 된 바가 있다. 디랙 방정식에서 다뤄지는 파동함수가 바로 그것이다. 요즘 말로 하자면 디랙 장에 해당하는 물리량이 [math((\frac{1}{2}, 0) \oplus (0, \frac{1}{2}))] 표현으로 기술된다는 것이다. 자세한 내용은 스피너와 디랙 방정식 문서 참조.
아무튼 이렇게 해서 로런츠 군의 표현으로부터 어떤 종류의 물리량이 가능한가를 모두 분류할 수 있었다. 스칼라, 벡터, 텐서 말고 다른 물리량이 존재하냐는 질문에는 스피너가 존재한다고 답할 수 있었고 또 얼마나 될까 하는 질문에는 표현론을 동원한 표현의 분류로부터 스칼라, 벡터, 텐서, 그리고 스피너가 전부라고 답할 수 있다. 한편 이 사실로부터 장(field)의 종류가 무엇이 있는가도 모두 분류가 될 수 있고, 여기서 양자장론이 출발하게 된다.
[1]
한국물리학회의 표준 용어집에 따라 Lorentz는 로런츠라고 표기하기로 했다. 또한 많이 쓰이는 '로렌츠 군'은 리다이렉트로 이 문서에 오도록 했다.
[2]
스칼라, 벡터가 여기에 포함되어 있다고 볼 수 있다.
[3]
편의 상 행렬이라고 하자.
[4]
이를 계량부호수(metric signature)이라고 한다. 천문학 등의 분야에서는 -1, 1, 1, 1로 주어지기도 하는데 계산할 때 헷갈리는 거 말고는 물리적으로 아무 상관 없다.
[5]
[math(A^T J A = J)]의 양변에 행렬식을 취해 보면 금방 알 수 있다.
[6]
성분 별로 편미분이 가능하다는 식으로 이해하면 된다.
[7]
[math((\Lambda)^0_0)]는 [math(\Lambda)]의 1행 1열 성분을 의미한다.
[8]
사실 여기에서의 (즉, 물리학자들이 쓰는) 표기에 따르면 연산 [math(\frac{1}{i} [A, B])]에 대해 닫혀 있다고 말해야 맞다. 다르게 말하자면 [math([A, B] = iC)]를 만족하는 원소 [math(C)]가 존재한다는 것이다. 수학자들은 그냥 [math([A, B])]에 대해 닫혀 있는 걸 흔히 말하는데, 여기서 수학자들과 물리학자들의 표기 방식이 차이가 난다는 것을 알 수 있다. 물론 단순한 변환만 취해 주면 대단한 것도 안 되는 일이지만...
[9]
미분기하학의 언어로는 원점에서의 접공간(tangent space)에 적당한 성질(left-invariance 같은 것)을 부여한 공간을 말한다.
[10]
그리고 위의 텐서와 같이 변하는 고전역학의 물리량도 있었다. 관성 모먼트 텐서가 바로 그것이다.
[11]
즉, 어떠한 단순 리 군 혹은 단순 리 대수를 만나도 이들은 이미 분류가 된 단순 리 군과 단순 리 대수들 중 하나(와 동형사상(isomorphism)을 가지고 있는 것)라는 것이다.
[12]
리 군과 리 대수는 서로 대응되는 관계에 있다. 정확하게는 리 군의 한 컴포넌트에 국한된 것이긴 하지만, 사실 상 그게 그거다. 어쨌든 이런 대응관계 때문에 리 군을 다룰 땐 상대적으로 더 다루기 쉬운 리 대수에서 문제를 푸는 경우가 많으며, 단순 리 군의 분류도 사실 단순 리 대수가 분류되는 것으로 이루어진 일이다.
[13]
Peskin의 An Introduction to Quantum Field Theory만 봐도 아래에 소개할 1/2-스피너를 다룬다. 더 일반적인, 그러니까 모든 표현을 알고 싶다면 Streater, Wightman의 PCT, Spin and Statistics, and that all(1964)에서 간략하게 확인할 수 있다. 하지만 구체적인 증명, 즉 가능한 표현을 모두 분류하는 문제는 훨씬 더 어렵다. 이미 리 대수의 영역이고 이건 대학원 과정이기 때문이다. 앞에서 소개한 책들도 대학원 과정에서나 읽을 수 있는 책들이긴 하지만 이건 수학의 영역이다. 즉, 이걸 제대로 이해하려면 물리학 대학원 과정과 수학 대학원 과정 모두를 알아야 한다. 물리학과들은 그냥 알기만 해도 좋을 듯. 정 알고 싶다면
#에서 참고하고 Bargmann의 Irreducible unitary representations of the Lorenz group(1946)을 읽으면 되겠다.
[14]
미리 이야기해 놓자면, [math(O(3))]는 단순 리 군들 중(물론 자명하지 않고(원소가 하나 뿐만 군이 아니고) Abelian이지 않은 것들 중)에서 가장 간단한 군이다. 정확하게는 [math(SL(2))]가 바로 그것인데, 이 두 군의 리 대수는 (복소 공간에서) 완전히 똑같다.
[15]
으아니, 왜 행렬로 지수를? [math(\exp{A})]는 일반적으로 [math(\sum_{n = 0}^\infty \frac{1}{n!} A^n)]로 정의된다. 이렇게 정의를 하면 행렬 뿐 아니라 많은 대수적 영역에서 exponential을 다룰 수 있다. 한편 행렬도 아닌 일반적인 리 군(다만 이때에는 일단 다양체이긴 해야 한다), 리 대수의 경우에는 벡터 흐름(vector flow)이란 것으로 이를 정의한다.
[16]
원래 수학에서는 [math(iA)]가 아닌 [math(A)]로 표현한다. 이 때문에 리 대수의 연산 구조마저 조금 바뀌게 된다. 적당한 치환을 해 주면 별 문제가 없기에 이런 차이가 대단한 문제를 일으키는 것은 아니다. 수학에서 다루는 표기와 물리에서 다루는 표기가 다르다는 것을 보여주는 한 예가 되겠다.
[17]
리 군은 기본적으로 위상공간인데, 일반적으로 위상공간은 연결되어 있지 않은 여러 컴포넌트들을 가질 수 있다. 대표적인 예로 determinant가 0이지 않은 [math(n \times n)]-행렬들을 모은 군이 그런데, 이 군은 determinant가 0보다 큰 영역과 0보다 작은 영역 두 개로 나눠지며, 이들은 연결되어 있지 않다.
[18]
3차원에서도 텐서가 정의된다. 예를 들어 관성 모먼트 텐서가 그것이다. 나중에 자세한 내용을 소개할 것이다.
[19]
이 상황에서 행렬 곱마저 없어지게 된다!
[20]
정확하게는 해당 리 군의 컴포넌트들 중 단위원을 포함한 컴포넌트에 대한 것만 해당된다. 하지만 컴포넌트들 간의 관계를 파악하는 것은 보통 매우 간단한 일이다.
[21]
이렇게 해서 얻은 행렬들을 가리켜 similar 행렬이라고 부른다. 이런 행렬들 중 어느 두 개 [math(X_1, X_2)]를 골라도 [math(X_2 = AX_1 A^{-1})]를 만족하는 어떤 행렬 [math(A)]가 존재한다. 이런 상황은 한 선형 연산을 행렬로 표현할 때 어떤 기저로 표현하느냐에 따라 그 결과가 다르다는 점에 기인한다. 이 문서에서 그런 미묘한(subtle) 문제는 생각하지 않기로 한다.
[22]
모든 리 대수에 대해서 이런 결과가 성립하는 것은 아니다. J. E. Humphreys의 Introduction to Lie Algebras and Representation theory 중 Chapter II, Section 6의 연습문제 5.(c)를 보자. 구체적인 예를 든 건 아니지만, 어쨌든.
[23]
행렬의 크기가 무한해지면 또 이야기가 달라진다. J. E. Humphreys의 같은 책에서 Chapter II, Section 7의 연습문제 7번을 보자.
[24]
순수 리 대수의 언어에서는 다소 복잡하다. 하지만 이런 단순한 케이스에서는 그렇게 어렵지 않다. 후술하겠지만 웬만한 학부 양자역학 교재에 다 나온다.
[25]
굳이 이런 복잡한 걸로 잡지 않아도 된다. 실제로 수학자들은 [math(a_m)]를 그냥 [math(1/m!)]로 보통 잡는다. (유리수 집합처럼 모든 스칼라 값에 제곱근이 정의되지 않는 일반적인 경우를 고려하면 더더욱 그래야 할 것이다.) 그럼에도 굳이 이렇게 잡는 이유는 [math(E)]와 [math(F)]가 서로 Hermite conjugate 관계에 있도록 하기 위해서이다.
[26]
단, 스칼라가 복소수 전체일 경우에 그렇다. 만약 스칼라를 실수로만 한정한다면 이런 주장을 할 수 없게 된다. 사실 우리에게 익숙한 그 회전을 다루고자 한다면 스칼라는 실수 뿐이어야 한다. 이런 것까지 고려하면 골치가 아파진다. 하지만 표현을 구하는 문제에서는 잠시 스칼라를 복소수 전체로 잡아 두고 이론을 전개해도 큰 문제는 없다.
[27]
두 공간 [math(V_1, V_2)]의 텐서 곱 [math(V_1 \otimes V_2)]를 말한다. 두 공간이 주어진 리 대수의 표현이라면 저 텐서 곱 역시 표현이 될 수 있다. 하지만 두 공간을 단순히 결합한 (direct sum으로 결합한) 것과는 다르다.
[28]
일반적으로 텐서 곱으로 만들어진 새로운 표현은 기약 표현이 아니다. 물론 기약 표현들의 결합(direct sum)으로 나타내어지긴 하는데, 구체적으로 어떻게 결합되어 있는지는 따로 조사해 봐야 한다. 클렙시-고든 계수는 그 결합 방식을 설명해 주는 방법 중 하나이다.
[29]
대표적인 예로 관성 모먼트 텐서가 있다.
[30]
다만 양자역학 교재들에서는 [math(H)]의 대각화를 이용하기보다 카시미르 연산자(Casimir operator)를 이용한다. 이 문서에서는 수학적인 방법을 따랐다.
[31]
우연은 아니다. 실제로 각운동량은 각도에 대한 정준켤레운동량(canonical conjugate momentum)에 해당하는 값인데, 이 연산자들은 각도를 더하는 연산자의 미소 변환과 자동으로 같게 되기 때문이다.
[32]
이에 대한 증명은 생략한다. 더 알고 싶다면 A. W. Knapp의 Representation theory of semisimple groups를 참고할 것.
[33]
사실 이보다 작은 차원의 여러 기약 표현들로 쪼개질 수도 있다. 예를 들어 랭크 2의 텐서들은 2개의 표현들의 결합으로 표현된다. 하지만 아래 내용에 따르면 다행히도 4차원 벡터는 쪼개지지 않는다.
[34]
예를 들어
위키피디아의 설명 참조. 실수로 표현이 되려면 [math((\frac{m}{2}, \frac{n}{2}) \oplus (\frac{n}{2}, \frac{m}{2}))]와 같이 대칭되는 다른 표현과 붙어야 한다. 반대칭 2-텐서와 디랙
스피너가 바로 그런 경우.