돌아보기
벡터공간은 집합으로서 원소끼리의 덧셈 연산이 주어져 있고, 각 원소에 상수를 곱하여 크기를 늘였다 줄였다 할 수 있는 상수곱 연산이 주어져 있다. 벡터공간의 원소를 곧은 화살표로 표현할 수 있을 때도 있지만, 원소가 그림으로 그리기 어려운 추상적인 대상인 경우가 많다. 주어진 벡터공간의 기저는 이 벡터공간의 부분집합으로서, 이 벡터공간의 다른 모든 원소를 덧셈과 상수곱으로 표현할 수 있게 해주는 가장 작은 부분집합이다. 기저를 고르면 벡터공간의 각 원소를 숫자들의 순서쌍, 즉 좌표로, 혹은 원한다면 화살표로도 나타낼 수 있다. 우리는 본 연재 시리즈를 통하여 주어진 벡터공간의 가능한 모든 기저들 중 표준적이라 부를 만한 좋은 기저가 있는지, 표준적이라는 말의 의미는 무엇인지에 대해 생각해보고 있다.
첫 번째 연재글([1])에서는 이 벡터공간에 원소끼리의 곱셈 구조가 주어져있는 상황, 즉 우리의 벡터공간이 대수algebra인 상황에서 이 표준기저 문제가 더 유의미하게 되며, 대수 구조에 더하여 추가적인 구조까지 주어져 있는 상황에서 표준기저에 관하여 더욱 풍부한 논의를 할 수 있다는 점을 살펴보았다. 두 번째 연재글([2])에서는 대수가 가질 수 있는 추가적인 구조의 대표적인 예로 범주화categorification을 소개하였다.
간단히 이야기하면, 범주category란 어떤 수학적 대상object들이 모여서 이루는 모임이며 이 대상들 서로간의 관계에 대한 정보까지를 포함한다. 예컨대 모든 벡터공간들을 다 모으고 그들간의 선형사상들까지 고려하면 하나의 범주를 이룬다. 어떤 범주 $\mathcal{C}$가 주어져있을 때, 서로 특정하게 관계된 대상들은 서로 같은 것으로 여기는 방식을 통하여 이 범주가 가진 정보를 단순화할 수 있는데, 이 단순화 과정의 결과로 어떤 대수 $A$가 얻어진다면, 우리는 범주 $\mathcal{C}$가 이 대수 $A$를 범주화한다고 말한다.
보통, 대수를 범주화하는 범주는 원래의 대수보다 더 깊은 구조와 정보를 가지고 있으며, 그러한 구조와 정보를 이용하여 원래 대수의 성질 중 대수 구조만 가지고서는 이해하기 어려웠던 성질을 규명할 수 있는 경우가 있다. 두 번째 연재글([2])에서 이러한 경우의 일환으로, 범주의 성질을 이용하여 대수의 표준기저를 얻어내는 방법론을 언급하였다. 특별히, 간단하지만 충분히 흥미로운 예시로서 다음의 대수에 대하여 이 방법을 적용하고자 했었으나, 다음 연재글을 기약하며 미뤄둔 바 있다:$$\mathbb{Q}[x] = \{{\mbox{변수 $x$에 관한 유리계수 다항식들}}\}.$$
이번 연재글에서는 지난 두 번째 연재글에서 약속한 대로, (‘큐엑스’라고 읽을 수 있는) 이 대수 $\mathbb{Q}[x]$의 표준기저를 범주화의 방법론을 통하여 얻어내보고자 한다. 즉 $\mathbb{Q}[x]$를 범주화하는 범주 $\mathcal{C}$ 하나를 소개하고, 이 범주 $\mathcal{C}$에 속하는 대상들 중 특별히 표준적인 것들을 살펴보며, $\mathcal{C}$를 단순화하여 $\mathbb{Q}[x]$를 얻어내는 과정에 이 대상들을 적용하여 $\mathbb{Q}[x]$의 표준기저를 얻을 것이다.
행렬의 연산, 그리고 에쓰엘투의 표현
우리는 이 범주 $\mathcal{C}$를 비교적 간단한 선형대수학의 개념들만 가지고 이해해보고자 한다. 이에 필요한 재료들은 지난 세 번째 연재글([3])에서 설명하였지만, 다시 한 번 간단히 상기해보자. 우선 행렬이란 숫자들을 직사각형 모양으로 배열한 것을 말하며, 각 가로줄을 행, 각 세로줄을 열이라고 부른다. 행의 개수가 $m$, 열의 개수가 $n$일 때 이 행렬을 크기가 $m\times n$인 행렬이라고 한다. 행렬의 $i$번째 행, $j$번째 열에 위치하는 숫자를 이 행렬의 $(i,j)$-번째 성분이라고 한다. 각 성분들은 숫자인데, 사실은 행렬의 성분으로 넣을 수 있는 숫자들이 무엇인지 처음부터 밝히고 시작해야 한다. 본 글에서는 복소수들을 성분으로 사용할 것이다.
선형대수학에서 배우는 기본 원리 중 하나는 행렬 한 개가 어떤 두 벡터공간 사이의 선형사상 한 개에 대응한다고 생각할 수 있다는 것이다. 따라서 행렬 하나만 가지고도 꽤 유의미한 이야기들을 할 수 있지만, 더욱 흥미로운 일은 여러 행렬들을 가지고 서로 연산을 행할 때 생겨난다. 기본적인 연산으로는 덧셈, 상수곱, 곱셈이 있다. 이 중 덧셈과 상수곱은 ‘성분별 연산’으로써 정의한다. 크기가 $m\times n$으로 같은 두 행렬 $A,B$와 복소상수 $c$가 있다고 하자. $A$의 각 $(i,j)$-성분을 $a_{ij}$, $B$의 각 $(i,j)$-성분을 $b_{ij}$로 표기하자. 이 때, 각 $(i,j)$-성분이 $a_{ij} + b_{ij}$로 주어지는 $m\times n$ 행렬을 우리는 $A+B$로 표기하고, 이 행렬을 $A$와 $B$를 더해서 얻어지는 행렬이라고 여긴다. 한편, 각 $(i,j)$-성분이 $c\cdot a_{ij}$로 주어지는 $m \times n$ 행렬을 $cA$로 표기하고, 이것을 $A$에 상수 $c$를 곱해서 얻어지는 행렬이라고 여긴다. 통상적으로 사용되는 행렬의 곱셈은 성분별 연산으로 주어지지 않고 다음과 같이 다소 복잡하게 정의되어 있다. 행렬 $A$와 행렬 $B$를 곱한 행렬 $AB$를 정의하려면 $A$의 열의 개수와 $B$의 행의 개수가 일치해야만 한다. 즉 $A$는 $m\times n$ 행렬, $B$는 $n\times k$ 행렬이어야만 하며, 이 때 곱행렬 $AB$는 크기가 $m \times k$이다. 행렬 $AB$의 각 $(i,j)$-번째 성분은 $A$의 $i$번째 행과 $B$의 $j$번째 열을 ‘내적’하여 얻어지는 값으로 정의되며, 이를 공식으로 써보면 $a_{i1} b_{1j} + a_{i2} b_{2j} + \cdots + a_{in} b_{nj}$이다.
우리가 가장 많이 사용할 행렬들은 행 개수와 열 개수가 같은 ‘정사각’ 행렬들, 즉 크기가 $n\times n$인 행렬들이다. 이들의 좋은 점은, 두 $n \times n$ 행렬들 $A,B$는 항상 서로 곱할 수 있으며 곱한 후에도 크기가 $n\times n$이라는 것이다. 하지만 $AB$와 $BA$가 항상 같지는 않으며, 이들이 얼마나 다른지를 측정하는 개념으로서 다음과 같이 행렬 교환자matrix commutator 연산을 정의할 수 있다:$$[A,B] = AB – BA.$$여기서 행렬들간의 뺄셈을 사용했는데, 뺄셈은 덧셈과 비슷하게 성분별 연산으로 직접 정의해도 되고, 우리가 이미 정의한 덧셈과 상수곱을 사용하여 이해할 수도 있다. 즉 $AB-BA$이라는 기호가 $AB+(-1)BA$를 의미한다고 여겨도 좋다. 이제 두 행렬 $A,B$가 서로 교환가능commutative할, 즉 $AB=BA$가 성립될 필요충분조건은 $A,B$의 교환자 $[A,B]$가 영행렬zero matrix, 즉 모든 성분이 $0$인 행렬과 같다는 것임을 관찰할 수 있다.
행렬 교환자 연산을 사용하여 우리는 지난 글([3])에서 에쓰엘투($\mathfrak{sl}_2$)의 표현이라는 개념을 정의하였다. 어떤 자연수 $n$에 대하여, 크기가 $n\times n$인 행렬 세 개의 순서쌍 $(H,E,F)$이 다음의 세 방정식을 모두 만족할 경우, 이 순서쌍을 에쓰엘투의 표현이라고 부르고, $n$을 이 표현의 차원이라고 부른다:$$[H,E] = 2E, \qquad [H,F] = -2F, \qquad [E,F] = H.$$에쓰엘투의 표현 $(H,E,F)$의 예시를 찾아보기로 하자. 우선 $n=1$인 경우, 즉 $1$차원의 예시를 찾아보기로 하면, 1차원 행렬들간의 교환자는 항상 영행렬이므로, 답은 다소 허무하게도 $$H = (0), \qquad E = (0), \qquad F = (0)$$밖에 없음을 알 수 있다.
에쓰엘투의 표현 중 가장 중요하고 근본적인 예시는 $n=2$인 경우의 다음의 $2$차원 표현이다:$$H = \left( \begin{array}{cc} 1 & 0 \\ 0 & -1 \end{array} \right), \qquad E = \left( \begin{array}{cc} 0 & 1 \\ 0 & 0 \end{array} \right), \qquad F = \left( \begin{array}{cc} 0 & 0 \\ 1 & 0 \end{array} \right).$$아래는 $n=3$인 경우의 3차원 표현의 예시이다:$$H = \left( \begin{array}{ccc} 2 & 0 & 0 \\ 0 & 0 & 0 \\ 0 & 0 & -2 \end{array} \right), \qquad E = \left( \begin{array}{ccc} 0 & 2 & 0 \\ 0 & 0 & 1 \\ 0 & 0 & 0 \end{array} \right), \qquad F = \left( \begin{array}{ccc} 0 & 0 & 0 \\ 1 & 0 & 0 \\ 0 & 2 & 0 \end{array} \right).$$각 차원마다 에쓰엘투의 표현이 유일한 것은 아니다. 예컨대 $n=2$일때, $H,E,F$가 모두 $2\times 2$ 영행렬인 경우도 에쓰엘투의 2차원 표현을 이룬다. 낮은 차원들에서 에쓰엘투 표현의 예시들을 독자들이 직접 찾아보기를 권한다.
지난 연재 글([3])에서는, 위와 같이 행렬 방정식의 해로서 정의된 에쓰엘투의 표현이라는 개념이 실은 에쓰엘투($\mathfrak{sl}_2$)라고 불리는 어떤 하나의 수학적 대상이 자신을 여러 가지 방식으로 드러내는 것임을 살펴보았다. 또한, 꽤나 간단하게 정의되는 이 에쓰엘투라는 대상이 필자를 포함한 수많은 연구자들에게 그간 오랫동안, 그리고 앞으로도 오랫동안 풍부한 연구 거리를 제공해준다는 사실도 언급하였다.
범주 $\mathcal{C}$
이제, 범주 $\mathcal{C}$를 다음과 같이 정의하자:$$\mathcal{C} = \mbox{에쓰엘투의 표현들이 모두 모여 이루는 범주}.$$사실 범주를 정의할 때에는, 범주를 이루는 대상object들이 무엇인지 기술하는 것 외에도 대상들을 서로 관계지어주는 대상들 간의 모피즘morphism들을 정의하거나 기술하는 것이 핵심이다. 여기서 범주의 모피즘은, 일반적으로는 모종의 공리에 맞기만 하면 임의로 정의해도 되는 다소 추상적이고 유동적인 개념이다. 다만, 널리 쓰이는 범주에서는 널리 통용되는 자연스러운 정의를 사용하곤 한다. 범주의 대상들이 어떠한 구조를 가진 집합들인 경우에, 임의의 (서로 같을 수도 있는) 두 대상들에 대하여, 첫 번째 대상에서 두 번째 대상으로의 모피즘은 두 집합들 간의 사상 (즉, 함수) 중 주어진 구조를 보존하는 사상으로 정의하는 것이 자연스럽다. 즉, 그러한 구조 보존 사상 각각을 모피즘이라고 부르겠다는 것인데, 일반적으로는 첫째 대상에서 둘째 대상으로의 모피즘은 꼭 한 개만 있지 않고 아예 없거나 여러개일 수 있다. 범주는 각 대상에서 각 대상으로의 모든 모피즘들, 나아가 그들이 서로 ‘합성’되는 양상을 품고 있는 개념으로 이해할 수 있다. 참고로, 현재 대한수학회 용어집 기준으로는 범주의 모피즘이 ‘사상’으로 번역되어 있는데, 모피즘이 항상 집합 간의 함수 형태로 주어지지는 않을 수 있기에, 이번 글에서는 모피즘으로 부르고 있다. 언젠가 모피즘을 대체할 만한 우리말 용어가 등장하기를 바라본다.
모피즘이라는 개념의 의미를 살펴보기 위해, 우리의 범주 $\mathcal{C}$의 모피즘들을 살펴보기에 앞서 좀 더 쉬운 범주의 예시로 모든 벡터공간들이 모여 이루는 범주를 생각해 보자. 벡터공간 $V$에서 벡터공간 $W$로의 모피즘은 무엇이라고 정의하는 것이 좋은가? 통상 벡터공간들이 모여 이루는 범주를 다룰 때에는, 사상 $V\to W$ 중 벡터공간 구조를 보존하는 사상, 즉 선형사상linear map을 $V$에서 $W$로의 모피즘이라고 정의한다. 이렇게 정의된 범주를 $\mathcal{D}$라고 하면, 이 범주 $\mathcal{D}$는 모든 벡터공간들, 그리고 임의의 두 벡터공간 사이의 모든 선형사상들을 담고 있는 하나의 정보 묶음으로 이해할 수 있다. 그러면 선형대수학적인 성질과 질문들을 이렇게 정의된 범주 $\mathcal{D}$의 범주론적인 성질과 질문들로 번역할 수 있게 된다. 반면, 모든 벡터공간들을 다 모아서 범주를 정의하되, 이번에는 벡터공간 $V$에서 벡터공간 $W$로의 모피즘을 집합 간의 사상 $V\to W$, 즉 선형일 필요가 없는 아무 함수라고 정의해볼 수도 있다. 이렇게 얻어지는 새로운 범주 $\mathcal{E}$는 모든 벡터공간들, 그리고 임의의 두 벡터공간 사이의 모든 (집합 간) 사상들을 품고 있는 정보 묶음이 된다. 언뜻 보면 범주 $\mathcal{E}$가 범주 $\mathcal{D}$보다 더 많은 정보를 품고 있으므로 만약 범주 $\mathcal{E}$에 대해서 무언가를 알고 있다면 결과적으로는 범주 $\mathcal{D}$에 대해서도, 즉 선형대수학에 대해서도 무언가를 알게 되지 않겠느냐고 생각할 수도 있겠지만, 꼭 그렇지만은 않다.
모피즘의 중요성을 이해하기 위하여 비수학적인 예시를 생각해보기로 한다. 모든 사람들을 다 모아서 범주 $\mathcal{F}$를 구성하자. 즉 $\mathcal{F}$의 각 대상object은 사람 한 명이다. 사람 $\alpha$에서 사람 $\beta$로의 모피즘은 $\alpha$가 $\beta$에게 준 적 있는 선물이라고 하자. 특별히, 이 예시에서는 모피즘이 집합 간의 사상으로 주어지지 않는다! (비수학적 예시이므로, 이 범주가 잘 정의되어 있는지는 논외로 하자.) 그러면 이 범주 $\mathcal{F}$는 모든 사람들, 그리고 사람들이 서로 간에 지금까지 준 적 있는 모든 선물들을 품고 있는 정보 묶음이다. 한편 모든 사람들을 다 모아서 범주 $\mathcal{G}$를 구성하되, 이번에는 사람 $\alpha$에서 사람 $\beta$로의 모피즘을 $\alpha$가 $\beta$에게 준 적 있는 생일 선물이라고 하자. 그러면 범주 $\mathcal{G}$는 모든 사람들, 그리고 사람들이 서로 간에 지금까지 준 적 있는 모든 생일 선물들을 품고 있는 정보 묶음이다. 생일 선물도 선물이므로, 범주 $\mathcal{F}$는 범주 $\mathcal{G}$가 가진 모든 정보를 포함하고 그보다 더 많은 정보를 포함한다. 범주 $\mathcal{G}$의 범주론적 성질들을 잘 연구해보면, 생일 선물 문화에 대한 어떤 유의미한 명제를 이끌어낼 수도 있을 것이다. 그렇지만 범주 $\mathcal{F}$를 아무리 열심히 연구한다고 하여 일반적인 선물 문화 중에서도 특별히 생일 선물 문화에 관한 명제를 알아내기는 어려울 것이다. 그러니까 만약 내가 알고 싶은 것이 생일 선물 문화라면, $\mathcal{F}$를 연구하기보다는 $\mathcal{G}$를 연구하는 편이 더 자연스럽다. 나아가서 $\mathcal{F}$는 이런 경우 애초에 별로 쓸모가 없다고 여겨질 수도 있겠지만, 실제 수학 연구에서는 상황이 항상 이렇게 이분법적이지만은 않다. 예컨대 만약 범주 $\mathcal{G}$의 구조가 매우 복잡해서 연구하기가 너무 어렵지만 범주 $\mathcal{F}$의 구조는 상대적으로 간단하여 접근해볼 수 있다는 상황을 상정해보면, $\mathcal{G}$를 연구하다가 아무 결과를 얻지 못하고 좌절하는 것 보다는 $\mathcal{F}$를 연구하여 일반적인 선물 문화에 대한 명제라도 끌어내는 것이 연구자로서는 전략적으로 나은 선택일 수 있다. 하지만 이는 실질적 연구 전략에 관한 이야기일 뿐이고, 이 경우, 즉 내가 알고 싶은 것이 생일 문화라는 전제가 있다면, 물론 범주 $\mathcal{G}$를 연구하는 것이 자연스러운 일이다.
다시 우리의 수학적 논의로 돌아오자. 우리는 에쓰엘투의 표현들을 모아서 범주 $\mathcal{C}$를 구성하고자 하였다. 즉 이 범주의 대상object들은 에쓰엘투의 표현들이다. 그러면 에쓰엘투의 표현 $(H_1,E_1,F_1)$에서 에쓰엘투의 표현 $(H_2,E_2,F_2)$로의 모피즘은 무엇이라고 정의하는 것이 좋은가? 앞의 표현이 $n_1$차원, 뒤의 표현이 $n_2$차원이라고 가정하자. 앞의 표현에서 뒤의 표현으로의 모피즘은 크기가 $n_2 \times n_1$인 행렬 $A$ 중 다음의 방정식들을 만족하는 것으로 정의하는 것이 표현론의 관점에서 자연스럽다(이 $A$가 두 표현들을 꼬아준다intertwine고 말한다):$$A H_1 = H_2 A, \qquad A E_1 = E_2 A, \qquad A F_1 = F_2 A.$$그러니까 $\mathcal{C}$의 각 모피즘은 행렬이다. 언뜻 생각해보면 이 범주의 예시 역시 모피즘이 집한 간 사상으로 주어지지 않는 다소 특이한 범주의 예시인 것으로 이해될 수도 있지만, 행렬이 선형사상에 대응한다는 사실을 기억해보면 사실은 이 범주 $\mathcal{C}$의 모피즘은 모종의 의미로는 벡터공간들 간의 사상으로 주어진다고 받아들일 수 있을 것이다.
에쓰엘투의 표현 두 개가 주어졌을 때, 그들 사이의 모피즘이 되는 행렬 $A$를 모두 찾아보라고 하면 위의 연립 행렬 방정식을 풀어야 하므로 어려운 문제로 느껴질 수도 있다. 사실 아주 쉬운 답이 하나 있는데 그것은 영행렬이다. 그러면 영행렬이 아닌 답이 있기는 한가? 있다면 어떻게 찾는가? 이 문제는 선형대수학의 기본적 지식과 기술로도 접근할 수는 있다. 즉 $A$의 모든 성분들을 미지수로 놓으면, $A$가 성립시켜야 할 행렬 방정식의 각 성분마다 이 미지수들이 만족시켜야 할 일차방정식을 얻는다. 즉 미지수가 $n_1 n_2$개이고 방정식의 개수가 $3 n_1 n_2$개인 연립일차방정식을 풀면 되는 것이다. 연립일차방정식을 푸는 방법은 고등학교 수학 과정에서도 다루고 있으며, 이것이 바로 필자가 생각하기에 교육과정에서 행렬이 빠지면서도 교과서에 화석처럼 남아있는 행렬과 그 연산에 관한 흔적이다. 이렇게 이 문제는 기초적으로 접근할 수 있기는 하지만, 사실 이 특정한 문제에 대한 답을 찾고 그 답의 의미를 고찰하는데에 훨씬 더 좋은 방법은 표현론의 흥미로운 정리를 사용하는 것이다([4]). 아쉽게도 이 정리에 대해서는 이 글에서 다루지 않는다.
$\mathbb{Q}[x]$의 범주화
우리는 이전 절에서 범주 $\mathcal{C}$에 관한 기본적인 기술을 마쳤다. 이제는 이 범주를 대수 $\mathbb{Q}[x]$의 범주화로 이해하기 위하여, 범주 $\mathcal{C}$에 대하여 좀 더 살펴볼 것이다.
일반적으로 범주의 어떤 모피즘이 ‘역inverse 모피즘’을 가지고 있다면 그러한 모피즘을 ‘동형 모피즘isomorphism’이라고 부른다. 범주의 어떤 두 대상에 대하여, 이 두 대상 간에 동형 모피즘이 존재하는 경우 이 두 대상이 서로 ‘동형isomorphic’이라고 말한다. 이 동형 관계가 일반적인 범주에서 가장 자연스럽게 대상들 간에 동치관계equivalence relation을 주는 방법이다. 일반적인 경우 역 모피즘의 정의는 모피즘들의 합성과 항등 모피즘이라는 개념을 사용하여 정의한다. 필자의 의견으로는 대학교 수학의 가장 큰 역할 중 하나는 “어떤 것들을 서로 같다고 여길 것인가”라는 문제에 대한 엄밀한 논리적 토대와 경험을 제공한다는 것인데, 이것이 범주론의 언어 안에 내재되어 있다고 보아도 좋다. 에쓰엘투의 표현들로 이루어진 우리의 범주 $\mathcal{C}$의 경우, 모피즘인 행렬 $A$가 동형 모피즘인 조건은 이 행렬이 가역invertible 행렬이라는 조건과 동치이다. 즉, 우선 $A$는 정사각행렬이어야 하며, 같은 크기의 $n \times n$ 정사각행렬 $B$가 존재하여$$AB = BA = I_n$$을 만족해야 한다. 여기서 $I_n$은 $n \times n$ 항등행렬identity matrix로, 각 $i=1,2,\ldots,n$에 대해 $(i,i)$-성분이 $1$이고 나머지 모든 성분은 $0$인 행렬이다. 이 때 $B$를 $A$의 역행렬이라 하고 $B = A^{-1}$로 표기한다. 한편 항등행렬은 대각행렬diagonal matrix의 일종이다. $n \times n$ 행렬에 대하여, 각 $(i,i)$-성분을 대각성분이라고 칭하는데, 대각성분이 아닌 모든 성분이 전부 $0$인 경우 그 행렬을 대각행렬diagonal matrix이라고 한다. 대각행렬 $D$의 예시로는 항등행렬 $I_n$이 있고, 크기가 $n \times n$인 영행렬도 있다.$$I_n = \left( \begin{array}{cccc}1 & 0 & \cdots & 0 \\ 0 & 1 & \cdots & 0 \\ 0 & 0 & \ddots & 0 \\ 0 & 0 & \cdots & 1\end{array} \right), \qquad D = \left( \begin{array}{cccc} d_1 & 0 & \cdots & 0 \\ 0 & d_2 & \cdots & 0 \\ 0 & 0 & \ddots & 0 \\ 0 & 0 & \cdots & d_n \end{array} \right)$$대각행렬은 선형대수학에서 매우 중요한 역할을 수행하며, 마지막 절에 다시 등장할 것이다.
다시 범주 $\mathcal{C}$의 대상들 간의 동치관계를 주는 동형관계로 돌아와보자. 이제 지난 두 번째 연재글([2])에서처럼, 서로 동형인 대상들은 같은 것으로 여기자고 하고, 대상들의 동형류들의 모임을 생각해보자. 이 새로운 모임은 원래 범주 $\mathcal{C}$보다 훨씬 간단한 모임이 된다. 우리는[2]에서 이 동형류들의 모임에 더하기와 빼기를 정의할 수 있고 심지어는 유리수 상수곱까지 정의할 수 있다고 하였다. 그러고나면 유리수 체 위의 벡터공간 하나를 얻게 되는데, 어떠한 벡터공간인고 하니:
정리. 위의 방식을 통해 범주 $\mathcal{C}$로부터 얻어지는 벡터공간은 $\mathbb{Q}[x]$이다.
범주 $\mathcal{C}$의 대상의 동형류가 $\mathbb{Q}[x]$의 어떤 원소에 어떻게 대응되는지는 뒤에서 설명할 것이다. 일단 정리를 믿어보자면, 범주 $\mathcal{C}$가 우리의 $\mathbb{Q}[x]$를 범주화한다는 것이다. 그런데 사실 이 시점에서는 $\mathbb{Q}[x]$를 벡터공간으로만 보고 있으며, 벡터공간으로서 $\mathbb{Q}[x]$는 차원이 (셀 수 있는) 무한이고, 차원이 셀 수 있는 무한인 벡터공간들은 벡터공간으로서 모두 서로 동형이기 때문에, 위의 정리가 그렇게까지 놀랍거나 유용하다고 보기는 어렵다. 놀라워해야 할 시점은 이 범주화가 $\mathbb{Q}[x]$의 대수 구조, 즉 곱셈 구조까지 잘 범주화한다는 사실을 발견한 이후일 것이다.
이를 설명하려면 범주 $\mathcal{C}$의 흥미로운 구조를 더 살펴봐야 한다. 그 전에, 에쓰엘투의 표현이라는 개념을 처음 배운 사람이, 자기 손으로 에쓰엘투의 표현들을 좀 찾아보려는 시도를 한다고 생각해보자. 크기 $n$을 정한 뒤, $n \times n$ 행렬들 세 개 $H,E,F$를 찾아서 세 행렬 방정식 $[H,E] = 2E$, $[H,F] = -2F$, $[E,F] = H$ 모두가 만족되도록 해야 한다. 다소 무모한 방법으로는, 찾고자 하는 세 행렬의 모든 성분들을 다 미지수로 놓으면, 미지수의 총 개수가 $3n^2$개이고, 각 행렬 방정식에서 각 성분마다 미지수에 관한 (이차) 방정식 하나가 나오므로, 총 방정식의 개수가 $3n^2$개인 연립 이차방정식을 풀면 된다. 그러나 이런 방식은 $n$이 클 경우 계산 시간이 오래 소요되기도 하거니와, 답을 구하더라도 그 답이 왜 그렇게 나오는지에 대한 구조적 이해를 주기 어렵다.
에쓰엘투의 표현들을 찾아내는 유용한 방법 중에, 이미 몇 개의 표현들을 알고 있을 때 이들을 조합하여 새로운 표현을 만들어내는 방법 두 가지를 소개하려 한다. 이들은 선형대수학에서 배울 수 있는 행렬에 관한 다음의 기본적 건설법들로부터 온다. 크기가 $n\times n$인 행렬 $A$와 크기가 $m \times m$ 행렬 $B$가 있다고 하자. 이 두 행렬의 직합direct sum은 크기가 $(n+m) \times (n+m)$인 행렬로 $A$와 $B$를 대각선 방향으로 ‘이어 붙여서’ 만들고, 나머지 자리에는 모두 $0$을 채워 넣으며, $A\oplus B$로 표기한다. 두 행렬의 텐서곱tensor product 크기가 $(nm) \times (nm)$인 행렬로, $A$의 각 $(i,j)$-성분 $a_{ij}$를 $B$에 곱하여 얻는 $m\times m$ 행렬 $a_{ij} B$들을 생각하고, 행렬 $A$의 각 성분 $a_{ij}$의 자리에 숫자 $a_{ij}$ 대신 행렬 $a_{ij} B$을 ‘집어넣어’ 만들며, $A\otimes B$로 표기한다. 예시는 아래와 같다:$$\left( \begin{array}{cc} 0 & 2 \\ -1 & 1 \end{array} \right) \oplus \left( \begin{array}{cc} 3 & 5 \\ 4 & 7 \end{array} \right) = \left( \begin{array}{cccc} 0 & 2 & 0 & 0 \\ -1 & 1 & 0 & 0 \\ 0 & 0 & 3 & 5 \\ 0 & 0 & 4 & 7 \end{array} \right)$$ $$\left( \begin{array}{cc} 0 & 2 \\ -1 & 1 \end{array} \right) \otimes \left( \begin{array}{cc} 3 & 5 \\ 4 & 7 \end{array} \right) = \left( \begin{array}{cc} 0 \left( \begin{array}{cc} 3 & 5 \\ 4 & 7 \end{array} \right) & 2 \left( \begin{array}{cc} 3 & 5 \\ 4 & 7 \end{array} \right) \\ – \left( \begin{array}{cc} 3 & 5 \\ 4 & 7 \end{array} \right) & \left( \begin{array}{cc} 3 & 5 \\ 4 & 7 \end{array} \right) \end{array} \right) = \left( \begin{array}{cccc} 0 & 0 & 6 & 10 \\ 0 & 0 & 8 & 14 \\ -3 & -5 & 3 & 5 \\ -4 & -7 & 4 & 7 \end{array} \right)$$
이제 에쓰엘투의 $n_1$차원 표현 $(H_1,E_1,F_1)$과 $n_2$차원 표현 $(H_2,E_2,F_2)$가 있다고 하자. 이 두 표현의 직합을 $(H_1 \oplus H_2, E_1 \oplus E_2, F_1 \oplus F_2)$로 정의하고, 두 표현의 텐서곱을 다음과 같이 정의하자:$$(H_1 \otimes {\rm Id}_{n_2} + {\rm Id}_{n_1} \otimes H_2, \, E_1 \otimes {\rm Id}_{n_2} + {\rm Id}_{n_1} \otimes E_2, \, F_1 \otimes {\rm Id}_{n_2} + {\rm Id}_{n_1} \otimes F_2)$$직합은 그렇다쳐도, 왜 텐서곱은 $(H_1 \otimes H_2, \, E_1 \otimes E_2, \, F_1 \otimes F_2)$와 같이 직관적으로 정의하지 않는가? 우선 다소 직관적이지 않아보이는 위의 방식으로 표현의 텐서곱을 정의하면 다음을 얻는다.
정리. 에쓰엘투의 표현들의 직합도 에쓰엘투의 표현이고, 텐서곱도 에쓰엘투의 표현이다.
결과론적으로는, 에쓰엘투의 표현 두 개의 텐서곱을 저렇게 다소 이상하게 정의했더니 정말 항상 에쓰엘투의 표현이 되더라는 것이다. 나아가서는, 표현론의 관점에서 텐서곱을 저렇게 정의하는 것이 자연스럽다는 언급만 하고 넘어가자. 참고로, 이 텐서곱이 얼마나 유용한고 하니, $n=2$ 경우에 우리가 제시한 에쓰엘투 표현의 예시 $(\left(\begin{smallmatrix} 1 & 0 \\ 0 & -1 \end{smallmatrix} \right), \left( \begin{smallmatrix} 0 & 1 \\ 0 & 0 \end{smallmatrix} \right), \left( \begin{smallmatrix} 0 & 0 \\ 1 & 0 \end{smallmatrix} \right))$에 텐서곱을 여러 번 적용하면 (좀 더 엄밀히는, 다음 절에서 등장할 직합 분해도 사용하면) 에쓰엘투의 모든표현을 전부 다 찾아낼 수 있다!
우리의 진정한 관심사는 다음의 명제에 있다.
정리. 위의 직합과 텐서곱을 지닌 범주 $\mathcal{C}$는 대수 $\mathbb{Q}[x]$를 범주화한다.
이 정리에서 눈여겨볼 단어는 ‘대수’이다. 즉 다소 이상해보이는 표현들간의 저 텐서곱이 정확히 우리의 대수 $\mathbb{Q}[x]$의 자연스러운 다항식 곱셈을 범주화한다는 것이다.
$\mathbb{Q}[x]$의 표준기저
지금까지 꽤 먼 길을 왔는데, 우리가 어떤 목표를 따라서 이 길을 왔는가를 기억해보면 그것은 대수 $\mathbb{Q}[x]$의 표준기저이다. 이 원래 목표에 도달하기 위해서는 좀 더 힘을 내야 한다. 지면 관계상 얼마간의 축지법을 써야만 함을 독자들께서 양해해주시기 바란다.
우선 범주 $\mathcal{C}$의 각 대상의 동형류를 취하면 $\mathbb{Q}[x]$의 원소, 즉 다항식을 얻을 수 있다고 필자가 주장하였는데, 이 과정을 설명해야 한다. $\mathcal{C}$의 임의의 대상, 즉 에쓰엘투의 표현 $(H,E,F)$ 하나를 고려하자. 전혀 자명하지 않은 신기한 사실은 행렬 $H$가 대각화가능하다는 점인데, 이는 가역인 행렬 $A$가 존재하여 $A H A^{-1}$가 대각행렬이 됨을 뜻한다. 이 대각행렬의 대각성분들 $a_1,a_2,\ldots,a_n$이 모두 정수임이 알려져있다([3] 참조). 이때 갑자기 새로운 변수 $q$를 도입하여 이 대각성분들을 $q$의 지수로 놓고 모두 더하면 $q$에 관한 로랑 다항식([1] 참조), 즉 음의 정수 지수 항이 허용된 다항식을 얻을 수 있다:$$q^{a_1} + q^{a_2} + \cdots + q^{a_n}.$$예컨대 $H$의 크기가 $6\times 6$이었고 $AHA^{-1}$의 대각성분들을 읽었더니 $1,3,1,-3,-1,-1$이었다면 여기서 나오는 $q$의 로랑 다항식은$$q^1 + q^3 + q^1 + q^{-3} + q^{-1} + q^{-1} = q^3 + 2 q^1 + 2q^{-1} + q^{-3}$$이다. 이 로랑 다항식은 $H$를 대각화하여 나오는 대각성분들, 즉 $H$의 고윳값eigenvalue들은 무엇인지, 각 고윳값이 몇 번 나오는지를 기록해준다. 결과가 $q$에 관한 정수계수 로랑 다항식이므로 첫 번째 연재글의 기호를 상기하자면 $\mathbb{Z}[q^{\pm 1}]$의 원소이며, 따라서 유리계수 로랑 다항식, 즉 $\mathbb{Q}[q^{\pm 1}]$의 원소로도 볼 수 있다. 그런데 $H$로부터 이렇게 나온 결과물은 $q$에 관한 로랑 다항식 중에서도, $q$의 모든 지수에 $-1$를 곱하는 행위, 즉 ‘지수 뒤집기’를 행해도 변하지 않는 로랑 다항식임이 알려져있다([4]). 이렇게 $\mathbb{Q}[q^{\pm 1}]$의 원소 중 지수 뒤집기에 불변인 원소를 모두 모은 부분집합을 $\mathbb{Q}[q^{\pm 1}]^r$이라고 표현하자. 이 부분집합은 대수의 모든 연산에 닫혀있어서 그 자체로 대수가 되며, 대수로서 우리의 친애하는 대수 $\mathbb{Q}[x]$와 동형이다. 즉,$$\mbox{$\mathbb{Q}[q^{\pm 1}]^r \to \mathbb{Q}[x]$인 대수동형사상이 존재한다.}$$여기서 대수동형사상algebra isomorphism은 대수 구조를 보존하는 사상으로서, 대수 구조를 보존하는 역inverse 사상을 가지는 것을 말한다. 이러한 대수동형사상은 $\mathbb{Q}[q^{\pm 1}]^r$의 원소 중 어느 것을 $\mathbb{Q}[x]$의 원소 $x$에 대응시키는지에 의해 완전히 결정되며, 그런 원소는 $q + q^{-1} + c$여야만 한다는 것도 비교적 쉽게 알아낼 수 있다($c\in \mathbb{Q}$는 상수). 편의를 위하여 $c=0$인 경우, 즉 $q+q^{-1}$를 $x$로 대응시키는 대수동형사상을 사용하도록 하자.
정리하면, 범주 $\mathcal{C}$의 대상, 즉 에쓰엘투의 표현 $(H,E,F)$로 시작하면, $H$를 대각화하여 $\mathbb{Q}[q^{\pm 1}]^r$의 원소를 얻어내고, 위의 대수동형사상을 적용하여 $\mathbb{Q}[x]$의 원소, 즉 $x$에 관한 다항식을 얻어낼 수 있다는 것이다.
마지막으로 범주 $\mathcal{C}$의 대상들 중 ‘표준적’인 대상들이 있음을 살펴보려 한다. 이들에 위의 과정을 적용하여 $\mathbb{Q}[x]$의 ‘표준적’인 원소들을 얻을 것이고, 만약 이들이 $\mathbb{Q}[x]$의 기저를 이룬다면 우리가 원했던 $\mathbb{Q}[x]$의 표준기저를 하나 얻게 될 것이다. 지난 절에서 에쓰엘투의 표현 두 개가 있으면 직합으로 이들을 ‘합체’하여 더 큰 차원의 에쓰엘투 표현을 얻을 수 있다고 언급하였다. 텐서곱도 이런 역할을 하지만 직합이 더욱 단순하고 직접적으로 두 표현을 합체하는 방식이다. 거꾸로, 주어진 에쓰엘투 표현에 대해, 이 표현을 자기보다 차원이 낮은 두 표현의 직합으로 얻어낼 수 있는지 생각해볼 수 있다. 만약 그렇다면, 이 두 작은 표현들 각각에 대하여 또다시 더 작은 표현의 직합으로 쪼갤 수 있는지 생각할 수 있다1. 에쓰엘투의 임의의 표현은 이런 식으로 직합으로 쪼개고 쪼개어 더 이상 쪼개지지 않는 기약 표현irreducible representation들 여러 개의 직합으로 나타낼 수 있다. 즉 기약 표현은 에쓰엘투의 표현 이론에서 기본적인 조각들 역할을 한다. 마치 정수론에서 소수prime number들이 하는 것처럼. 어떤 수학적 대상의 ‘표현’representation, [3, 4] 참조들을 모두 모은 범주에서 기약 표현들이 표준적인 대상들을 이룸은 표현론의 관점에서 의심의 여지가 없다. 우리의 범주의 경우 각 자연수 $n$에 대해서, 차원이 $n$인 에쓰엘투의 기약 표현 $(H_n,E_n,F_n)$의 동형류가 정확히 하나 있다는 점이 알려져있다([4]). 우리가 2절에서 살펴본 $1$차원, $2$차원과 $3$차원의 에쓰엘투 표현의 예시가 이들에 해당한다.
에쓰엘투의 $n$차원 기약 표현 $(H_n,E_n,F_n)$에서 얻어지는 $q$의 로랑 다항식은$$q^{-(n-1)} + q^{-(n-3)} + \cdots + q^{n-3} + q^{n-1} = \frac{q^n – q^{-n}}{q-q^{-1}}$$임이 알려져있다([4]). 참고로 이 로랑 다항식(좌변의 식)에 $q=1$을 대입하면 $n$이 나오는데, 이 특별한 로랑 다항식을 ‘양자quantum 자연수 $n$’이라고 부르기도 하며, 종종 $[n]_q$로 표기한다. 이것은 우리의 대수 $\mathbb{Q}[x]$의 어떤 원소에 해당하는가? 이 질문은 이 양자 자연수 $[n]_q$를 $q+q^{-1}$에 관한 다항식으로 어떻게 표현할 수 있는가에 대한 질문이기도 하다. 이에 대한 답을 주는 다항식들이 1854년에 등장한 제 2종 체비셰프 다항식Chebyshev polynomial of second kind $G_n(x)$이다 ([5] 참조). 각 음이 아닌 정수 $n$에 대해 정의된 정수계수 다항식 $G_n(x)$는 처음 두 개 $G_0(x) = 1$, $G_1(x) = x$, 그리고 다음의 귀납적 점화식에 의해서 결정된다:$$G_{n+1}(x) = x \cdot G_n(x) – G_{n-1}(x), \qquad n \ge 1.$$몇 개 계산해보면 $G_2(x) = x^2 – 1$, $G_3(x) = x^3 – 2x$, $G_4(x) = x^4 – 3x^2+1$ 등이다. 우리의 상황에서의 역할은 모든 자연수 $n$에 대해 $$G_{n-1}(q+q^{-1}) = [n]_q$$을 만족한다는 것이다. 예컨대, $n=4$일 때, $q+q^{-1}$을 $G_3(x)=x^3-2x$에 넣어보면 $G_3(q+q^{-1}) = (q+q^{-1})^3 – 2(q+q^{-1}) = q^3 + q^1 + q^{-1} + q^{-3} = [4]_q$임을 확인할 수 있다. 여기서 $q+q^{-1} = [2]_q$이므로, 다항식 $G_{n-1}(x)$는 $[2]_q$로부터 $[n]_q$를 어떻게 얻어내는지 알려주는 공식이라고 할 수 있다.
다시 차분히 정리해보자. 범주 $\mathcal{C}$의 표준적인 대상들로서 각 자연수 $n$마다 $(H_n,E_n,F_n)$이라는 에쓰엘투의 기약 표현이 있으며, 이 대상에 동형류 단순화를 적용해 $\mathbb{Q}[x]$의 원소로 변환하면 체비셰프 다항식 $G_{n-1}(x)$, 즉 에쓰엘투의 $2$차원 기약표현으로부터 직합(및 쪼개기)와 텐서곱을 이용하여 에쓰엘투의 $n$차원 기약표현을 만들어내는 다항식을 얻는다. 이렇게 얻은 다항식들$$G_0(x), \quad G_1(x), \quad G_2(x), \quad G_3(x), \quad G_4(x), \quad \cdots$$즉$$1, \quad x, \quad x^2 – 1, \quad x^3 – 2x, \quad x^4 – 3x^2 + 1, \quad \cdots$$이 우리의 대수 $\mathbb{Q}[x]$의 기저를 이룸은 이들의 최고차항을 살펴봄으로써 쉽게 증명할 수 있다. 다음은 이번 글의 대망의 결론이다.
결론. $\{G_{n-1}(x) \, | \, n \in \mathbb{Z}_{\ge 1} \}$ =$\{1, x, x^2-1, x^3-2x, x^4-3x^2+1, \ldots\}$이 우리의 대수 $\mathbb{Q}[x]$의 표준기저이다.
논평
언뜻 생각하기에는 다항식 대수 $\mathbb{Q}[x]$의 기저로는 단항식들의 집합 $\{1,x,x^2,x^3,\ldots\}$이 단연 가장 표준적으로 보일 수 있다. 지난 연재 글과 이번 글을 통하여, 대수 $\mathbb{Q}[x]$를 범주화하여 이해할 수 있도록 해주는 표현론적인 범주를 살펴보았고, 선형대수학과 표현론의 표준적인 건설과 개념들의 관점에서 매우 표준적이라고 여길 만한 $\mathbb{Q}[x]$의 기저 $\{G_0(x), G_1(x), G_2(x), G_3(x), \ldots\}$를 얻어내었다. 단항식들도 나름대로 의미있다고 생각할 수 있고 그러한 의미를 찾아볼 수도 있겠지만, 어쨌든 우리는 굉장히 의미 있는 또 다른 다항식들의 모임을 찾아낸 것이다. 양자 자연수를 처음 접한 독자들에게는 이 체비셰프 다항식들 $G_n(x)$가 뜬금없는 다항식들로 느껴질 수도 있겠으나, 만약 사인(sine)과 코사인(cosine)의 $n$배각 공식을 접해본 독자들이 있다면 그리 멀지 않게 느껴질 수도 있다. 왜냐하면 모든 음이 아닌 정수 $n$과 모든 실수 $\theta$에 대해서$$G_{n} (2 \cos \theta) = \frac{\sin((n+1)\theta)}{\sin \theta}$$이 성립하기 때문이다 (직접 몇 개를 확인해보길 추천한다).
눈치가 매서운 독자라면 우리는 이전 절의 ‘대망의’ 결론을 내기 위하여 중간에 대수동형사상 $\mathbb{Q}[q^{\pm 1}]^r \to \mathbb{Q}[x]$을 하나 선택하여 사용한 바 있는데, 우리의 결론적 기저가 이 선택에 의존하므로 우리가 얻은 기저가 별로 표준적이지 않다고 생각할 수도 있을 것이다. 이 의문점을 해결하기 위해 여러 가지 수학적인 논리를 동원하거나 혹은 결론을 조금 수정할 수도 있겠지만, 그보다 필자가 이번 글을 통해서 전달하고자 했던 바는 표준기저 문제를 대하는 좀 더 일반적 수준의 관점에 대한 것이다. 어떤 대수가 주어져있을 때, 그 대수를 예컨대 범주화와 같이 조금 더 깊고 높은 단계의 구조를 통해 이해할 수 있는 길을 찾는다면, 이로써 이 대수의 표준기저에 관한 문제에 새로운 통찰을 얻을 수 있다는 것이다.
다음 연재 글에서는, 첫 번째 연재 글([1])의 말미에 언급한 예시와 그 일반화인 클러스터 다양체의 경우에 표준기저 문제를 논의할 예정이며, 그 방법론으로 범주화 외에도 다양한 수학이 쓰일 수 있음을 살펴보고, 표준기저를 찾는 문제 자체의 의미에 관하여 다시 한 번 고찰해볼 예정이다.
참고문헌
- 김현규, 표준기저를 찾아서 [1], HORIZON 2024 August 14, https://horizon.kias.re.kr/29695/
- 김현규, 표준기저를 찾아서 [2], HORIZON 2024 November 20, https://horizon.kias.re.kr/30537/
- 김현규, 표준기저를 찾아서 [3], HORIZON 2025 March 21, https://horizon.kias.re.kr/31254/
- James E. Humphreys, Introduction to Lie Algebras and Representation Theory, Graduate Texts in Mathematics 9, Springer New York, NY, 1972.
- P. L. Chebyshev, “Théorie des mécanismes connus sous le nom de parall élogrammes” in Mémoires des Savants étrangers présentés à l’Académie de Saint-Pétersbourg 7 (1854), 539–586. (in French)