1. 개요
Random Walk, 무작위 걸음, 무작위 행보주어진 공간에서 매 순간 랜덤으로, 즉 확률적으로 이동하는 모습을 수학적으로 표현한 것이다.
자기가 어디로 걷는지도 모르는 완전히 만취한 취객이 정처없이 걷는 모습을 상상해 보자. 북쪽으로 갔다가 남쪽으로 갔다가, 어디론가 끝없이 가기도 하고 왔다리갔다리 맴돌기도 하고, 이런 예측하기 힘든 모습을 하늘에서 본 모습을 수학적인 모델로 설명한 것이 랜덤 워크라고 할 수 있다.
확률론이 발전하면서 다양한 방식으로 일반화되며 발전한 랜덤 워크의 이론은, 근래에는 무작위로 움직이는 거의 대부분의 것들을 설명하는 데에 사용되고 있다. 연속적인 랜덤 워크의 이론은 자연과학의 브라운 운동이나 이에 영감을 받은 금융공학의 블랙-숄즈 모형부터 시작해서, 확률미분방정식(stochastic differential equation)이란 이름의 새로운 분야를 개척하였다. 미분방정식에 확률 요소를 집어넣었다고 볼 수 있는 이 확률미분방정식은, 확률이 조금이라도 개입할 수 있는 상황에서 미분방정식을 넘어서는 더욱 일반적 모델링 방법으로까지 생각되기도 한다. 물론 더 어려운게 문제지만 이산적인 랜덤 워크도 컴퓨터공학, 경제학 등에서 이산수학이 응용되는 상황에 광범위하게 쓰이고 있다. 당연하겠지만 이런 진지한 예시가 아니어도 도박장에서 시간에 따른 돈의 변화나 게임 등에서의 랭크 게임 점수도 일종의 랜덤 워크로 생각할 수도 있다.
2. 수학적 정의 및 예시
2.1. 이산적 랜덤 워크
위에 예시로 든 취객의 움직임을 단순화시켜, 도로 위의 취객이 수직선 위의 원점에서 시작하고, 시간이 지날 때마다 오른쪽으로 +1 혹은 왼쪽으로 -1 움직인다고 하자. 양쪽 모두 같은 확률로 움직이게 하기 위해 동전을 던져서 앞면이 나오면 오른쪽, 뒷면이 나오면 왼쪽으로 간다고 해 보자.확률 변수 [math(X_k)]를 [math(k)]번째 동전이 앞면이 나오면 +1, 뒷면이 나오면 -1인 변수로 정의한다면, 변수 [math(X_1, \cdots, X_n)]은 모두 독립이고, 이들의 합 [math(S_n = X_1 + \cdots + X_n)]을 [math(n)]시간 후의 취객의 위치로 생각할 수 있다. 이항분포나 확률변수에 대한 간단한 지식이 있으면, [math(S_n)]의 평균은 0이고 분산은 [math(V(X_1 + \cdots + X_n) = V(X_1) + \cdots + V(X_n) = n)]이 되므로, 시간이 갈수록 원점에서 조금씩 멀어지게 됨을 파악할 수 있을 것이다. 중심 극한 정리까지 알고 있다면 [math(S_n)]의 분포 모양까지 정규분포 비스무레하게 된다는 것도 알 수 있다.
하지만 이건 단순히 [math(S_n)] 자체만을 본 결과이고, 랜덤 워크 이론에서는 이 뿐만 아니라 취객이 오간 경로 전체, 즉 수열 [math((S_1, S_2, \cdots, S_n, \cdots))]에 집중한다. 취객이 n시간 후에 원점에서 가장 멀리 떨어졌던 거리는 어느 정도일까? 취객이 원점을 어느 순간 이후로 지나지 않는 것이 가능할까?[답] 이러한 식으로 경로들의 전반적인 특성을 파악하는 것이 랜덤 워크 이론의 주된 흐름이 된다. 의외로 랜덤 워크에 대한 적지 않은 질문들은 확률이 0 아니면 1로 주어지는 0-1 법칙(zero-one law)을 따르는데[2], 이를 좀 과감하게 확대해석을 한다면 매번 바뀌는 무작위 움직임 속에서도 전체를 긴 흐름으로 보아 일관적인 특징을 어떻게든 찾아내는 랜덤워크 이론의 특징의 일부라 볼 수 있다.
취객이 두칸이나 세칸 걷기도 하거나, 아예 걷지 않거나, 또는 연속적으로 0에서 1사이 아무 거리만큼 가거나 등으로 패턴을 바꿀 수도 있다. 혹은 취객이 도로가 아니라 공터를 걷는 식으로 차원을 바꿀 수도 있다. 수학에서 말하는 좁은 의미의 랜덤 워크는 이들을 포괄해서, 유한 차원 벡터 공간 [math(V)] 위에 정해진 유한한 확률분포 [math(\mu)]에 대해, 매 시간마다 [math(X_k \sim \mu)]인 독립항등분포(iid, independent and identically distributed)만큼 이동하는 변수 [math(S_n = X_1 + \cdots + X_n)]의 열 [math((S_1, S_2, \cdots, S_n, \cdots))]로 생각할 수 있다. 대개 [math(\mu)]의 기댓값은 0으로 고정되는데, 기댓값이 0이 아닌 경우 [math(X'_k = X_k - \mathbb{E}[\mu])]을 생각하면 기댓값이 0인 경로에서 일직선만큼 편향된 경로로 볼 수 있기 때문이다. 물론 이 정의가 전부는 아니고, 조건을 완화시키거나 새로운 요소를 추가하는 식으로 다양한 바리에이션이 가능하다.
이 경우에도 [math(S_n)]의 분포에서 평균은 0이고 분산은 [math(n)]에 비례하며 다변수 버전의 중심 극한 정리가 적용된다는 것은 똑같다. 하지만 [math(V)]의 차원이 변화하면 또 다른 양상이 나타나는데, 예로 2차원의 경우 랜덤 워크는 확률 1로 원점을 항상 지나가지만 3차원 이상의 경우 이 확률이 1에서 떨어지는 현상이 일어난다. 이를 Pólya's Theorem이라고 한다. 대신 [math(\mu)]의 패턴이 미치는 영향은 너무 미시적인 부분이라 거기까지 가지는 않는 편이다.
3. 연속적 랜덤 워크
이산적 푸아송 분포에서 n을 무한으로 보낸 뒤 브라운 모형으로 근사시키면 연속적 랜덤 워크를 만들 수 있다. 블랙-숄즈 모형을 설명하는 교과서 참고.4. 여러 분야에서의 사용
상술했다시피 브라운 운동의 모델로서 기능한다.재무관리의 효율적 시장 가설에서도 등장한다. 효율적 시장이란 증권에 대한 정보가 신속, 정확하게 가격에 반영되고 거래비용이나 세금같은 시장마찰 요인이 존재하지않아 거래가 원활하게 이루어지며 자금이 적재적소에 배분되기 때문에 모든 자산은 공정한 가격에 거래되어 정상이익 이상의 수익을 얻을 수 없는 시장이다. 즉, 고/저평가되는 자산이 없다는것. 정보의 반영 속도에 따라 약형, 준강형, 강형 효율적 시장으로 나뉘는데, 랜덤워크 모형이 약형 효율적 시장의 가정으로 등장한다. 약형 효율적 시장은 증권의 모든 과거정보가 가격에 반영되어 있으므로 주가행태 분석같은 기술적 분석으로는 비정상수익을 얻을 수 없다. 여기에서 증권의 가격은 랜덤워크 모형으로 움직이며 이에 대한 예측은 불가능하다. 따라서 과거의 주가 정보 분석으로는 비정상수익을 얻을 수 없는 것이다. 특정 투자자가 과거정보 분석으로 비정상수익을 얻었다 하더라도 이는 우연의 일치이며 반복적으로 수행할 수 있는 표준화된 분석으로 비정상 수익을 얻은 것이 아니기 때문에 이는 약형 효율적 시장을 부정하는 사례가 될 수 없다.