통행 분포

통행 분포의 정의와 교통 계획상의 역할

통행 분포(Trip Distribution)란 특정 지역 내의 여러 교통 분석 존(Traffic Analysis Zone, TAZ) 사이에서 발생하는 통행의 공간적 흐름을 결정하는 과정이다. 이는 교통 수요 추정의 전통적인 4단계 모델(Four-Step Model) 중 두 번째 단계에 해당하며, 제1단계인 통행 발생(Trip Generation)에서 산출된 각 존별 통행 유출량과 유입량을 상호 연결하여 구체적인 기종점 행렬(Origin-Destination Matrix, O-D Matrix)을 구축하는 것을 목적으로 한다. 학술적으로 통행 분포는 공간적 상호작용(Spatial Interaction) 이론에 기반하며, 통행자가 목적지를 선택하는 행태적 원리와 지역 간의 접근성(Accessibility)을 수치화하여 표현하는 체계이다.

교통 계획의 실무적 관점에서 통행 분포는 전체 수요 추정 과정의 정확도를 결정짓는 핵심적인 위상을 차지한다. 통행 발생 단계가 단순히 특정 구역에서 발생하는 통행의 총량을 파악하는 양적 분석이라면, 통행 분포는 그 통행이 공간적으로 어디를 향하는지를 결정하는 질적 배분 과정이다. 이 단계에서 도출된 기종점 행렬은 이후 단계인 수단 선택(Modal Split)과 노선 배분(Traffic Assignment)의 직접적인 기초 자료가 된다. 따라서 통행 분포 추정의 오류는 연쇄적으로 전체 교통 모델의 신뢰성을 저하시키는 요인이 되므로, 지역의 토지 이용 특성과 교통 시설의 공급 상태를 정밀하게 반영하는 것이 필수적이다.

통행 분포는 도시 및 지역 계획의 다양한 의사결정 과정에서 중추적인 역할을 수행한다. 구체적으로는 도로망의 신설 및 확장, 대중교통 노선의 최적화, 그리고 대규모 택지 개발이나 산업 단지 조성에 따른 교통 영향 평가의 근거로 활용된다. 통행 분포 과정을 통해 분석가는 특정 지역 간의 통행 유대 강도를 파악할 수 있으며, 이는 도시 공간 구조의 단핵화 또는 다핵화 정도를 진단하는 지표가 되기도 한다. 또한, 통행 시간이나 비용과 같은 저항 요소가 통행 패턴에 미치는 영향을 분석함으로써, 교통 정책 변화에 따른 이용자 행태 변화를 예측하는 데 기여한다.

현대 교통 계획에서 통행 분포의 역할은 단순한 통계적 배분을 넘어 정책적 시뮬레이션의 도구로 확장되고 있다. 지속 가능한 교통 체계 구축을 위해 탄소 배출량을 산정하거나 교통 혼잡 비용을 계산할 때, 기종점 간의 정확한 통행 거리와 빈도는 가장 기본적인 입력 변수가 된다. 결과적으로 통행 분포는 물리적인 교통 흐름을 수학적으로 모사함으로써, 복잡한 도시 시스템 내에서 발생하는 인간의 이동 행태를 체계적으로 이해하고 관리할 수 있게 하는 학문적·실무적 가교 역할을 수행한다.

통행 분포의 학술적 개념

통행 분포(Trip Distribution)는 교통 수요 추정의 4단계 모델 중 두 번째 단계에 해당하며, 통행 발생 단계에서 결정된 각 존(Zone)별 총 유출량과 유입량을 공간적으로 연결하는 과정이다. 이 과정의 핵심은 특정 지역 내의 기점(Origin)과 종점(Destination) 사이에 발생하는 통행의 구체적인 흐름, 즉 기종점 통행량을 결정하는 데 있다. 학술적으로 통행 분포는 지역 간의 사회경제적 상호작용이 공간적 거리나 비용이라는 저항을 극복하고 실현되는 양상을 체계화하는 것을 목적으로 한다. 즉, 통행 발생이 ’얼마나 많은 통행이 일어나는가’에 집중한다면, 통행 분포는 ’그 통행이 어디에서 어디로 향하는가’라는 공간적 배분 문제를 다룬다.

이론적 관점에서 통행 분포는 공간 상호작용(Spatial Interaction) 모델에 그 기초를 두고 있다. 이는 두 지점 사이의 상호작용 크기가 각 지점의 활동 규모에 비례하고, 지점 간의 거리나 접근성에 반비례한다는 원리를 따른다. 이러한 맥락에서 통행 분포는 단순히 물리적인 이동의 나열을 넘어, 토지 이용과 교통 체계 간의 유기적 관계를 수치화하는 작업이라 할 수 있다. 예를 들어, 특정 주거 지역에서 발생한 통행이 고용 중심지나 상업 지역으로 어떻게 분산되는지를 분석함으로써 도시 공간 구조의 효율성을 진단하고 미래의 변화를 예측할 수 있게 된다.

통행 분포의 결과물은 통상적으로 기종점 행렬(Origin-Destination Matrix, OD Matrix)의 형태로 표현된다. $ i $번째 존에서 $ j $번째 존으로 이동하는 통행량을 $ T_{ij} $라고 할 때, 행렬의 각 원소는 다음과 같은 기본적인 제약 조건을 만족해야 한다.

$$ \sum_{j} T_{ij} = O_i $$ $$ \sum_{i} T_{ij} = D_j $$

위 식에서 $ O_i $는 기점 $ i $에서 발생하는 총 유출량이며, $ D_j $는 종점 $ j $로 집중되는 총 유입량을 의미한다. 통행 분포 모델의 학술적 과제는 이러한 수학적 제약 조건을 충족하면서도, 실제 인간의 통행 행태와 공간적 선택 원리를 가장 정교하게 재현하는 $ T_{ij} $ 값을 도출하는 것이다.

이러한 분포 과정을 결정짓는 가장 중요한 변수는 통행 저항(Travel Resistance)이다. 통행 저항은 단순히 물리적 거리만을 의미하는 것이 아니라 통행 시간, 통행 비용, 환승 횟수, 심리적 거리감 등을 포괄하는 개념이다. 통행자는 잠재적인 여러 목적지 중 자신의 효용을 극대화하거나 이동에 따르는 부효용(Disutility)을 최소화할 수 있는 지점을 선택하게 되며, 이러한 개별적 선택 행위가 집합적으로 나타난 결과가 바로 통행 분포의 패턴이다. 따라서 통행 분포에 대한 학술적 이해는 도시 계획 및 교통 공학 분야에서 교통망 확충이나 토지 이용 규제 변화가 지역 간 연결성과 접근성에 미치는 영향을 정밀하게 평가하기 위한 필수적인 전제 조건이 된다.

교통 수요 추정 단계에서의 연계성

교통 수요 추정의 전통적인 방법론인 4단계 추정법(Four-step transport forecasting model)에서 통행 분포(Trip distribution)는 제1단계인 통행 발생(Trip generation)과 제3단계인 수단 분담(Modal split)을 잇는 결정적인 가교 역할을 수행한다. 통행 발생 단계에서는 각 교통 분석 존(Traffic Analysis Zone, TAZ)별로 발생하는 총 통행량, 즉 유출량(Production)과 유입량(Attraction)을 산정한다. 그러나 이 단계의 결과물은 개별 존에서 발생하는 통행의 총량만을 제시할 뿐, 해당 통행이 공간적으로 어느 지점을 향하는지에 대한 구체적인 방향성을 포함하지 않는다. 따라서 통행 분포 단계는 이러한 수량적 정보를 바탕으로 실제 통행의 기점(Origin)과 종점(Destination)을 연결하여 기종점 행렬(Origin-Destination Matrix, O-D Matrix)을 구축하는 체계적인 절차를 다룬다.

통행 분포의 핵심적인 작업은 각 존 $ i $에서 발생한 유출량 $ P_i $가 목적지인 각 존 $ j $의 유입량 $ A_j $로 어떻게 배분되는지를 결정하는 것이다. 이를 수학적으로 표현하면, $ i $존에서 $ j $존으로 이동하는 통행량을 $ T_{ij} $라고 할 때, 전체 교통 체계는 거대한 행렬 구조를 형성하게 된다. 기종점 행렬의 각 행(Row)의 합은 해당 기점의 총 유출량과 일치해야 하며, 각 열(Column)의 합은 해당 종점의 총 유입량과 일치해야 한다. 이러한 관계는 다음과 같은 제약 조건식으로 정의된다.

$$ \sum_{j} T_{ij} = P_{i} $$ $$ \sum_{i} T_{ij} = A_{j} $$

여기서 $ P_i $는 존 $ i $에서 발생하는 유출 통행량의 합계이며, $ A_j $는 존 $ j $로 집중되는 유입 통행량의 합계이다. 통행 분포 모형은 이러한 제약 조건을 만족하면서, 두 지역 간의 거리, 시간, 비용과 같은 통행 저항(Travel resistance) 요소를 고려하여 $ T_{ij} $의 값을 추정한다. 통행 발생 단계에서 산출된 독립적인 두 수치인 유출량과 유입량이 통행 분포 단계를 거치며 비로소 상호 유기적인 관계를 맺게 되는 것이다.

이 과정에서 발생하는 중요한 학술적 쟁점은 유출량의 총합과 유입량의 총합이 일치해야 한다는 총량 일치의 원칙이다. 이론적으로 한 폐쇄된 시스템 내에서 발생하는 모든 통행은 반드시 어딘가로 귀착되어야 하므로, 모든 존의 유출량 합계와 유입량 합계는 동일해야 한다. 즉, $ P_i = A_j $의 관계가 성립해야 한다. 그러나 실제 예측 과정에서는 통행 발생 모형의 오차나 데이터의 불완전성으로 인해 두 수치가 일치하지 않는 경우가 빈번하다. 이때 전수화(Expansion) 과정이나 보정 계수 적용을 통해 유출량과 유입량의 균형을 맞추는 작업이 선행되어야 하며, 이는 후속 단계인 수단 분담 및 노선 배분(Traffic assignment)의 정확도를 결정짓는 필수적인 전제 조건이 된다.

결과적으로 통행 분포 단계에서의 연계성은 단순히 숫자를 배분하는 기술적 절차를 넘어, 지역 간의 공간적 상호작용(Spatial interaction)을 모형화하는 과정이다. 통행 발생 단계에서 도출된 토지 이용 및 사회경제적 지표들이 통행 분포를 통해 구체적인 흐름(Flow)으로 전환되며, 이는 교통망 내에서의 혼잡도나 서비스 수준을 평가하는 기초 자료가 된다. 따라서 통행 분포 모형의 정교함은 전체 교통 계획의 신뢰성을 담보하는 핵심 요소이며, 기종점 간의 연계성을 어떻게 정의하느냐에 따라 미래의 교통 인프라 투자 우선순위와 도시 계획의 방향성이 결정된다. 이러한 연계 구조는 교통 수요 추정의 각 단계가 독립된 계산 과정이 아니라, 논리적 일관성을 유지하며 환류(Feedback)되는 일련의 체계임을 보여준다.

성장인자법에 의한 통행 분포 추정

성장인자법(Growth Factor Method)은 교통 수요 추정의 두 번째 단계인 통행 분포 과정에서 가장 고전적이면서도 직관적인 방법론으로 활용된다. 이 방법의 핵심적인 논리는 과거 혹은 현재의 통행 패턴이 미래에도 일정하게 유지되거나 점진적으로 변화한다는 가정에 기반한다. 구체적으로, 특정 기종점 행렬(Origin-Destination Matrix, O-D Matrix) 내의 각 존(Zone) 사이에서 발생하는 통행량의 공간적 배분 구조는 고정된 것으로 간주하며, 장래의 통행량은 각 지역의 사회경제적 성장에 따른 성장인자(Growth Factor)를 현재의 통행량에 곱함으로써 산출된다. 이러한 접근 방식은 복잡한 행동 모델이나 저항 함수를 설정하지 않고도 비교적 신속하게 장래의 통행 분포를 예측할 수 있다는 점에서 실무적 유용성을 갖는다.

성장인자법의 가장 단순한 형태는 모든 지역의 성장률이 동일하다고 가정하는 균등 성장인자법(Uniform Growth Factor Method)이다. 이 기법은 전체 대상 지역의 총 통행 발생량 증가율을 개별 기종점 쌍의 통행량에 일괄적으로 적용한다. 수식으로 표현하면 장래의 통행량 $ T_{ij} $는 현재의 통행량 $ t_{ij} $와 전체 성장률 $ F $의 곱으로 나타낼 수 있다.

$$ T_{ij} = t_{ij} \times F $$

여기서 $ F $는 장래의 총 통행 발생량을 현재의 총 통행 발생량으로 나눈 값이다. 그러나 실제 도시 공간은 지역별로 상이한 토지 이용 계획과 밀도 변화를 겪으므로, 모든 지역에 단일한 성장률을 적용하는 것은 현실적 정밀도가 떨어진다는 비판을 받는다.

이를 보완하기 위해 각 존별로 서로 다른 성장률을 반영하는 평균 성장인자법(Average Growth Factor Method)이나 다양한 반복 보정 기법이 고안되었다. 평균 성장인자법은 기점 $ i $의 성장률 $ F_i $와 종점 $ j $의 성장률 $ F_j $의 산술 평균을 현재 통행량에 적용하는 방식이다. 하지만 이 역시 기점과 종점의 합계 제약 조건을 동시에 만족시키지 못하는 수렴성 문제가 발생할 수 있다. 이를 해결하기 위해 프라타법(Fratar Method)이나 디트로이트법(Detroit Method), 퍼네스법(Furness Method)과 같은 반복 보정 기법들이 제안되었으며, 이들은 각 존의 유출량과 유입량이 목표 연도의 예측치와 일치할 때까지 반복적으로 계산을 수행하여 오차를 최소화한다.

성장인자법은 중력 모형이나 엔트로피 극대화 모형과 달리 통행 저항이나 교통망의 변화를 모형 내부에서 직접적으로 처리하지 못한다는 한계가 명확하다. 즉, 장래에 새로운 도로가 건설되거나 대중교통 체계가 획기적으로 개선되어 통행 비용이 감소하더라도, 성장인자법은 과거의 통행 패턴에만 의존하기 때문에 이러한 네트워크상의 변화를 반영한 통행 분포의 전이(Shift)를 설명할 수 없다. 또한, 현재 통행량이 0인 기종점 쌍에 대해서는 성장률을 아무리 적용해도 장래 통행량이 여전히 0으로 산출되는 소위 ’제로 셀(Zero-cell) 문제’를 내포하고 있다.

그럼에도 불구하고 성장인자법은 통행 패턴의 변화가 급격하지 않은 단기 예측이나, 상세한 교통망 데이터 및 통행자 행태 조사가 미비한 상황에서 매우 효율적인 도구로 평가받는다. 특히 토지 이용의 변화가 안정적인 기성 시가지나, 기존의 통행 특성을 정교하게 유지해야 하는 특정 목적의 교통 계획 수립 시에는 여전히 중요한 분석 기법으로 다루어진다. 결과적으로 성장인자법은 통행 분포 추정의 역사적 기틀을 마련하였으며, 현대의 복잡한 수리적 모형들과 상호 보완적인 관계를 유지하며 교통 계획의 기초 자료를 제공하고 있다.

단순 성장인자법의 원리와 한계

통행 분포 추정의 고전적 방법론인 성장인자법(Growth Factor Method)은 기준 연도의 기종점 행렬(Origin-Destination Matrix)이 미래에도 그 패턴을 유지한다는 가정을 바탕으로 한다. 이 중 단순 성장인자법은 계산 과정이 직관적이고 복잡한 반복 계산을 요구하지 않아 과거 교통 계획의 초기 단계에서 널리 활용되었다. 단순 성장인자법은 크게 전체 지역의 성장을 동일하게 간주하는 방식과 각 존의 성장률을 산술적으로 평균하는 방식으로 구분된다.

균등 성장인자법(Uniform Growth Factor Method)은 대상 지역 내의 모든 교통 존(Traffic Analysis Zone, TAZ)이 동일한 비율로 성장한다고 가정하는 가장 단순한 형태의 모형이다. 이 방법에서는 지역 전체의 미래 총 통행 발생량을 현재의 총 통행 발생량으로 나눈 단일한 성장인자를 산출하여, 이를 기존의 모든 기종점별 통행량에 곱한다. 기준 연도의 기점 $ i $에서 종점 $ j $로의 통행량을 $ t_{ij} $, 미래의 추정 통행량을 $ T_{ij} $라고 할 때, 균등 성장인자 $ f $를 이용한 수식은 다음과 같다.

$$ T_{ij} = t_{ij} \times f $$

여기서 성장인자 $ f $는 미래의 전체 통행량 $ T $를 현재의 전체 통행량 $ t $로 나눈 값인 $ f = $로 정의된다. 이 모형은 지역 전체의 거시적인 성장 추세를 반영하기에는 용이하나, 특정 구역의 집중적인 개발이나 쇠퇴와 같은 미시적인 토지 이용 변화를 전혀 반영하지 못한다는 치명적인 결함이 있다. 현실의 도시 공간은 도로망의 확충이나 신도시 건설 등에 의해 존별로 상이한 성장률을 보이기 때문에, 균등 성장인자법은 변화가 거의 없는 안정적인 단기 예측 외에는 적용에 한계가 있다.

평균 성장인자법(Average Growth Factor Method)은 각 존의 유출 성장률과 유입 성장률이 서로 다를 수 있음을 인정하고, 이를 통행 분포에 반영하고자 고안되었다. 이 기법은 기점 $ i $의 성장인자 $ f_i $와 종점 $ j $의 성장인자 $ f_j $를 각각 산출한 뒤, 두 인자의 산술 평균을 기존 통행량에 적용한다. 미래의 기점별 유출 통행량을 $ P_i $, 종점별 유입 통행량을 $ A_j $라 하고 현재의 값을 각각 $ p_i $, $ a_j $라고 할 때, 각 존의 성장인자는 $ f_i = $, $ f_j = $가 된다. 이를 이용한 미래 통행량 산정식은 다음과 같다.

$$ T_{ij} = t_{ij} \times \frac{f_i + f_j}{2} $$

평균 성장인자법은 균등 성장인자법에 비해 지역 간의 불균형 성장을 일정 부분 수용할 수 있다는 장점이 있다. 그러나 산술 평균을 사용하는 특성상 계산된 미래 통행량의 합계가 사전에 예측된 각 존의 총 유출량 및 유입량과 일치하지 않는 수렴성 문제가 발생한다. 즉, 행렬의 행 합계와 열 합계가 독립적으로 추정된 미래 통행 발생량 제약 조건을 만족시키지 못하는 것이다. 이를 해결하기 위해서는 결과값을 다시 새로운 기준값으로 삼아 반복적으로 보정하는 과정이 필요하며, 이는 단순 성장인자법의 범주를 벗어나 프라타법(Fratar Method)과 같은 반복 보정법으로 이어진다.

단순 성장인자법의 공통적인 한계는 교통 체계의 구조적 변화를 반영하지 못한다는 점에 있다. 첫째, 통행 저항의 변화를 고려하지 않는다. 미래에 특정 구간의 도로가 신설되거나 확장되어 통행 시간이 단축되더라도, 성장인자법은 오직 과거의 통행 패턴에만 의존하므로 이러한 네트워크 변화에 따른 유도 수요나 통행 경로의 변화를 설명할 수 없다. 둘째, 신규 개발 지역에 대한 예측이 불가능하다. 기준 연도에 통행량이 0이었던 존은 성장인자가 아무리 크더라도 미래 통행량이 항상 0으로 계산되는 ’0의 문제’가 발생한다. 셋째, 장기 예측으로 갈수록 과거 패턴의 고착화로 인한 오차가 기하급수적으로 커진다. 이러한 제약으로 인해 현대의 교통 수요 추정 실무에서는 단순 성장인자법보다는 지역 간의 공간적 상호작용을 수학적으로 모델링하는 중력 모형이나 엔트로피 극대화 모형을 주로 사용한다.

반복 보정법의 유형별 특성

성장인자법의 한계를 극복하기 위해 제안된 반복 보정법은 기점과 종점의 유출량 및 유입량 제약 조건을 동시에 만족시키기 위한 수치 해석적 기법이다. 단순 성장인자법이 기점이나 종점 중 어느 한쪽의 제약 조건만을 만족시키거나 단순히 평균치를 취하는 데 그치는 것과 달리, 반복 보정법은 각 교통 존의 성장률이 서로 다를 때 발생하는 수치적 불일치를 반복적인 산출 과정을 통해 특정 오차 범위 내로 수렴시킨다. 이러한 방식은 과거의 통행 패턴이 미래에도 일정하게 유지된다는 가정을 전제로 하면서도, 지역별 불균형 성장을 정교하게 반영할 수 있다는 점에서 유효성을 갖는다.

프라타법(Fratar Method)은 1954년 토마스 프라타(Thomas J. Fratar)에 의해 고안된 방식으로, 기종점 행렬(Origin-Destination Matrix)의 각 셀을 수정할 때 해당 기점의 성장률뿐만 아니라 종점의 상대적인 성장률을 가중치로 고려한다. 특정 기점 $i$에서 종점 $j$로의 미래 통행량 $T_{ij}$를 산정하는 기본 식은 다음과 같다.

$$ T_{ij} = t_{ij} \cdot F_i \cdot \frac{F_j}{\sum_{k} (t_{ik} \cdot F_k) / \sum_{k} t_{ik}} $$

여기서 $t_{ij}$는 현재의 통행량, $F_i$와 $F_j$는 각각 기점과 종점의 성장인자를 의미한다. 프라타법은 각 존의 유입 및 유출 제약 조건을 비교적 빠르게 만족시키며 수렴의 안정성이 높다는 특징이 있다. 특히 특정 기종점 쌍의 통행량이 다른 경로에 미치는 영향력을 가중치 형태로 반영하므로, 복잡한 도시 교통망의 통행 분포를 재현하는 데 강점을 보인다.

디트로이트법(Detroit Method)은 미국 디트로이트 지역의 교통 조사를 위해 개발된 기법으로, 전체 조사 구역의 평균 성장률을 기준으로 개별 존의 성장률을 상대적으로 적용한다. 이 모델은 특정 기종점 간의 통행량이 기점과 종점의 성장률에 비례하고, 전체 지역의 총 통행 성장률에는 반비례한다는 가정을 바탕으로 한다. 수식으로는 다음과 같이 표현된다.

$$ T_{ij} = t_{ij} \cdot \frac{F_i \cdot F_j}{F} $$

이때 $F$는 지역 전체의 총 통행 성장인자이다. 디트로이트법은 계산 구조가 단순하여 대규모 행렬을 처리할 때 연산 효율성이 높다는 장점이 있으나, 특정 존의 성장이 지역 평균에 비해 지나치게 급격할 경우 수렴 속도가 저하되거나 결과값이 실제 통행 행태를 왜곡할 가능성이 존재한다.

퍼네스법(Furness Method)은 수렴 계수법 또는 이차비례법(Biproportional Method)으로도 불리며, 기점 제약과 종점 제약을 교대로 반복하며 행렬을 조정하는 방식을 취한다. 먼저 행(Row)의 합이 미래의 기점 유출량과 일치하도록 행별 성장인자를 곱하여 1차 보정 행렬을 만든 뒤, 다시 이 행렬의 열(Column) 합이 미래의 종점 유입량과 일치하도록 열별 성장인자를 곱하는 과정을 반복한다. 이 기법은 수학적으로 엔트로피 극대화 원리와 일맥상통하며, 계산 과정의 명확성과 구현의 용이성 덕분에 현대 교통 수요 예측 소프트웨어에서 표준적인 알고리즘으로 널리 채택되고 있다.

이러한 반복 보정법들은 공통적으로 과거 데이터에 의존하는 안정성을 중시하므로, 기종점 간의 통행량이 전혀 없었던 셀(Zero cell)은 반복 계산 후에도 여전히 0으로 남는다는 구조적 한계를 지닌다. 따라서 신규 개발 지구와 같이 과거 통행 실적이 존재하지 않거나 토지 이용 체계가 근본적으로 변화하는 지역의 통행 분포를 예측할 때는 중력 모형이나 확률적 선택 모형을 병행하여 보완하는 것이 일반적이다. 각 기법의 선택은 가용한 데이터의 정밀도, 계산 자원의 효율성, 그리고 대상 지역의 성장 특성에 따라 결정된다.

중력 모형의 이론 체계와 구성 요소

중력 모형(Gravity Model)은 통행 분포를 추정하는 데 있어 가장 널리 사용되는 합성 모형으로, 두 지점 사이의 통행량이 각 지점의 활동 규모에 비례하고 공간적 저항에는 반비례한다는 원리를 골자로 한다. 이는 아이작 뉴턴(Isaac Newton)이 정립한 만유인력의 법칙을 사회과학적 현상인 인구 이동과 교통류 분석에 투영한 것이다. 물리학에서 두 물체 사이의 인력이 질량의 곱에 비례하고 거리의 제곱에 반비례하듯, 교통 현상에서의 중력 모형은 기점의 유출 잠재력과 종점의 유입 매력도를 각 물체의 질량으로, 통행에 소요되는 시간이나 비용을 거리로 치환하여 해석한다.

중력 모형의 기본 이론 체계는 기점 $ i $에서 종점 $ j $로 향하는 통행량 $ T_{ij} $를 산정하기 위해 다음과 같은 수학적 구조를 갖는다. $$ T_{ij} = k O_i D_j f(c_{ij}) $$ 여기서 $ O_i $는 기점 $ i $에서 발생하는 총 통행량, $ D_j $는 종점 $ j $에 도착하는 총 통행량을 의미하며, $ f(c_{ij}) $는 두 지점 사이의 통행 저항에 따른 통행 강도의 감쇠를 나타내는 마찰 함수(Friction Function)이다. 상수 $ k $는 전체 통행량의 총합을 일치시키기 위한 비례 상수이다. 현대적 교통 계획에서는 기점과 종점의 합계 제약 조건을 엄격히 만족시키기 위해 균형 계수(Balancing Factor)를 도입한 이중 제약 중력 모형의 형태를 주로 사용한다.

모형의 핵심 구성 요소인 활동 규모 척도는 통행 발생 단계에서 산출된 유출량과 유입량을 기반으로 한다. 기점의 유출량은 해당 지역의 인구, 고용자 수 등 사회경제적 지표에 의해 결정되는 공급 능력을 나타내며, 종점의 유입량은 해당 지역이 통행자를 끌어들이는 매력도의 크기를 의미한다. 이러한 규모 인자들은 통행의 총량을 결정짓는 일차적인 변수로 작용하며, 공간 구조상에서 통행이 배분되는 기본적인 틀을 제공한다.

통행 저항을 수치화하는 마찰 함수는 중력 모형의 예측력을 좌우하는 결정적인 요소이다. 초기 연구에서는 물리적 거리의 제곱에 반비례하는 단순 역자승 법칙을 따랐으나, 실제 교통 행태는 물리적 거리보다는 통행자가 체감하는 일반화 비용(Generalized Cost)에 더 민감하게 반응한다. 이에 따라 통행 시간, 유류비, 통행료 등을 종합적으로 반영한 저항 지표가 활용된다. 마찰 함수의 형태는 지역적 특성과 통행 목적에 따라 다르게 설정되는데, 주로 다음과 같은 지수 함수나 멱함수 형태가 사용된다.

멱함수 형태는 장거리 통행의 감쇠 현상을 설명하는 데 적합하며, 지수 함수 형태는 도시 내 단거리 통행의 분포 특성을 기술하는 데 유리한 것으로 알려져 있다. 한국의 고속도로 통행 데이터를 분석한 연구에 따르면, 통행 분포는 특정 거리 임계치를 기준으로 서로 다른 지수적 감쇠 특성을 보이기도 한다¹⁾.

중력 모형은 성장인자법과 달리 과거의 기종점 행렬 데이터가 존재하지 않는 신도시 개발이나 대규모 교통 시설 확충 시나리오에서도 미래 통행 분포를 논리적으로 예측할 수 있다는 강점을 지닌다. 이는 도로망의 변화로 인해 통행 저항이 감소할 경우, 해당 경로를 포함한 지역 간 상호작용이 증대되는 현상을 모형 내부에서 직접적으로 반영할 수 있기 때문이다. 또한, 물리적 거리나 비용만으로 설명되지 않는 특정 지역 간의 특수한 유대 관계를 보정하기 위해 K-인자(K-factor)를 도입함으로써 모형의 현실 재현성을 높이기도 한다.

이러한 이론적 체계는 이후 엔트로피 극대화 이론과 결합하면서 통계역학적 정당성을 확보하게 되었다. 중력 모형은 단순히 물리 법칙의 차용에 그치지 않고, 주어진 제약 조건 하에서 발생 가능한 가장 확률 높은 통행 분포 상태를 도출하는 수리적 모형으로 발전하였다. 이는 교통 수요 4단계 추정법 중 통행 분포 단계에서 가장 중추적인 역할을 수행하며, 국토 공간 구조의 변화를 예측하고 평가하는 핵심적인 도구로 활용되고 있다.

중력 모형의 기본 구조와 수식화

중력 모형(Gravity Model)은 아이작 뉴턴(Isaac Newton)이 제량한 만유인력의 법칙을 사회과학적 현상인 교통 공학에 원용한 이론적 틀이다. 물리 세계에서 두 물체 사이의 인력이 각 물체의 질량에 비례하고 거리의 제곱에 반비례한다는 원리를 교통 현상에 투영하여, 특정 두 지역 사이의 통행량이 각 지역의 활동 규모가 클수록 증가하고 두 지역 간의 거리나 시간과 같은 통행 저항이 클수록 감소한다는 가설을 수식화한 것이다. 이는 통행 분포를 추정하는 방법론 중 가장 널리 사용되는 기법으로, 과거의 통행 패턴에 의존하는 성장인자법과 달리 토지 이용의 변화나 교통 시설의 확충으로 인한 접근성 개선 효과를 모형 내에 직접적으로 반영할 수 있다는 강점을 지닌다.

중력 모형의 가장 기본적인 수식 체계는 기점 $ i $에서 종점 $ j $로 향하는 통행량 $ T_{ij} $를 다음과 같이 정의한다. $$ T_{ij} = k \cdot \frac{P_i \cdot A_j}{d_{ij}^n} $$ 여기서 $ P_i $는 기점 $ i $에서 발생하는 통행 발생량(Production), $ A_j $는 종점 $ j $에서 유입되는 통행 유인량(Attraction)을 의미하며, $ d_{ij} $는 두 지역 사이의 공간적 거리를 나타낸다. 비례 상수 $ k $는 전체 통행량의 규모를 조정하는 역할을 하며, 지수 $ n $은 거리에 따른 통행량 감소의 민감도를 결정하는 매개변수이다. 이 식은 두 지역의 사회경제적 활동 규모가 클수록 통행이 빈번해지고, 물리적 거리가 멀어질수록 통행 의지가 급격히 감소한다는 인간의 통행 행태를 수학적으로 명확히 규정한다.

현대적인 교통 수요 추정 과정에서는 단순한 거리의 역제곱 형태를 넘어, 보다 정교화된 마찰 함수(Friction Function)를 도입하여 모형을 구성한다. 마찰 함수는 통행자가 이동 과정에서 겪는 시간적, 경제적, 심리적 부담을 포괄하는 통행 비용을 변수로 취하며, 이를 통해 물리적 거리뿐만 아니라 교통 체증이나 통행료 등 실질적인 저항 요소를 반영한다. 일반화된 중력 모형의 수식은 다음과 같은 형태로 표현된다. $$ T_{ij} = P_i \cdot \frac{A_j \cdot F_{ij} \cdot K_{ij}}{\sum_{k=1}^n (A_k \cdot F_{ik} \cdot K_{ik})} $$ 이 수식에서 $ F_{ij} $는 기점과 종점 사이의 저항을 나타내는 마찰 함수이며, $ K_{ij} $는 특정 지역 쌍 사이의 특수한 사회경제적 유대 관계를 보정하기 위한 계수이다. 분모의 항은 기점 $ i $에서 도달 가능한 모든 종점들에 대한 유인력과 마찰 함수의 곱을 합산한 것으로, 이는 특정 기점에서 유출되는 통행량의 합이 해당 기점의 총 통행 발생량 $ P_i $와 일치하도록 보장하는 정규화 과정을 의미한다. 이러한 구조는 중력 모형이 기종점 행렬(Origin-Destination Matrix)의 제약 조건을 만족하면서도 지역 간 상호작용의 상대적 강도를 합리적으로 배분할 수 있게 한다. ²⁾

중력 모형의 수식화 과정에서 가장 중요한 과제는 관측된 데이터를 바탕으로 마찰 함수의 형태와 매개변수를 추정하는 모형 보정이다. 지수 함수, 멱함수, 또는 이들의 결합 형태인 감마 함수 등이 마찰 함수의 후보로 사용되며, 실제 조사된 통행 시간 빈도 분포와 모형에 의한 예측치가 최대한 일치하도록 최적의 계수를 산출한다. 이러한 수식적 정교함 덕분에 중력 모형은 단순한 물리적 비유를 넘어, 도시의 공간 구조 변화가 교통 흐름에 미치는 영향을 예측하고 분석하는 핵심적인 공학적 도구로 자리 잡았다.

마찰 함수와 통행 저항의 설정

통행 분포 단계의 중력 모형에서 기점과 종점 사이의 교류 강도를 결정하는 핵심 기제는 통행 저항(Travel Impedance)이다. 통행 저항은 두 존(Zone) 사이를 이동할 때 발생하는 물리적, 경제적, 심리적 부담을 수치화한 것으로, 단순히 물리적 거리만을 의미하지 않는다. 현대 교통 계획에서는 통행에 소요되는 시간, 유류비 및 통행료와 같은 직접 비용, 그리고 운전자의 피로도나 정시성 등을 종합적으로 고려한 일반화 비용(Generalized Cost)의 개념을 사용하여 저항을 정의한다. 일반화 비용 $C_{ij}$는 일반적으로 다음과 같은 선형 결합의 형태로 표현된다.

$$C_{ij} = \alpha \cdot t_{ij} + \beta \cdot d_{ij} + \gamma \cdot m_{ij} + \delta$$

여기서 $t_{ij}$는 통행 시간, $d_{ij}$는 통행 거리, $m_{ij}$는 통행 요금 등을 의미하며, 각 계수는 해당 요소가 전체 저항에서 차지하는 가중치를 나타낸다. 특히 시간 변수에 곱해지는 계수는 시간 가치(Value of Time)를 반영하여 화폐 단위로 환산하는 역할을 수행한다.

마찰 함수(Friction Function)는 이러한 통행 저항이 증가함에 따라 두 지역 간의 통행 발생 확률이나 통행량이 어떠한 양상으로 감소하는지를 수학적으로 규정한 함수이다. 중력 모형의 일반식 $T_{ij} = A_i O_i B_j D_j f(C_{ij})$에서 $f(C_{ij})$에 해당하며, 저항에 대한 통행자의 민감도를 결정한다. 마찰 함수의 형태는 분석 대상 지역의 특성이나 통행 목적에 따라 다르게 설정되는데, 학술적으로 가장 널리 활용되는 형태는 다음과 같다.

첫째, 멱함수(Power Function) 형태이다. $$f(C_{ij}) = C_{ij}^{-\beta}$$ 이는 저항의 변화율에 따른 통행량의 변화가 일정한 탄력성을 가질 때 적합하며, 주로 지역 간 장거리 통행이나 화물 수송 분석에 활용된다.

둘째, 지수함수(Exponential Function) 형태이다. $$f(C_{ij}) = e^{-\beta C_{ij}}$$ 저항이 증가함에 따라 통행량이 급격히 감소하는 특성을 보이며, 주로 도시 내 단거리 통행이나 통근 통행의 행태를 모사하는 데 효과적이다.

셋째, 감마함수(Gamma Function) 형태이다. $$f(C_{ij}) = a \cdot C_{ij}^b \cdot e^{-c C_{ij}}$$ 멱함수와 지수함수의 특성을 결합한 형태로, 저항이 아주 작은 구간에서는 오히려 통행량이 소폭 증가하다가 일정 수준 이후부터 감소하는 현실적인 통행 행태를 반영할 수 있어 최근 대부분의 교통 수요 예측 소프트웨어에서 표준적으로 채택하고 있다.

설정된 마찰 함수의 적절성을 검증하고 최적의 매개변수를 산출하는 과정은 모형 보정(Calibration)의 핵심이다. 이를 위해 실제 설문조사나 기종점 조사를 통해 관측된 통행 시간 빈도 분포(Travel Time Frequency Distribution, TLFD)와 모형에 의해 추정된 분포를 비교한다. 분석가는 마찰 함수의 계수($\beta$ 등)를 반복적으로 조정하며, 관측된 평균 통행 시간과 추정된 평균 통행 시간이 일치하고 두 분포 곡선의 형태가 통계적으로 유의미한 수준에서 부합할 때까지 보정 작업을 수행한다. 이러한 과정을 통해 산출된 마찰 계수는 해당 지역 통행자들이 공간적 거리나 비용에 대해 느끼는 저항의 강도를 객관적으로 나타내는 지표가 된다. ³⁾

제약 조건에 따른 모형의 분류

중력 모형(Gravity Model)은 통행 발생 단계에서 예측된 각 존별 유출량($O_i$)과 유입량($D_j$)을 바탕으로 존 간의 통행량($T_{ij}$)을 배분한다. 이때 모형을 통해 계산된 결과값의 합계가 사전에 정의된 기점 유출량이나 종점 유입량의 총합과 일치해야 하는지, 즉 제약 조건(Constraint condition)을 어떻게 설정하느냐에 따라 무제약, 단일제약, 이중제약 모형으로 분류한다. 이러한 분류 체계는 교통 계획의 목적과 가용 데이터의 신뢰도에 따라 선택되며, 각 모형은 수학적 구조와 수렴 특성에서 뚜렷한 차이를 보인다.

무제약 중력 모형(Unconstrained Gravity Model)은 기점과 종점의 합계 제약 조건을 강제하지 않는 가장 단순한 형태이다. 이 모형의 일반식은 다음과 같다. $$T_{ij} = K \cdot O_i \cdot D_j \cdot f(c_{ij})$$ 여기서 $K$는 비례 상수이며, $f(c_{ij})$는 두 존 사이의 통행 저항을 나타내는 마찰 함수이다. 무제약 모형에서는 계산된 $\sum_j T_{ij}$가 실제 유출량 $O_i$와 일치하지 않으며, $\sum_i T_{ij}$ 역시 $D_j$와 일치하지 않는 경우가 일반적이다. 따라서 이 모형은 전체적인 통행 패턴의 경향성을 파악하는 초기 분석이나, 기종점 데이터가 불완전하여 특정 제약을 가하기 어려운 특수 상황에서 제한적으로 사용된다.

단일제약 중력 모형(Singly Constrained Gravity Model)은 기점 또는 종점 중 어느 한쪽의 합계만을 일치시키는 방식이다. 기점제약 중력 모형(Production-constrained Gravity Model)은 각 존에서 발생하는 총 유출량($O_i$)이 보존되도록 설계되며, 주로 주거지에서 발생하는 통행이 목적지로 어떻게 분산되는지 분석할 때 활용된다. 반면 종점제약 중력 모형(Attraction-constrained Gravity Model)은 특정 존으로 들어오는 총 유입량($D_j$)을 고정하며, 소매업 입지 분석이나 고용 중심지로의 통행 집중도를 파악하는 데 유용하다. 기점제약 모형의 경우, 제약 조건을 만족시키기 위해 다음과 같은 균형 계수(Balancing factor) $A_i$를 도입한다. $$T_{ij} = A_i \cdot O_i \cdot D_j \cdot f(c_{ij}), \quad A_i = \left[ \sum_j D_j \cdot f(c_{ij}) \right]^{-1}$$ 이러한 구조를 통해 특정 기점에서 출발하는 모든 통행량의 합은 정확히 $O_i$가 된다.

이중제약 중력 모형(Doubly Constrained Gravity Model)은 기점 유출량과 종점 유입량 제약 조건을 동시에 만족시켜야 하는 가장 엄격하고 정교한 형태이다. 도시 전체의 교통 수요 추정에서는 각 존의 유출량과 유입량이 이미 통행 발생 단계에서 결정되어 있으므로, 이를 모두 충족하는 이중제약 방식이 표준적으로 사용된다. 이 모형은 두 개의 균형 계수 $A_i$와 $B_j$를 포함하며, 수식은 다음과 같다. $$T_{ij} = A_i \cdot O_i \cdot B_j \cdot D_j \cdot f(c_{ij})$$ $$A_i = \left[ \sum_j B_j \cdot D_j \cdot f(c_{ij}) \right]^{-1}, \quad B_j = \left[ \sum_i A_i \cdot O_i \cdot f(c_{ij}) \right]^{-1}$$ $A_i$와 $B_j$는 서로를 포함하는 함수 관계에 있으므로, 직접적인 대수적 해를 구하기 어렵다. 따라서 일반적으로 프라타법(Fratar Method)이나 퍼니스법(Furness Method)과 같은 반복 보정법을 사용하여 수렴하는 해를 도출한다. 이중제약 모형은 앨런 윌슨의 엔트로피 극대화 모형과 수학적으로 동일한 구조를 가짐이 증명되었으며, 이는 통계역학적 관점에서 가장 발생 확률이 높은 통행 분포 상태를 의미한다⁴⁾. 이러한 제약 조건의 설정은 모형의 예측력을 높일 뿐만 아니라, 지역 간 인구 이동이나 화물 물동량 분석 등 다양한 공간 상호작용 모델링의 기초가 된다⁵⁾.

확률적 접근 및 엔트로피 극대화 모형

전통적인 중력 모형은 물리학의 법칙을 유추 적용하여 통행 분포를 설명하였으나, 이는 개별 통행자의 의사결정 과정이나 통계적 근거를 충분히 제시하지 못한다는 한계가 있었다. 이를 극복하기 위해 앨런 윌슨(Alan Wilson)은 1967년 통계역학(Statistical Mechanics)의 원리를 도입하여 엔트로피 극대화 모형(Entropy Maximization Model)을 제안하였다. 이 접근법은 시스템 내에서 발생 가능한 수많은 미시적 상태(Micro-state)들 중에서 거시적 제약 조건을 만족하며 발생 확률이 가장 높은 거시적 상태(Macro-state)를 찾는 것을 골자로 한다.

통행 분포에서 거시적 상태는 기점 $i$에서 종점 $j$로 이동하는 통행량의 집합인 기종점 행렬(Origin-Destination Matrix) $T_{ij}$로 정의된다. 반면 미시적 상태는 전체 $T$명의 통행자 개개인이 구체적으로 어느 기종점 쌍에 할당되었는지를 의미한다. 특정한 거시적 상태 $T_{ij}$가 나타날 수 있는 미시적 상태의 가짓수 $W$는 다음과 같은 조합론(Combinatorics)적 수식으로 표현된다.

$$W = \frac{T!}{\prod_{i} \prod_{j} T_{ij}!}$$

여기서 $T$는 전체 통행량이며, $T_{ij}$는 각 기종점 쌍의 통행량이다. 정보 이론(Information Theory)의 관점에서 $W$를 극대화하는 것은 시스템의 불확실성 또는 엔트로피(Entropy)를 극대화하는 것과 같으며, 이는 주어진 정보 외에 다른 편향된 가정을 하지 않는 가장 객관적인 분포 상태를 의미한다. 수학적 편의를 위해 자연로그를 취한 $\ln W$를 목적함수로 설정하고, 스털링 근사(Stirling’s Approximation)를 적용하여 식을 단순화한다.

이때 통행 분포는 다음과 같은 세 가지 주요 제약 조건을 만족해야 한다. 첫째, 각 기점에서 유출되는 통행량의 합은 기점 발생량 $O_i$와 같아야 한다($\sum_{j} T_{ij} = O_i$). 둘째, 각 종점으로 유입되는 통행량의 합은 종점 도착량 $D_j$와 같아야 한다($\sum_{i} T_{ij} = D_j$). 셋째, 시스템 전체의 총 통행 비용은 일정한 수준 $C$를 유지해야 한다($\sum_{i} \sum_{j} T_{ij} c_{ij} = C$). 이러한 제약 조건 하에서 목적함수를 극대화하기 위해 라그랑주 승수법(Lagrange Multiplier Method)을 적용하면 최종적인 통행 분포 식은 다음과 같은 지수 함수 형태로 도출된다⁶⁾.

$$T_{ij} = A_i O_i B_j D_j \exp(-\beta c_{ij})$$

위 식에서 $A_i$와 $B_j$는 각 기점과 종점의 제약 조건을 만족시키기 위한 조정 계수이며, $\beta$는 통행 비용에 대한 민감도를 나타내는 라그랑주 승수이다. 이는 결과적으로 이중 제약 중력 모형의 형태와 일치하며, 중력 모형이 단순한 물리적 유추를 넘어 통계적 타당성을 확보하고 있음을 입증한다.

이러한 확률적 접근은 이후 이산 선택 모형(Discrete Choice Model)과의 이론적 통합으로 이어진다. 엔트로피 극대화 과정에서 도출된 지수 함수 형태의 확률 분포는 개별 통행자가 자신의 효용 극대화(Utility Maximization)를 추구한다는 가정하에 유도되는 로짓 모형(Logit Model)의 구조와 수학적으로 동일함이 밝혀졌다. 즉, 거시적인 통계적 분포 특성과 미시적인 개별 행태적 선택 원리가 일관된 논리 체계 안에서 결합된 것이다. 이는 교통 계획가가 단순히 과거의 추세를 연장하는 것을 넘어, 통행자의 행태 변화나 교통 체계의 변화가 통행 분포에 미치는 영향을 더욱 정밀하게 예측할 수 있는 이론적 토대가 되었다.

개입 기회 모형의 논리

통행 분포를 설명하는 전통적인 중력 모형은 두 지점 사이의 물리적 거리나 통행 비용을 주요 변수로 삼아 통행 강도를 규명한다. 그러나 개입 기회 모형(Intervening Opportunity Model)은 통행자가 목적지를 선택할 때 물리적 거리 그 자체보다는 기점과 종점 사이에 존재하는 잠재적 목적지, 즉 ’기회’의 수에 더 민감하게 반응한다는 가설에서 출발한다. 이 모형은 1940년 새뮤얼 스토우퍼(Samuel Stouffer)가 제안한 개입 기회 이론에 뿌리를 두고 있으며, 이후 1960년대 시카고 지역 교통 연구(Chicago Area Transportation Study, CATS)에서 모턴 슈나이더(Morton Schneider)에 의해 구체적인 교통 수요 추정 모델로 정립되었다.

개입 기회 모형의 핵심 논리는 통행자가 기점에서 가까운 순서대로 배치된 각 기회를 검토하며, 특정 기회가 자신의 요구를 충족할 경우 그곳을 목적지로 선택하고 통행을 종료한다는 점이다. 이때 통행자가 특정 기회를 선택할 확률은 두 가지 조건의 결합으로 결정된다. 첫째는 해당 기회 이전까지 나타난 모든 기회를 선택하지 않고 통과했을 확률이며, 둘째는 현재 도달한 기회가 통행자의 목적을 만족시킬 확률이다. 따라서 기점으로부터 거리가 멀어질수록 통행자가 거쳐 가는 개입 기회의 수가 누적되어 증가하므로, 특정 지점까지 도달할 확률은 점차 감소하게 된다. 이는 통행 거리가 멀어질수록 통행량이 감소하는 현상을 물리적 마찰이 아닌 확률적 선택의 결과로 해석한 것이다.

이를 수학적으로 정립하기 위해, 기점 $ i $에서 발생한 통행이 $ V $개의 누적 기회를 검토한 후에도 여전히 목적지를 찾지 못했을 확률을 $ P(V) $라고 정의한다. 만약 추가적인 미소 기회 $ dV $를 검토할 때 통행자가 목적지를 선택할 확률이 $ L dV $라고 가정한다면, 여기서 $ L $은 기회당 선택 확률을 나타내는 상수이다. 이때 $ V $와 $ V+dV $ 사이에서 통행이 종료될 확률의 변화량은 다음과 같은 미분 방정식으로 표현할 수 있다.

$$ dP = -L \cdot P(V) \cdot dV $$

이 방정식을 적분하면 $ P(V) = e^{-LV} $라는 해를 얻게 된다. 기점 $ i $에서 종점 $ j $까지의 통행량 $ T_{ij} $는 기점 $ i $의 총 통행 발생량 $ O_i $ 중에서 종점 $ j $보다 가까운 곳에 위치한 누적 기회 $ V_{j-1} $까지는 통과하고, 종점 $ j $에 포함된 기회 $ V_j $ 내에서 통행을 멈출 확률의 차이로 계산된다.

$$ T_{ij} = O_i [P(V_{j-1}) - P(V_j)] = O_i [e^{-LV_{j-1}} - e^{-LV_j}] $$

여기서 $ V_{j-1} $은 기점 $ i $에서 종점 $ j $보다 가까운 모든 존의 기회(예: 고용자 수, 매장 면적 등) 합계를 의미하며, $ V_j $는 $ V_{j-1} $에 종점 $ j $의 기회 수를 더한 값이다. 이 수식은 통행 분포가 단순히 거리에 반비례하는 것이 아니라, 목적지 사이에 놓인 선택지의 밀도에 의해 결정됨을 보여준다.

개입 기회 모형은 중력 모형과 달리 공간적 저항을 물리적 거리가 아닌 기회의 밀도와 배치 구조로 파악한다는 점에서 차별화된다. 이는 도시 공간의 구조적 변화, 예를 들어 특정 지역에 대규모 상업 시설이 들어서면서 발생하는 통행 저항의 변화를 보다 동태적으로 반영할 수 있게 한다. 또한, 이 모형은 확률론적 기초 위에서 통행자의 의사결정 과정을 모사하므로 엔트로피 극대화 모형과도 이론적 궤를 같이한다. 그러나 기회당 선택 확률인 $ L $ 값이 지역이나 통행 목적에 관계없이 일정하다는 가정이 현실과 괴리될 수 있으며, 기회의 순서를 정하는 기준이 모호할 경우 예측력이 저하될 수 있다는 점은 주요한 한계로 지적된다. 그럼에도 불구하고 공간적 상호작용을 인간의 선택 행태와 결합하여 정교화했다는 점에서 계량지리학 및 교통공학 분야의 중요한 기초 이론으로 평가받는다.

엔트로피 극대화 이론의 적용

엔트로피 극대화 이론(Entropy Maximization Theory)은 1967년 앨런 윌슨(Alan Wilson)이 통계역학(Statistical Mechanics)의 원리를 교통 계획에 도입하면서 체계화되었다. 기존의 중력 모형이 뉴턴의 물리 법칙을 단순 유추하는 데 그쳤다면, 이 이론은 정보 이론(Information Theory)과 확률론적 근거를 바탕으로 주어진 제약 조건 하에서 가장 발생 가능성이 높은 통행 분포 상태를 수학적으로 도출한다. 이는 시스템 내의 개별 입자들이 특정한 거시적 상태를 형성할 때, 그 상태를 구현할 수 있는 미시적 경우의 수가 최대가 되는 지점이 곧 가장 확률 높은 평형 상태라는 관점에 기초한다.

통행 분포 문제에서 미시적 상태(Microstate)는 개별 통행자가 특정 기점과 종점을 선택하는 구체적인 조합을 의미하며, 거시적 상태(Macrostate)는 각 존 사이의 총 통행량인 $T_{ij}$의 집합으로 정의된다. 전체 통행량 $T$가 주어졌을 때, 특정한 통행 분포 행렬 $\{T_{ij}\}$를 형성하는 방법의 수 $W$는 다음과 같은 조합론적 식으로 표현된다.

$$W = \frac{T!}{\prod_{i} \prod_{j} T_{ij}!}$$

여기서 $T!$은 전체 통행의 순열을 의미하며, 분모는 각 기종점 쌍 사이의 통행량에 대한 중복을 제거하는 역할을 한다. 엔트로피 극대화의 목적은 주어진 제약 조건 하에서 이 $W$를 최대화하는 $T_{ij}$를 찾는 것이다. 계산의 편의를 위해 $W$에 자연로그를 취하고 스털링 근사(Stirling’s approximation)인 $\ln n! \approx n \ln n - n$을 적용하면, 목적 함수는 다음과 같이 엔트로피 형태의 식으로 변환된다.

$$\ln W \approx T \ln T - \sum_{i} \sum_{j} T_{ij} \ln T_{ij}$$

이 최적화 문제는 물리적·사회적 제약 조건을 만족해야 한다. 첫째는 각 기점 $i$에서 발생하는 통행량의 합이 기점 통행 발생량 $O_i$와 같아야 한다는 기점 제약 조건이다. 둘째는 각 종점 $j$로 유입되는 통행량의 합이 종점 통행 유입량 $D_j$와 같아야 한다는 종점 제약 조건이다. 마지막으로 시스템 전체의 총 통행 비용이 일정한 수준 $C$로 유지된다는 비용 제약 조건이 추가된다. 이를 수식으로 나타내면 다음과 같다.

$$\sum_{j} T_{ij} = O_i, \quad \sum_{i} T_{ij} = D_j, \quad \sum_{i} \sum_{j} T_{ij} c_{ij} = C$$

여기서 $c_{ij}$는 기점 $i$에서 종점 $j$까지의 통행 비용을 의미한다. 이러한 등식 제약 조건 하에서 목적 함수를 최대화하기 위해 라그랑주 승수법(Lagrange Multipliers)을 적용한다. 각 제약 조건에 대응하는 라그랑주 승수를 $\lambda_i, \gamma_j, \beta$로 설정하여 라그랑주 함수를 구성하고, $T_{ij}$에 대해 편미분하여 0이 되는 지점을 찾으면 다음과 같은 최적 통행 분포 식을 얻을 수 있다.

$$T_{ij} = \exp(-\lambda_i - 1) \exp(-\gamma_j) \exp(-\beta c_{ij})$$

이 식을 정리하면 최종적으로 이중 제약 중력 모형의 형태인 $T_{ij} = A_i O_i B_j D_j \exp(-\beta c_{ij})$가 도출된다. 여기서 $A_i$와 $B_j$는 각 존의 발생량과 유입량 제약을 만족시키기 위한 균형 계수(Balancing Factors)이며, $\beta$는 통행 비용에 대한 민감도를 나타내는 매개변수이다.

엔트로피 극대화 이론의 적용은 교통 모델링에 있어 중요한 학술적 전환점을 마련하였다. 이는 통행 분포 현상을 단순한 물리적 유추가 아닌, 시스템의 불확실성을 최소화하고 가용한 정보를 최대로 활용하는 통계적 추론의 결과로 해석할 수 있게 하였다. 또한, 이 모델은 로짓 모형(Logit Model)과 수학적으로 밀접한 연관성을 지니고 있어, 이후 개별 행태 모형과의 이론적 통합을 가능케 하는 토대가 되었다. ⁷⁾

통행 분포 모형의 보정 및 검증

통행 분포 모형의 구축 단계가 완료되면 해당 모형이 실제 관측된 통행 행태를 어느 정도의 정밀도로 재현하는지 평가하고, 모형 내 매개변수(parameter)를 최적화하는 모형 보정(Calibration) 및 모형 검증(Validation) 과정을 거쳐야 한다. 모형 보정은 주로 중력 모형의 마찰 함수(Friction Function)에 포함된 미지의 계수를 결정하는 작업으로, 관측된 기종점 행렬과 모형에 의해 추정된 행렬 사이의 오차를 최소화하는 방향으로 수행된다. 이 과정은 단순히 수치적 일치만을 목적으로 하는 것이 아니라, 해당 교통 체계의 공간적 특성과 사회경제적 요인이 모형에 적절히 투영되었는지 확인하여 학술적 타당성을 확보하는 절차이다.

보정 과정에서 가장 핵심적인 척도로 활용되는 것은 통행 시간 빈도(Trip Time Frequency, TTF) 분포이다. 이는 전체 통행 중 특정 시간 간격(예: 5분 단위의 계급)에 속하는 통행의 비율을 나타낸 곡선이다. 보정이 적절히 이루어진 모형이라면 관측 데이터에서 얻은 통행 시간 빈도 곡선과 모형이 예측한 곡선이 통계적으로 유사한 형태를 보여야 한다. 만약 모형에 의한 평균 통행 시간이 관측치보다 크게 나타난다면, 이는 모형 내의 통행 저항이 과다하게 설정되었음을 의미하므로 마찰 함수의 매개변수를 조정하는 과정을 반복한다. 이러한 반복 계산에는 주로 최우추정법(Maximum Likelihood Estimation, MLE)이나 뉴턴-랩슨(Newton-Raphson) 방법과 같은 수치 해석적 방법론이 동원된다.

모형의 적합도를 정량적으로 평가하기 위해 다양한 통계적 지표가 사용된다. 대표적으로 결정계수($R^2$)와 평균 제곱근 오차(Root Mean Square Error, RMSE)가 활용된다. 특히 교통 계획 실무에서는 전체 오차의 크기를 상대적으로 파악하기 위해 다음과 같은 퍼센트 평균 제곱근 오차(%RMSE)를 널리 사용한다.

$$ \% \text{RMSE} = \frac{\sqrt{\frac{\sum_{i} \sum_{j} (T_{ij} - \hat{T}_{ij})^2}{N}}}{\frac{\sum_{i} \sum_{j} T_{ij}}{N}} \times 100 $$

여기서 $T_{ij}$는 관측된 통행량, $\hat{T}_{ij}$는 모형에 의해 추정된 통행량, $N$은 존 쌍(Zone pair)의 총 개수를 의미한다. 일반적으로 %RMSE 값이 낮을수록 모형의 재현성이 높은 것으로 판단하며, 통행량이 많은 주요 간선 구간이나 대규모 존 쌍에서의 오차를 줄이는 것이 검증의 주된 목표가 된다.

특정 지역 간의 통행량이 지형적 장벽이나 사회문화적 특수성으로 인해 일반적인 중력 모형으로 설명되지 않을 경우, K-요소(K-factor)라고 불리는 사회경제적 보정 계수를 도입하기도 한다. $K_{ij}$는 특정 기종점 쌍 $(i, j)$ 간의 통행 특성을 수치적으로 조정하는 역할을 수행한다. 그러나 K-요소는 이론적 근거 없이 관측치와의 오차를 줄이기 위한 수단으로 남용될 위험이 있다. 따라서 현대 교통 계획에서는 K-요소의 사용을 최소화하고, 대신 마찰 함수의 정교화나 로그 선형 모형(Log-linear model) 등을 통해 모형 자체의 설명력을 높이는 방향을 권장한다.

최종적인 검증 단계에서는 보정된 모형을 구축 시 사용되지 않은 별도의 관측 데이터와 비교하여 모형의 예측력을 시험한다. 이 과정에서 기종점별 합계가 통행 발생 단계에서 산출된 유출 및 유입량과 일치하는지 확인하는 수렴 판정을 병행한다. 만약 허용 오차 범위를 벗어날 경우, 프라타 방법(Fratar method) 등 반복 보정 기법을 재적용하여 행렬의 균형을 맞춘다. 이러한 체계적인 보정과 검증은 통행 분포 단계의 결과물이 후속 단계인 교통 수단 선택 및 노선 배분에 미치는 연쇄적인 오차 전이를 방지하는 필수적인 안전장치 역할을 한다.

기종점 행렬의 전수화와 보정

통행 분포 단계에서 구축되는 기종점 행렬(Origin-Destination Matrix, O-D Matrix)은 해당 지역 내 모든 통행자의 움직임을 직접 관측하여 작성하는 것이 현실적으로 불가능하기 때문에, 통상적으로 전체 가구 중 일부를 추출하여 조사하는 표본 조사 방식을 취한다. 대표적인 방식인 가구통행실태조사를 통해 수집된 데이터는 표본 집단의 통행 행태만을 나타내므로, 이를 해당 연구 지역의 전체 인구 규모로 확장하는 전수화(Expansion) 과정이 필수적으로 요구된다. 전수화의 기본 원리는 각 표본 통행에 적절한 가중치인 전수화 계수(Expansion Factor)를 곱하여 모집단의 통행량을 추정하는 것이다. 가장 단순한 형태의 전수화 계수 $ w_i $는 특정 교통 분석 존 $ i $의 전체 가구 수 $ N_i $를 유효 응답 가구 수 $ n_i $로 나눈 값으로 정의된다.

$$ w_i = \frac{N_i}{n_i} $$

그러나 실제 조사 과정에서는 가구 규모, 소득 수준, 차량 보유 여부 등에 따라 응답률이 상이하게 나타나는 층화 편향이 발생할 수 있다. 이를 보완하기 위해 인구통계학적 특성을 고려한 다차원 가중치 조정법을 적용하여 전수화의 정확도를 높인다. 전수화된 기종점 행렬은 각 존에서 발생하는 통행 발생량의 총합과 일치해야 하며, 이 과정에서 발생하는 통계적 불일치는 반복 보정 기법을 통해 조정된다.

전수화가 완료된 행렬이라 할지라도 조사 과정에서의 누락, 응답자의 기억 오류, 혹은 조사 시점과 분석 시점 사이의 시차 등으로 인해 실제 도로상의 소통 현황과 괴리가 발생할 수 있다. 이러한 오차를 수정하기 위해 수행하는 과정이 보정(Adjustment)이다. 보정의 가장 고전적이고 핵심적인 방법은 스크린라인(Screenline) 조사를 활용하는 것이다. 스크린라인이란 연구 지역을 가로지르는 하천, 철도, 산맥 등 지형지물을 따라 설정한 가상의 선으로, 이 선을 통과하는 모든 도로상의 교통량을 실측하여 기종점 행렬상의 통행량 합계와 비교한다. 특정 스크린라인을 통과하는 관측 교통량을 $ V_{obs} $, 행렬로부터 배정된 추정 교통량을 $ V_{est} $라고 할 때, 보정 계수 $ K $는 다음과 같이 산출된다.

$$ K = \frac{V_{obs}}{V_{est}} $$

산출된 보정 계수를 해당 스크린라인을 통과하는 모든 기종점 쌍(O-D pair)의 통행량에 곱하여 행렬을 수정한다. 만약 여러 개의 스크린라인이나 지역 경계선인 코드라인(Cordon Line)이 존재할 경우, 각 라인을 통과하는 통행량의 독립성과 중복성을 고려하여 반복적으로 계수를 적용한다.

현대 교통 계획에서는 단순히 특정 선을 통과하는 합계치를 맞추는 것을 넘어, 주요 링크(Link)별 관측 교통량을 제약 조건으로 하여 기종점 행렬 자체를 직접 추정하거나 미세 조정하는 수학적 최적화 기법이 널리 활용된다. 이는 통행 배정의 역과정으로 이해될 수 있으며, 주로 최대우도법(Maximum Likelihood Estimation)이나 엔트로피 극대화 원리를 적용한다. 관측된 링크 교통량 $ %%//%%a $가 주어졌을 때, 추정된 기종점 통행량 $ T%%//%%{ij} $와 해당 링크를 통과하는 통행 비율 $ p_{ij}^a $ 사이의 관계식 $ %%//%%{i,j} T%%//%%{ij} p_{ij}^a = _a $를 만족하면서, 기초 행렬과의 차이를 최소화하는 방향으로 행렬을 수정한다. 이러한 보정 과정은 모형의 신뢰도를 확보하고, 향후 수행될 수단 분담 및 통행 배정 단계에서의 예측 오차를 최소화하는 데 결정적인 역할을 한다. 다만 지나친 보정은 모형의 설명력을 약화시키고 관측치에만 매몰된 결과를 초래할 수 있으므로, 보정 전후의 행렬 구조 변화에 대한 통계적 검토가 병행되어야 한다.

통행 시간 빈도 분포 분석

통행 분포 모형, 특히 중력 모형의 신뢰성을 확보하기 위해서는 모형을 통해 추정된 결과가 실제 통행 행태를 충실히 재현하고 있는지 검증해야 한다. 이 과정에서 가장 널리 활용되는 방법 중 하나가 통행 시간 빈도 분포(Travel Time Frequency Distribution, TTFD) 분석이다. 통행 시간 빈도 분포란 전체 통행을 통행 시간에 따라 일정 간격으로 구분하여 각 시간대별로 발생하는 통행의 비율이나 횟수를 나타낸 것이다. 이 분석의 핵심적인 목적은 기종점 조사(Origin-Destination Survey) 등을 통해 얻어진 실제 관측 분포와 모형에 의해 계산된 예측 분포 사이의 일치성을 검토하여, 모형 내 마찰 함수의 적절성을 판정하는 데 있다.

분석의 첫 단계는 관측 데이터와 예측 데이터를 동일한 시간 단위의 히스토그램으로 시각화하여 비교하는 것이다. 일반적으로 통행 시간 빈도 분포는 단거리 통행이 빈번하고 장거리 통행으로 갈수록 빈도가 급격히 감소하는 감쇠 현상을 보이며, 이는 대개 감마 분포(Gamma distribution)나 음의 지수 분포와 유사한 형태를 띤다. 만약 모형에 의해 생성된 곡선이 관측된 곡선보다 왼쪽으로 치우쳐 있다면 이는 모형이 단거리 통행을 과다 추정하고 있음을 의미하며, 반대의 경우는 장거리 통행을 과다 추정하고 있음을 시사한다. 이러한 시각적 비교는 모형의 구조적 편향성을 직관적으로 파악할 수 있게 해준다.

정량적인 적합도 판정을 위해 가장 우선적으로 검토되는 지표는 평균 통행 시간(Mean Travel Time)이다. 교통 계획의 실무 지침에서는 관측된 평균 통행 시간과 모형에 의한 평균 통행 시간의 차이가 유의미한 범위 내에 들어올 것을 요구한다. 평균 통행 시간은 통행 분포의 중심 경향성을 나타내는 핵심 지표로서, 만약 두 수치의 차이가 통상적인 허용 오차 범위를 벗어난다면 모형의 마찰 계수 보정이 미흡한 것으로 간주된다. 또한, 전체 분포의 형태적 유사성을 엄밀하게 평가하기 위해 카이제곱 검정(Chi-square Test)이나 콜모고로프-스미르노프 검정(Kolmogorov-Smirnov Test)과 같은 통계적 기법을 활용하여 두 분포가 통계적으로 동일한 모집단에서 추출되었는지를 검증하기도 한다.

통행 시간 빈도 분포의 불일치가 발견될 경우, 분석가는 중력 모형의 매개변수를 재조정하는 과정을 거쳐야 한다. 이는 주로 마찰 함수의 함수 형태를 변경하거나 함수 내의 저항 계수 값을 수정하는 방식으로 이루어진다. 예를 들어, 특정 시간대에서 관측치와 예측치의 괴리가 반복적으로 나타난다면 해당 구간의 통행 저항을 설명하는 마찰 인자가 실제 통행자의 저항감을 제대로 반영하지 못하고 있을 가능성이 크다. 따라서 통행 시간 빈도 분포 분석은 단순한 사후 검증에 그치지 않고, 모형의 정교화를 위한 반복적인 모형 보정 과정의 핵심적인 환류 기법으로 기능한다. 이를 통해 최종적으로 도출된 통행 분포 결과는 향후 수단 분담 및 노선 배분 단계의 기초 자료로서 높은 신뢰도를 확보하게 된다.

¹⁾

Gravity model in the Korean highway, http://stacks.iop.org/0295-5075/81/i=4/a=48005

²⁾ , ³⁾

Space Syntax를 이용한 교통수요예측의 중력모형 저항함수의 개선방안, https://scienceon.kisti.re.kr/srch/selectPORSrchArticle.do?cn=JAKO201913458198222

⁴⁾

Multiple gravity laws for human mobility within cities, https://link.springer.com/content/pdf/10.1140/epjds/s13688-023-00438-x.pdf

⁵⁾

수도권 화물자동차 통행분포를 위한 도착지선택모형: 집계중력모형과 실증비교, https://journal.kci.go.kr/krihs/archive/articlePdf?artiId=ART001429716

⁶⁾

Wilson, A.G. (1967). A statistical theory of spatial distribution models. Transportation Research, 1(3), 253-269. https://doi.org/10.1016/0041-1647(67)90035-4

⁷⁾

A statistical theory of spatial distribution models, https://www.sciencedirect.com/science/article/abs/pii/0041164767900354

목차