교통 수요 예측(Transportation Demand Forecasting)은 미래의 특정 시점에 발생할 교통량과 통행 행태를 과학적이고 체계적인 수리 기법을 통해 추정하는 과정이다. 이는 도시 계획 및 교통 공학의 핵심적인 영역으로, 한정된 자원을 효율적으로 배분하여 사회기반시설을 확충하고 운영하기 위한 의사결정의 기초 자료를 제공한다. 학술적으로 교통 수요 예측은 단순히 과거의 추세를 연장하는 것을 넘어, 인구 구조의 변화, 경제 성장, 토지 이용의 패턴, 그리고 교통 기술의 발달 등 다양한 변수 간의 인과관계를 분석하는 다학제적 성격을 띤다.
교통 체계는 크게 통행자(User), 교통수단(Mode), 그리고 교통 시설(Facility)이라는 세 가지 기본 요소로 구성되며, 이들은 상호 유기적인 관계를 맺는다. 통행자는 자신의 효용 극대화를 위해 특정 수단과 경로를 선택하며, 이러한 개별적 선택이 모여 전체적인 교통 수요를 형성한다. 교통 시설은 공급의 측면에서 통행의 시간과 비용에 영향을 미치며, 교통수단은 시설과 통행자를 매개하는 역할을 수행한다. 교통 수요 예측의 기초 이론은 이러한 요소들 사이의 수요와 공급 원리를 바탕으로 하며, 특히 교통 시설의 공급이 새로운 수요를 창출하거나 기존 수요의 경로를 변경시키는 메커니즘을 규명하는 데 중점을 둔다.
교통 수요의 가장 중요한 특성 중 하나는 그것이 파생 수요(Derived Demand)라는 점이다. 통행 자체가 목적인 경우보다는 업무, 쇼핑, 교육 등 다른 사회경제적 활동을 수행하기 위한 수단으로서 교통이 소비된다는 의미이다. 따라서 교통 수요를 정확히 예측하기 위해서는 해당 지역의 토지 이용(Land Use) 체계에 대한 심도 있는 이해가 선행되어야 한다. 토지 이용과 교통은 이른바 ’토지 이용-교통 피드백 루프(Land Use-Transport Feedback Cycle)’를 형성한다. 특정 지역의 토지 이용 밀도가 높아지면 통행 유발량이 증가하고, 이는 새로운 교통 시설의 확충을 불러오며, 개선된 접근성(Accessibility)은 다시 해당 지역의 지가 상승과 토지 이용의 고도화를 유도하는 순환 구조를 가진다.
이러한 상호작용을 정량화하기 위해 접근성 지표가 자주 활용된다. 일반적인 접근성 지표 $ A_i $는 특정 지역 $ i $에서 다른 지역 $ j $로 이동할 때의 편의성을 나타내며, 다음과 같은 수식으로 표현될 수 있다.
$$ A_i = \sum_{j} W_j \cdot f(c_{ij}) $$
여기서 $ W_j $는 목적지 $ j $의 매력도(예: 고용자 수, 매장 면적 등)를 의미하며, $ f(c_{ij}) $는 지역 $ i $와 $ j $ 사이의 통행 비용 $ c_{ij} $에 따른 마찰 함수이다. 이 모델은 교통망의 변화가 지역 간의 연결성을 어떻게 변화시키고, 결과적으로 통행 분포에 어떠한 영향을 미치는지를 설명하는 기초 이론이 된다.
교통 수요 예측의 궁극적인 목적은 미래의 불확실성을 최소화하여 정책적 판단의 신뢰성을 제고하는 데 있다. 대규모 예산이 투입되는 철도나 고속도로 건설 사업의 경우, 잘못된 수요 예측은 막대한 예산 낭비나 심각한 교통 혼잡을 초래할 수 있다. 따라서 예측 과정에서는 단순히 물리적 통행량만을 산출하는 것이 아니라, 탄소 중립과 같은 환경적 가치나 지속 가능한 발전을 고려한 정책 시나리오를 반영하여 사회적 편익을 극대화하는 방향으로 전개된다. 이는 현대 교통 수요 예측이 단순한 기술적 추정을 넘어 사회 후생을 최적화하기 위한 필수적인 공공 정책 도구로 자리 잡았음을 의미한다.1)
교통 수요 예측(Transportation Demand Forecasting)은 미래의 특정 시점에 발생할 교통 활동의 양과 그 분포 양상을 과학적이고 체계적인 방법론을 통해 정량적으로 추정하는 일련의 과정을 의미한다. 이는 단순히 과거의 추세를 연장하는 작업에 그치지 않고, 미래의 토지 이용, 인구 통계적 변화, 경제 성장 및 교통 체계의 공급 변화 등 다양한 변수 간의 상호작용을 수리적 모형으로 구현하는 학문적 행위이다. 교통 수요 예측의 근간은 통행자가 자신의 효용을 극대화하기 위해 통행 여부, 목적지, 교통수단 및 주행 경로를 결정한다는 합리적 선택 이론에 두고 있으며, 이를 통해 복잡한 사회적 이동 현상을 예측 가능한 체계 내로 편입시킨다.
학문적 범위에서 교통 수요 예측은 교통 공학(Transportation Engineering)의 하부 영역이자 도시 계획(Urban Planning) 및 지역 경제학(Regional Economics)과 밀접하게 연계된 다학제적 성격을 띤다. 예측의 과정은 크게 공간적 범위, 시간적 범위, 그리고 내용적 범위로 구분된다. 공간적 범위는 분석의 기본 단위가 되는 교통 분석 존(Traffic Analysis Zone, TAZ)의 설정과 직접 및 간접 영향권의 획정 문제를 다룬다. 시간적 범위는 현재의 교통 현황을 파악하는 기준연도(Base Year)와 계획된 시설이 완공되거나 운영되는 미래의 목표연도(Target Year)를 설정하고, 그 사이의 변화 추이를 단계별로 분석하는 것을 포함한다.
내용적 범위 측면에서 교통 수요 예측은 개별 경제 주체의 통행 행태를 분석하는 미시적 접근과 지역 간의 총체적인 물동량 및 인구 이동을 다루는 거시적 접근을 모두 포괄한다. 구체적으로는 통행의 목적(출근, 등교, 쇼핑 등), 이용 수단(승용차, 버스, 지하철 등), 통행 시간대별 집중률 등을 분석하며, 최종적으로는 도로망이나 철도망과 같은 물리적 네트워크상에 부과되는 교통량(Traffic Volume)을 산출한다. 이러한 예측 결과는 국가 및 지방자치단체의 사회기반시설 투자 우선순위를 결정하는 예비타당성 조사의 핵심 기초 자료로 활용되며, 교통영향평가를 통해 대규모 개발 사업이 주변 교통 체계에 미치는 부하를 검토하는 근거가 된다.
교통 수요 예측의 논리적 구조는 일반적으로 다음과 같은 함수 관계로 표현될 수 있다. 특정 지역이나 노선의 교통 수요 $ D $는 해당 지역의 사회경제적 특성 $ S $와 교통 체계의 서비스 수준 $ T $의 함수로 정의된다.
$$ D = f(S, T) $$
여기서 $ S $는 인구, 고용 위락 시설의 수 등을 포함하며, $ T $는 통행 시간, 통행 비용, 접근성 등 교통 공급 측면의 변수를 의미한다. 이처럼 교통 수요 예측은 사회의 동태적인 변화를 수치화하여 교통 정책 수립의 불확실성을 최소화하고, 한정된 공공 자원을 효율적으로 배분하기 위한 과학적 도구로서 그 학문적 위상을 점하고 있다.2)
교통 수요(Transportation Demand)는 일반적인 재화에 대한 소비 수요와 구별되는 독특한 경제적·물리적 특성을 지닌다. 가장 근본적인 특징은 교통 수요가 그 자체로 목적이 되는 직접 수요가 아니라, 특정 장소에서 수행하려는 활동을 위해 발생하는 파생 수요(Derived Demand)라는 점이다. 인간은 노동, 교육, 쇼핑, 오락 등의 사회경제적 활동을 수행하기 위해 공간적 이동을 선택하며, 이 과정에서 교통 서비스에 대한 수요가 창출된다. 따라서 교통 수요를 분석할 때는 단순히 통행량의 수치적 변화만을 살피는 것이 아니라, 해당 통행을 유발하는 토지 이용 체계와 거주자의 생활 양식을 함께 고찰해야 한다. 이러한 파생적 성격으로 인해 교통 수요는 통행의 목적지에 위치한 시설의 매력도와 출발지에서의 접근성에 의해 결정되는 경향이 강하다.
교통 수요의 또 다른 핵심적 특성은 시간적 및 공간적 집중성이다. 교통 수요는 하루 24시간 동안 균등하게 발생하는 것이 아니라, 출퇴근이나 등하교와 같은 특정 시간대에 폭발적으로 증가하는 시간적 집중성(Temporal Concentration)을 보인다. 이를 교통 공학에서는 첨두시(Peak hour) 현상이라 하며, 이 시기에 발생하는 교통량은 도로의 교통 용량(Capacity)을 초과하여 교통 혼잡을 야기한다. 공간적으로도 특정 지역, 대개 중심 업무 지구(Central Business District, CBD)나 대규모 상업 지구로 통행이 집중되는 공간적 집중성(Spatial Concentration)이 나타난다. 이러한 시공간적 집중성은 교통 시설의 효율적 운영을 저해하는 요소로 작용한다. 교통 시설의 규모는 대개 첨두시의 수요를 감당할 수 있도록 설계되는데, 이는 비첨두시에는 시설의 상당 부분이 유휴 상태로 방치되어 자원의 낭비를 초래함을 의미한다.
이용자의 선택 행태에 따른 변동성 또한 교통 수요 예측에서 중요하게 다루어지는 특성이다. 개별 통행자는 자신의 효용(Utility)을 극대화하기 위해 교통수단과 경로를 선택하며, 이 과정에서 통행 시간, 통행 비용, 정시성, 쾌적성 등 다양한 변수를 고려한다. 이러한 행태는 이산 선택 이론(Discrete Choice Theory)으로 설명될 수 있다. 통행자가 체감하는 총체적 비용인 일반화 비용(Generalized Cost)은 다음과 같은 수식으로 표현되곤 한다.
$ GC = C + T + D $
여기서 $ C $는 직접적인 화폐 비용, $ T $는 통행 시간, $ D $는 기타 불편함을 나타내며, $ $와 $ $는 각각의 가중치를 의미한다. 이용자는 이러한 비용을 최소화하는 방향으로 의사결정을 내리지만, 이는 가구의 소득 수준, 차량 보유 여부, 개인적 선호도에 따라 매우 가변적이다. 특히 최근에는 공유 경제의 확산과 자율주행 기술의 도입으로 인해 이용자의 선택지가 다양해지면서 수요의 변동성과 불확실성이 더욱 증대되고 있다.
마지막으로 교통 수요는 공급과의 상호작용을 통해 스스로 변화하는 동태적 특성을 지닌다. 도로가 신설되거나 확장되어 통행 여건이 개선되면, 기존에 통행을 포기했던 잠재적 수요가 실제 통행으로 전환되거나 타 수단 및 타 경로에서 유입되는 유발 수요(Induced Demand)가 발생한다. 이는 교통 공급의 확충이 반드시 혼잡의 완화로 이어지지 않을 수 있음을 시사하는 브래스 역설(Braess’s Paradox)과도 맥을 같이 한다. 따라서 현대의 교통 수요 예측은 단순히 과거의 추세를 연장하는 방식을 넘어, 이용자의 복합적인 심리적·행태적 변화와 공급 체계의 피드백 메커니즘을 정밀하게 반영하는 방향으로 발전하고 있다.
교통 수요 예측은 미래의 교통 현상을 과학적으로 규명하여 합리적인 교통 정책을 수립하고, 한정된 공공 재원을 효율적으로 배분하기 위한 필수적인 과정이다. 현대 사회에서 교통망은 국가의 경제 활동을 뒷받침하는 핵심적인 사회기반시설(Social Infrastructure)로서의 기능을 수행하며, 이러한 시설의 확충과 운영에는 막대한 자본과 시간이 투입된다. 따라서 교통 수요 예측은 단순히 장래의 통행량을 추정하는 기술적 단계를 넘어, 사회적 비용을 최소화하고 공익을 극대화하기 위한 정책적 의사결정의 객관적 근거를 제공하는 데 그 목적이 있다.
가장 우선적인 필요성은 사회기반시설 투자 효율성의 제고에 있다. 도로, 철도, 공항과 같은 교통 시설은 건설에 거대한 예산이 소요될 뿐만 아니라, 한 번 구축되면 그 구조를 변경하거나 되돌리기 어려운 비가역성(Irreversibility)을 지닌다. 만약 수요를 과다하게 예측하여 과잉 투자가 이루어질 경우, 시설의 유휴화로 인한 국가 예산의 낭비와 유지보수 비용의 가중이라는 부작용을 초래한다. 반대로 수요를 과소 예측할 경우, 시설 완공 직후부터 심각한 교통 혼잡이 발생하여 물류비용 증가와 사회적 불편을 야기하게 된다. 이러한 오류를 방지하기 위해 예비타당성 조사 과정에서 교통 수요 예측을 통해 사업의 경제적 타당성을 엄격히 검증하며, 이를 통해 기회비용을 최소화하는 최적의 투자 우선순위를 결정한다.
또한, 교통 수요 예측은 도시 내 교통 혼잡 완화 및 운영 전략 수립을 위해 반드시 필요하다. 과거의 교통 정책이 주로 공급 확대를 통한 혼잡 해결에 집중했다면, 현대의 교통 계획은 기존 시설의 이용 효율을 극대화하는 교통 수요 관리(Transportation Demand Management, TDM)로 패러다임이 전환되고 있다. 특정 구간이나 시간대에 집중되는 수요를 정량적으로 분석함으로써 혼잡통행료 부과, 버스 전용 차로제 도입, 지능형 교통 체계(Intelligent Transport Systems, ITS) 구축 등의 정책적 대안이 가져올 효과를 사전에 시뮬레이션할 수 있다. 이는 물리적인 도로 확장 없이도 교통 흐름을 개선하고 도시의 이동성을 확보하는 데 기여한다.
환경 영향 평가 및 지속 가능한 발전을 도모하는 측면에서도 수요 예측의 역할은 지대하다. 교통 부문은 대기 오염 물질 배출과 에너지 소비의 비중이 높은 분야로, 미래의 교통량 변화는 곧 해당 지역의 환경의 질과 직결된다. 교통 수요 예측 결과를 바탕으로 자동차 배출가스에 의한 온실가스 배출량을 산정하고, 이를 통해 환경 영향 평가를 수행함으로써 개발 사업이 생태계에 미치는 부정적 외부 효과를 사전에 검토할 수 있다. 이는 기후 변화 대응을 위한 국가적 탄소 중립 전략 수립과 친환경 교통수단으로의 수단 전환(Modal Shift) 정책을 뒷받침하는 핵심 데이터로 활용된다.
마지막으로 교통 수요 예측은 토지 이용 계획과 교통 체계 간의 유기적인 결합을 가능하게 한다. 도시의 공간 구조 변화와 인구 통계적 특성 변화는 교통 수요의 양과 패턴을 근본적으로 변화시킨다. 따라서 예측 과정을 통해 신도시 개발이나 산업 단지 조성에 따른 유발 수요를 파악하고, 이에 대응하는 교통 인프라를 적기에 공급함으로써 도시의 무분별한 확산을 방지하고 효율적인 도시 계획을 실현할 수 있다. 결론적으로 교통 수요 예측은 공공 부문의 투명한 행정을 실현하고, 시민의 삶의 질을 향상시키기 위한 과학적 행정의 토대라고 할 수 있다.
교통 계획(Transportation Planning)의 초기 단계는 20세기 초반 급격한 도시화와 자동차 보급에 따른 교통 혼잡 문제에 대응하기 위해 태동하였다. 당시의 예측 기법은 과학적 수리 모형에 기반하기보다는 과거의 교통량 증가 추세를 미래 시점으로 단순 확장하는 추세 연장법(Trend Extrapolation)이 주를 이루었다. 이는 인구 증가와 경제 성장이 일정한 비율로 지속될 것이라는 가정을 전제로 하며, 교통 체계 내부의 복잡한 상호작용이나 이용자의 선택 행태 변화를 반영하지 못한다는 한계가 있었다. 초기 조사 기법 역시 주요 교차로에서의 단순 교통량 조사와 같은 단편적인 데이터 수집 수준에 머물렀으며, 이는 장기적인 도시 구조 변화를 예측하기에는 역부족이었다.
현대적 교통 수요 예측의 기틀은 1950년대 미국에서 수행된 시카고 도시권 교통 연구(Chicago Area Transportation Study, CATS)를 통해 마련되었다. 이 연구를 기점으로 토지 이용과 교통 발생 간의 상관관계를 체계적으로 분석하려는 시도가 본격화되었으며, 이는 오늘날까지 교통 계획의 표준으로 활용되는 4단계 수요 예측 모형의 정립으로 이어졌다. 해당 모형은 통행 발생, 통행 분포, 수단 분담, 노선 배정의 네 단계를 거치며 대규모 교통 인프라 투자 결정을 위한 객관적이고 수치화된 근거를 제공하였다. 특히 물리적 법칙인 뉴턴의 만유인력 법칙을 응용한 중력 모형(Gravity Model)의 도입은 지역 간 통행 분포를 정량화하는 데 결정적인 역할을 하였다.
1970년대에 이르러 교통 수요 예측은 계량경제학(Econometrics)과 결합하며 이론적 깊이를 더하게 되었다. 기존의 4단계 모형이 지역 단위의 집계적(aggregate) 데이터에 의존했던 것과 달리, 이용자 개인의 의사결정 과정을 분석하려는 개별 행태 모형(Disaggregate Model)이 등장하였다. 대니얼 맥패든(Daniel McFadden)에 의해 정립된 이산 선택 모형(Discrete Choice Model)은 확률적 효용 이론(Random Utility Theory)을 바탕으로 교통 수요 예측의 패러다임을 전환하였다. 개인이 특정 교통수단을 선택할 확률은 각 대안이 제공하는 효용에 비례한다는 원리에 따라, 다음과 같은 로짓 모형(Logit Model)의 기본 구조가 확립되었다.
특정 이용자 $ n $이 대안 $ i $를 선택할 확률 $ P_{in} $은 다음과 같이 정의된다.
$$ P_{in} = \frac{\exp(V_{in})}{\sum_{j \in C_n} \exp(V_{jn})} $$
여기서 $ V_{in} $은 이용자가 대안 $ i $로부터 얻는 관측 가능한 효용(Utility)을 의미하며, 이는 통행 시간, 비용 등 다양한 변수의 선형 결합으로 표현된다. 이러한 미시적 접근법은 통행료 부과나 새로운 교통수단 도입과 같은 정책 변화가 이용자의 구체적인 행태 변화에 미치는 영향을 보다 정밀하게 예측할 수 있게 하였다.
1990년대 이후에는 컴퓨터 연산 능력의 비약적 발전과 지리 정보 시스템(GIS)의 보급에 힘입어 더욱 정교한 모형들이 개발되었다. 단순한 통행 단위의 분석에서 벗어나 개인의 하루 일과와 연계된 활동 기반 모형(Activity-based Model)이 그 대표적인 예이다. 이 모형은 특정 시간대의 통행이 독립적으로 발생하는 것이 아니라, 개인의 연속적인 활동 스케줄 내에서 결정된다는 점에 주목한다. 또한, 최근에는 빅데이터와 인공지능(Artificial Intelligence) 기술이 도입되면서 과거의 정적 모형을 넘어 실시간 교통 상태를 반영하는 동적 수요 예측이 가능해졌다. 기계학습 알고리즘은 비선형적인 교통 패턴과 돌발 상황에 따른 수요 변동을 스스로 학습하여 예측의 신뢰도를 높이는 데 기여하고 있다. 이러한 기술적 진보는 교통 수요 예측이 단순한 시설 확충의 근거를 넘어, 실시간 교통 운영 및 관리 정책의 핵심 도구로 진화하고 있음을 보여준다.
교통 계획(Transportation Planning)의 현대적 기틀이 마련되기 이전인 20세기 초반의 교통 수요 예측은 급격한 산업화와 도시화에 따른 자동차 보급의 폭발적 증가에 대응하기 위한 임시방편적 성격이 강하였다. 당시의 교통 정책은 증가하는 자동차 통행량을 수용하기 위해 도로 공급을 지속적으로 확대하는 ‘예측 및 공급(Predict and Provide)’ 원칙에 기반하였다. 이 시기에는 교통 현상을 설명하는 정교한 수리적 이론이나 행태 모형이 부재하였으므로, 계획가들은 주로 과거의 통계적 추세를 미래로 투영하는 단순한 기법에 의존하였다.
초기 교통 계획의 핵심적인 예측 도구는 추세 연장법(Trend Extrapolation)이었다. 이는 특정 도로 구간이나 지역의 과거 교통량 증가율이 미래에도 일정하게 유지될 것이라는 가정하에, 시계열 데이터를 선형 또는 지수 함수적으로 확장하는 방식이다. 보편적으로 사용된 수식은 다음과 같은 지수 성장 모형의 형태를 띠었다.
$$ T_n = T_0 (1 + r)^n $$
여기서 $ T_n $은 목표 연도의 예측 교통량, $ T_0 $은 기준 연도의 교통량, $ r $은 연평균 교통량 증가율, $ n $은 경과 연수를 의미한다. 이러한 방식은 인구 구조의 변화, 토지 이용 패턴의 변동, 혹은 소득 수준의 변화와 같은 복잡한 사회경제적 변수를 반영하지 못한다는 치명적인 한계가 있었다. 그러나 데이터 수집 기술과 연산 능력이 부족했던 당시 상황에서 추세 연장법은 대규모 도로 건설 사업의 우선순위를 결정하는 가장 현실적인 지표로 활용되었다.
데이터 수집 측면에서는 초기 수준의 교통량 조사(Traffic Volume Survey) 기법이 도입되었다. 1920년대부터 미국과 유럽의 주요 도시에서는 조사원이 특정 지점에서 통과 차량의 대수를 직접 기록하는 계수 조사가 실시되었다. 특히 특정 구역을 설정하고 그 경계선을 통과하는 유입·유출 교통량을 파악하는 외곽선 조사(Cordon Survey)는 도시 내부로 진입하는 교통 부하를 측정하는 주요 수단이었다. 이러한 조사는 주로 첨두 시간대(Peak Hour)의 최대 교통량을 파악하여 도로의 차로 수나 기하 구조를 설계하는 데 목적이 있었다.
이 시기의 예측 기법은 교통 수요를 독립적인 물리적 현상으로 간주하였을 뿐, 토지 이용과의 유기적 상관관계나 이용자의 선택 행태를 고려하지 못하였다. 특히 도로 공급이 새로운 통행을 창출한다는 유발 수요(Induced Demand)의 개념이 정립되지 않았기에, 도로 건설이 일시적인 혼잡 완화 이후 다시 더 큰 혼잡을 불러일으키는 순환적 문제를 해결하는 데 한계를 드러냈다. 이러한 초기 접근법의 한계는 1950년대 이후 시카고 도시권 교통 연구(Chicago Area Transportation Study, CATS)를 기점으로 보다 체계적이고 과학적인 4단계 수요 예측 모형이 등장하게 되는 결정적인 동기가 되었다.
초기 교통 계획에서 활용되던 추세 연장법은 과거의 교통량 증가율이 미래에도 동일하게 지속될 것이라는 단순한 가정에 의존하였다. 그러나 도시 구조가 다변화되고 사회경제적 요인이 교통 행태에 미치는 영향이 복잡해짐에 따라, 단순한 시간적 추계를 넘어선 인과관계의 규명이 요구되었다. 이에 따라 1950년대 후반부터 계량경제학(Econometrics)의 방법론이 교통 수요 예측에 본격적으로 도입되었으며, 이는 교통 현상을 체계적인 이론과 통계적 기법으로 분석하는 계기가 되었다.
계량경제학적 방법론 도입의 핵심은 교통 수요를 인구, 소득, 토지 이용, 자동차 보유 대수 등 다양한 사회경제적 변수들의 함수로 파악하는 것이다. 특히 회귀 분석(Regression Analysis)은 통행 발생량과 그 원인이 되는 독립변수 간의 관계를 정량화하는 데 결정적인 역할을 하였다. 일반적인 다중 회귀 모형(Multiple Regression Model)은 다음과 같은 수식으로 표현된다.
$$ Y = \beta_0 + \beta_1 X_1 + \beta_2 X_2 + \dots + \beta_k X_k + \epsilon $$
여기서 $ Y $는 종속변수인 특정 구역의 통행 발생량을 의미하며, $ X_i $는 해당 지역의 가구 수나 고용 인구와 같은 설명변수이다. $ _i $는 각 변수가 통행량에 미치는 영향력을 나타내는 회귀계수이며, $ $은 모형이 설명하지 못하는 무작위 오차를 나타내는 오차항(Error Term)이다. 이러한 수리적 구조를 통해 연구자는 특정 변수의 변화가 전체 교통 수요에 미치는 파급 효과를 사전에 예측할 수 있게 되었다.
통계적 유의성의 확보는 계량경제학적 접근이 지닌 가장 큰 특징 중 하나이다. 단순히 모형의 수치를 실제 데이터와 유사하게 맞추는 것에 그치지 않고, 도출된 회귀계수가 통계적으로 신뢰할 수 있는지를 엄밀하게 검증한다. 가설 검정(Hypothesis Testing)을 통해 각 설명변수의 유효성을 판단하며, t-통계량(t-statistic)이나 P-값(P-value)을 산출하여 표본 데이터에서 관찰된 관계가 우연에 의한 것인지 혹은 모집단에서도 성립하는 일반적인 법칙인지를 확인한다. 또한 결정 계수(Coefficient of Determination, $ R^2 $)를 활용하여 구축된 모형이 실제 교통 현상을 얼마나 포괄적으로 설명하고 있는지 객관적인 지표로 제시한다.
이러한 방법론적 발전은 미시경제학의 소비자 이론과 결합하면서 학문적 토대를 더욱 공고히 하였다. 교통 이용자를 자신의 효용(Utility)을 극대화하기 위해 합리적인 선택을 내리는 주체로 상정하고, 통행 시간과 비용이라는 경제적 제약 조건 하에서 통행 여부와 수단을 결정하는 과정을 모형화한 것이다. 이는 예측의 초점을 단순한 시설물 중심의 공급 위주에서 인간의 행태와 선택 중심으로 전환하는 계기가 되었으며, 이후 이산 선택 모형(Discrete Choice Model)의 탄생과 개별 행태 모형의 발전으로 이어지는 가교 역할을 수행하였다.
결과적으로 계량경제학적 방법론의 도입은 교통 수요 예측을 직관이나 단순 추정에 의존하던 기술적 단계에서 정밀한 과학적 분석의 영역으로 격상시켰다. 이는 정책 결정자들에게 교통 시설 투자에 대한 타당성을 입증할 수 있는 객관적 근거를 제공하였으며, 다양한 도시 정책 시나리오에 따른 교통 수요의 변화를 사전에 시뮬레이션할 수 있는 분석적 틀을 마련하였다. 이러한 통계적 엄밀함은 현대 교통 계획이 사회기반시설의 효율적 배분이라는 공공의 목적을 달성하는 데 필수적인 신뢰성을 부여하였다.
컴퓨터 연산 능력의 비약적인 향상과 데이터 사이언스의 발전은 전통적인 4단계 수요 예측 모형의 한계를 극복하고, 보다 정밀한 컴퓨터 시뮬레이션(Computer Simulation) 기반의 현대적 통합 시스템을 구축하는 토대가 되었다. 과거의 모형이 지역 단위의 거시적 통계에 의존하였다면, 현대적 시스템은 개별 통행 주체의 의사결정 과정을 상세히 모사하는 미시적 시뮬레이션(Micro-simulation) 기술을 적극적으로 도입하고 있다. 이러한 변화의 중심에는 활동 기반 모형(Activity-Based Model, ABM)과 토지 이용-교통 통합 모형(Land Use-Transport Interaction, LUTI)이 자리하고 있다.
활동 기반 모형은 통행(trip) 그 자체를 분석 단위로 삼던 기존 방식에서 벗어나, 인간의 근본적인 활동 욕구와 그에 따른 일일 활동 스케줄에 초점을 맞춘다. 이 모형은 개인이 하루 동안 수행하는 노동, 교육, 쇼핑 등의 활동 사슬(activity chain)을 구성하고, 각 활동 사이의 이동을 파생된 수요로 파악한다. 이 과정에서 개별 통행자는 자신의 효용 극대화(Utility Maximization) 원리에 따라 수단과 경로를 선택하게 된다. 특정 대안 $ i $가 개인 $ n $에게 주는 효용 $ U_{in} $을 관측 가능한 효용 $ V_{in} $과 오차항 $ %%//%%{in} $의 합으로 정의할 때, 개별 주체가 대안을 선택할 확률 $ P%%//%%{in} $은 다음과 같은 확률적 선택 모형으로 표현된다.
$$ P_{in} = \frac{\exp(V_{in})}{\sum_{j \in C_n} \exp(V_{jn})} $$
이러한 미시적 접근법은 몬테카를로 방법(Monte Carlo method)을 활용하여 수만 명의 가상 대리인(agent)이 도시 네트워크 내에서 상호작용하는 과정을 재현함으로써, 정책 변화에 따른 통행 행태의 변화를 세밀하게 예측할 수 있게 한다3).
현대적 시스템의 또 다른 핵심 축인 토지 이용-교통 통합 모형은 교통 인프라의 변화가 도시 공간 구조에 미치는 장기적인 환류(feedback) 체계를 수리적으로 모델링한다. 새로운 도로가 건설되면 해당 지역의 접근성이 향상되고, 이는 지가 상승과 토지 개발로 이어져 다시 새로운 교통 수요를 창출하는 상호작용이 발생한다. 통합 시스템은 이러한 동적인 인과관계를 반영하여, 교통 계획이 단순한 시설 확충을 넘어 도시의 지속 가능한 성장과 균형 발전에 기여할 수 있도록 돕는다.
또한, 시간의 흐름에 따른 교통 상태의 변화를 실시간으로 반영하는 동적 교통 배정(Dynamic Traffic Assignment, DTA) 기술이 통합 시스템에 결합되었다. 기존의 정적 배정 모형이 첨두시(peak hour)의 평균적인 상태만을 산출하는 것과 달리, 동적 배정은 출발 시각의 선택과 경로의 변경 과정을 시시각각 추적한다. 이는 자율주행 자동차나 공유 경제 기반의 모빌리티 서비스가 도입된 미래 교통 환경을 예측하는 데 필수적인 도구가 된다.
최근의 통합 시스템은 사물인터넷(IoT)과 빅데이터 기술을 통해 수집된 실제 통행 궤적 데이터를 학습하여 모형의 매개변수를 스스로 최적화하는 단계로 진화하고 있다. 이는 도시 전체를 가상 세계에 구현하는 디지털 트윈(Digital Twin) 기술과 결합되어, 스마트 시티 운영을 위한 핵심적인 의사결정 지원 시스템으로 기능한다. 결국 현대적 통합 시스템의 구축은 단순한 수치 예측을 넘어, 복잡한 현대 도시의 문제를 진단하고 다양한 정책 시나리오의 효과를 사전에 검증하는 실험실의 역할을 수행하고 있다4).
전통적 4단계 수요 예측 모형은 교통 계획의 태동기인 1950년대 미국 시카고 교통 조사(Chicago Area Transportation Study, CATS)를 통해 체계화된 이후, 전 세계적으로 표준적인 도시 교통 계획 과정(Urban Transportation Planning Process, UTPP)의 핵심 분석 틀로 자리 잡았다. 이 모형은 복잡한 인간의 통행 행태를 네 개의 논리적 단계, 즉 통행 발생, 통행 분포, 수단 분담, 노선 배정으로 분해하여 순차적으로 예측한다. 각 단계는 독립적인 수리 모형을 기반으로 하며, 상위 단계의 출력값이 하위 단계의 입력값으로 활용되는 하향식(Top-down) 구조를 취한다. 이러한 체계는 대규모 사회기반시설 투자에 따른 장래 교통 수요를 정량적으로 추정하고, 정책 대안의 경제적 타당성을 평가하는 데 중추적인 역할을 수행한다.
첫 번째 단계인 통행 발생(Trip Generation)은 분석 대상 지역인 교통 분석 존(Traffic Analysis Zone, TAZ)별로 발생하는 총 통행의 양을 산정하는 과정이다. 특정 존에서 시작되는 통행 유출량(Trip Production)과 해당 존으로 들어오는 통행 유입량(Trip Attraction)을 결정하며, 이는 주로 해당 지역의 토지 이용 상태, 가구 수, 소득 수준, 자동차 보유 대수 등 사회경제적 변수에 의해 결정된다. 이 단계에서는 주로 계량 경제학적 기법인 다중 회귀 분석이나 가구의 특성에 따라 통행률을 차등 적용하는 카테고리 분석법이 사용된다. 통행 발생 단계의 목적은 교통 체계의 물리적 변화보다는 지역의 활동 집약도에 따른 잠재적 수요의 총량을 파악하는 데 있다.
두 번째 단계인 통행 분포(Trip Distribution)는 발생된 통행이 출발지와 목적지 사이에 어떻게 연결되는지를 결정하는 과정이다. 즉, 각 존에서 발생한 유출량이 어느 목적지로 향하는지를 나타내는 기종점(Origin-Destination, O-D) 행렬을 구축한다. 가장 널리 사용되는 수리 모형은 중력 모형(Gravity Model)으로, 이는 두 지역 간의 통행량이 각 지역의 활동 규모에 비례하고 거리나 통행 시간과 같은 마찰 요인에는 반비례한다는 물리적 법칙을 응용한다. 중력 모형의 일반식은 다음과 같이 표현된다.
$$ T_{ij} = P_i \frac{A_j f(d_{ij}) K_{ij}}{\sum_{k} A_k f(d_{ik}) K_{ik}} $$
여기서 $ T_{ij} $는 지역 $ i $와 $ j $ 사이의 통행량, $ P_i $는 $ i $ 지역의 발생량, $ A_j $는 $ j $ 지역의 유입량, $ f(d_{ij}) $는 거리 감쇠 함수를 의미한다.5) 이 단계를 통해 공간적 수요 구조가 구체화된다.
세 번째 단계인 수단 분담(Modal Split)은 기종점 간의 통행이 승용차, 버스, 지하철 등 어떠한 교통수단을 통해 이루어지는지를 예측한다. 현대 교통 수요 예측에서는 이용자의 효용 극대화 원리를 바탕으로 한 개별 행태 모형이 주류를 이룬다. 특히 로짓 모형(Logit Model)은 특정 수단을 선택할 확률을 각 수단이 제공하는 시간, 비용 등 서비스 특성치로 구성된 효용 함수(Utility Function)의 지수 함수 형태로 산출한다. 이는 이용자가 자신의 비용과 시간을 최소화하려는 합리적 선택 주체라는 전제를 바탕으로 하며, 교통 정책 변화에 따른 수단 전환 효과를 민감하게 반영할 수 있다는 장점이 있다.
마지막 단계인 노선 배정(Traffic Assignment)은 수단별로 결정된 통행량을 실제 도로망이나 철도망의 구체적인 경로에 할당하는 과정이다. 이 단계에서는 도로의 용량 제약(Capacity Restraint)에 따른 혼잡 현상이 중요하게 고려된다. 통행량이 증가함에 따라 통행 시간이 늘어나는 현상을 반영하기 위해 와드롭의 원리(Wardrop’s Principles) 중 제1원리인 사용자 평형(User Equilibrium) 상태를 주로 가정한다.6) 이는 모든 이용자가 자신의 통행 시간을 최소화하는 경로를 선택함으로써, 선택된 모든 경로의 통행 시간이 동일해지고 어떤 이용자도 경로를 변경하여 통행 시간을 단축할 수 없는 상태를 의미한다.
전통적 4단계 모형은 각 단계가 논리적으로 명확하고 대규모 네트워크 분석에 적합하다는 강점을 지니지만, 각 단계가 순차적으로 진행됨에 따라 발생하는 환류(Feedback) 문제와 통행의 연쇄성(Trip Chaining)을 반영하지 못한다는 비판을 받기도 한다. 그럼에도 불구하고 이 모형은 고도의 수리적 엄밀성과 실무적 범용성을 바탕으로 현대 교통 공학의 근간을 이루고 있으며, 최근에는 연산 능력의 비약적 발전에 힘입어 각 단계 간의 상호작용을 정밀하게 교정하는 통합 모형으로 진화하고 있다.
통행 발생(Trip Generation)은 교통 수요 예측의 전통적 4단계 모형 중 가장 먼저 수행되는 단계로, 분석 대상 지역을 분할한 각 교통 분석 존(Traffic Analysis Zone, TAZ)에서 발생하는 총 통행량의 규모를 결정하는 과정이다. 이 단계의 목적은 특정 예측 목표 연도에 각 존에서 시작되는 통행인 ’통행 유출(Trip Production)’과 각 존으로 들어오는 통행인 ’통행 유입(Trip Attraction)’의 총합을 산정하는 데 있다. 통행은 그 자체로 목적이 되는 것이 아니라 경제 활동이나 사회적 교류를 위한 파생 수요의 성격을 지니므로, 통행 발생량은 해당 지역의 사회경제적 지표 및 토지 이용 상태와 밀접한 상관관계를 형성한다.
통행 유출량은 주로 통행을 생성하는 주체인 가구의 특성에 의해 결정된다. 가구원 수, 자동차 보유 대수, 가구 소득, 종사자 수 등이 주요 설명 변수로 활용되며, 이는 가구 통행 실태 조사를 통해 수집된 데이터를 바탕으로 분석된다. 반면 통행 유입량은 통행의 목적지가 되는 지역의 유인력을 나타내며, 해당 존의 고용자 수, 상업 시설의 바닥 면적, 학교의 학생 수 등 토지 이용의 집약도에 따라 좌우된다. 이처럼 통행 발생 단계는 지역 내의 활동량과 교통량 사이의 인과관계를 정량화함으로써 전체 수요의 총량을 확정하는 기초 작업의 역할을 수행한다.
통행 발생량을 추정하기 위해 가장 널리 사용되는 수리적 기법은 회귀 분석(Regression Analysis)이다. 이 방법은 통행량을 종속변수로, 인구 및 고용 등의 사회경제적 요인을 독립변수로 설정하여 그 관계를 선형 함수로 정식화한다. 전형적인 회귀 모형의 구조는 다음과 같다.
$ T_i = + %%//%%1 X%%//%%{i1} + %%//%%2 X%%//%%{i2} + + %%//%%n X%%//%%{in} + $
여기서 $ T_i $는 존 $ i $에서 발생하는 통행량이며, $ X_{in} $은 각 독립변수, $ _n $은 회귀 계수, $ $은 오차항을 의미한다. 최소제곱법을 통해 도출된 회귀 계수는 각 변수가 통행 발생에 미치는 영향력을 나타낸다. 회귀 분석법은 변수 간의 관계를 명확하게 설명할 수 있고 통계적 유의성 검증이 용이하다는 장점이 있으나, 독립변수 간의 다중공선성 문제나 과거의 통행 행태가 미래에도 유지된다는 가정이 전제되어야 한다는 제약이 있다.
또 다른 주요 방법론인 카테고리 분석법(Category Analysis)은 가구를 소득 수준이나 차량 보유 대수 등 특정 기준에 따라 몇 개의 집단으로 분류하고, 각 집단별 평균 통행 발생률을 적용하여 총량을 산출하는 방식이다. 이 기법은 가구 내의 세부적인 특성 변화를 모형에 반영할 수 있어 회귀 분석보다 행태적으로 정밀하다는 평가를 받는다. 특히 소득 증대나 가구 구조의 변화가 통행 패턴에 미치는 영향을 분석하는 데 유리하다. 한편, 가장 단순한 형태인 원단위법(Trip Rate Method)은 면적이나 인구당 발생하는 평균 통행량을 고정된 상수로 취급하여 계산하는데, 계산이 간편하여 기초적인 계획 수립 단계에서 주로 활용된다.
통행 발생 단계에서 산정된 유출량과 유입량의 총합은 이론적으로 일치해야 한다. 그러나 각기 다른 모형과 변수를 사용하여 독립적으로 추정하기 때문에 실제 계산 결과에서는 차이가 발생하는 경우가 일반적이다. 따라서 예측의 일관성을 확보하기 위해 전체 지역의 총 유출량과 총 유입량이 일치하도록 조정하는 과정이 필수적으로 수반된다. 이렇게 확정된 통행 발생량은 다음 단계인 통행 분포 단계의 입력 자료가 되어, 각 존 사이의 구체적인 통행 흐름을 결정하는 근거가 된다.7)
원단위법(Trip Rate Method)은 특정 단위당 발생하는 통행량을 기초로 장래의 통행 발생량을 추정하는 가장 직관적이고 고전적인 기법이다. 이 방법은 교통 분석 존(Traffic Analysis Zone, TAZ) 내의 인구, 가구 수, 종사자 수, 또는 건축물 연면적과 같은 특정 지표를 단위(Unit)로 설정하고, 해당 단위 하나가 하루 동안 생성하거나 유입시키는 평균 통행량을 조사하여 예측에 활용한다. 원단위법의 기본 가정은 현재 관측된 단위당 통행 발생 특성이 미래에도 일정하게 유지되거나, 예측 가능한 추세에 따라 변화한다는 것이다. 특정 존 $i$에서 발생하는 총 통행량 $T_i$를 산출하는 수식은 다음과 같이 정의할 수 있다.
$$ T_i = \sum_{k} (R_k \times X_{ik}) $$
위 식에서 $R_k$는 활동 유형 또는 토지 이용 형태 $k$에 따른 단위당 통행 발생률(Trip Rate)을 의미하며, $X_{ik}$는 해당 존의 사회경제적 지표인 독립변수의 양을 나타낸다. 원단위법은 계산 과정이 단순하고 실무적으로 적용하기 용이하다는 장점이 있으나, 통행 발생에 영향을 미치는 다양한 변수 간의 복잡한 상호작용을 반영하지 못한다는 한계가 있다. 또한, 동일한 범주 내의 개체들이 모두 동일한 통행 특성을 가진다고 가정하므로, 존 내부의 이질성을 무시할 위험이 크다.
회귀분석법(Regression Analysis Method)은 통행 발생량과 이에 영향을 미치는 여러 사회경제적 변수 간의 인과관계를 통계적 함수로 정립하는 기법이다. 원단위법이 단순한 비율에 의존한다면, 회귀분석법은 계량경제학적 접근을 통해 변수 간의 상관관계를 수치화한다. 일반적으로 선형 회귀 분석(Linear Regression Analysis)이 가장 널리 사용되며, 통행 발생량인 종속변수 $Y$와 인구, 자동차 보유 대수, 가구 소득 등의 독립변수 $X_j$ 간의 관계를 다음과 같은 수식으로 표현한다.
$$ Y = \beta_0 + \beta_1 X_1 + \beta_2 X_2 + \dots + \beta_n X_n + \epsilon $$
여기서 $\beta_0$는 상수항, $\beta_j$는 각 독립변수의 영향력을 나타내는 회귀계수이며, $\epsilon$은 모형이 설명하지 못하는 오차항을 의미한다. 회귀분석법은 최소제곱법(Ordinary Least Squares, OLS)을 통해 잔차의 제곱합을 최소화하는 방향으로 계수를 추정한다. 이 방법론의 핵심적인 강점은 모형의 통계적 신뢰성을 정량적으로 검증할 수 있다는 점에 있다. 분석가는 결정계수(Coefficient of Determination, $R^2$)를 통해 모형의 설명력을 파악하고, $t$-검정이나 $F$-검정을 통해 개별 변수와 모형 전체의 통계적 유의성을 판정한다.
두 기법을 비교했을 때, 원단위법은 데이터 수집이 제한적이거나 신속한 판단이 필요한 예비 타당성 조사 단계에서 유용하게 활용된다. 반면, 회귀분석법은 도시의 성장에 따른 복합적인 통행 행태 변화를 설명하는 데 적합하다. 특히 회귀분석법은 변수 간의 다중공선성(Multicollinearity) 문제를 사전에 검토함으로써 독립변수 간의 중복 설명을 배제하고 모형의 정밀도를 높일 수 있다. 그러나 회귀분석법은 독립변수의 장래치를 예측하는 과정에서 또 다른 오차가 개입될 수 있으며, 과거의 상관관계가 미래에도 지속될 것이라는 가정이 무너질 경우 예측력이 급격히 저하될 우려가 있다. 따라서 현대의 교통 계획에서는 분석 대상 지역의 규모와 데이터의 가용성을 고려하여 두 기법을 상호 보완적으로 사용하거나, 집계형 모형의 한계를 극복하기 위해 가구 단위의 미시적 분석을 병행하기도 한다.
카테고리 분석법(Category Analysis) 또는 교차 분류 분석법(Cross-Classification Analysis)은 가구의 사회경제적 특성에 따라 통행 발생 행태가 유사한 집단을 구분하고, 각 집단별 평균 통행 발생량을 산출하여 미래의 수요를 예측하는 기법이다. 이는 통행 발생 단계에서 회귀 분석과 함께 가장 널리 사용되는 방법론 중 하나로, 개별 가구의 특성을 직접적으로 모형에 반영할 수 있다는 점에서 행태 모형으로의 이행 단계에 위치한 기법이라 평가받는다. 이 방법은 분석 대상 지역의 전체 가구를 소득 수준, 자동차 보유 대수, 가구원 수, 주거 형태 등 통행에 직접적인 영향을 미치는 주요 변수들의 조합으로 이루어진 다차원 행렬(Matrix) 내의 특정 ’카테고리’로 분류하는 것에서 시작한다.
이 기법의 핵심적인 전제는 동일한 카테고리에 속하는 가구들은 지리적 위치나 공간적 특성에 관계없이 유사한 통행 발생 특성을 공유한다는 것이다. 예를 들어, 소득이 높고 차량을 2대 이상 보유한 4인 가구는 특정 교통 분석 존(Traffic Analysis Zone, TAZ)에 거주하더라도 다른 존에 거주하는 동일 조건의 가구와 유사한 빈도의 통행을 생성한다고 가정한다. 분석 과정에서는 기준 연도의 설문 조사 데이터를 바탕으로 각 카테고리별 가구당 평균 통행 발생량인 원단위를 산출한다. 이후 장래의 인구 통계적 변화를 예측하여 각 카테고리에 속하게 될 가구의 수를 추정한 뒤, 이를 기 산출된 원단위와 곱하여 최종적인 총 통행 발생량을 도출한다.
카테고리 분석법은 회귀 분석이 지니는 몇 가지 구조적 한계를 효과적으로 극복한다. 첫째, 변수 간의 관계가 반드시 선형적(Linear)일 필요가 없으므로 사회경제적 변수와 통행량 사이의 복잡한 비선형성을 유연하게 수용할 수 있다. 둘째, 존 단위의 집계 데이터를 사용하는 것이 아니라 가구 단위의 개별 데이터를 기초로 하므로, 집계 과정에서 발생하는 정보의 손실과 생태학적 오류(Ecological Fallacy)를 최소화할 수 있다. 셋째, 모형의 구조가 직관적이고 연산 과정이 단순하여 정책 결정자나 실무자가 결과를 해석하고 활용하기에 용이하다는 실무적 장점을 지닌다.
그러나 카테고리 분석법의 정밀도는 분류 기준이 되는 카테고리의 설정과 데이터의 충분성에 크게 의존한다. 분류 기준이 되는 변수가 늘어날수록 행렬의 셀(Cell) 수가 기하급수적으로 증가하게 되는데, 이는 각 셀마다 통계적 유의성을 확보하기 위한 충분한 표본 크기를 요구한다. 만약 특정 카테고리에 할당된 표본이 부족할 경우 해당 셀의 원단위는 신뢰하기 어려워지며, 이는 전체 예측 결과의 왜곡으로 이어진다. 또한, 회귀 분석과 달리 모형 전체의 적합도를 검증할 수 있는 결정계수와 같은 표준화된 통계 지표가 미비하다는 점도 한계로 지적된다.
더욱이 장래 예측 시점에서 각 카테고리별 가구 분포를 정밀하게 추정하는 작업은 그 자체로 매우 까다로운 과제이다. 미래의 가구 소득 분포나 가구 구조의 변화를 예측하는 과정에서 수반되는 불확실성은 카테고리 분석법의 최종 결과에 그대로 전이된다. 따라서 이 기법을 효과적으로 운용하기 위해서는 인구 구조 변화와 경제 성장 추세에 대한 심도 있는 분석이 선행되어야 하며, 최근에는 이러한 한계를 보완하기 위해 이산 선택 모형이나 시뮬레이션 기법을 결합한 하이브리드 형태의 분석 방법론이 연구되고 있다.
통행 분포(Trip Distribution) 단계는 교통 수요 예측의 두 번째 과정으로, 통행 발생 단계에서 추정된 각 교통 분석 존(Traffic Analysis Zone, TAZ)별 총 발생 통행량과 도착 통행량을 공간적으로 연결하는 작업을 수행한다. 이 단계의 핵심 목적은 특정 기점(Origin) $i$에서 특정 종점(Destination) $j$로 이동하는 통행량인 $T_{ij}$를 산출하여, 지역 전체의 통행 패턴을 나타내는 기종점 행렬(Origin-Destination Matrix, O-D 행렬)을 구축하는 것이다. 통행 분포는 단순히 물리적 거리뿐만 아니라 지역 간의 사회경제적 유대 관계와 교통 체계의 서비스 수준을 반영하여 결정된다.
통행 분포를 예측하는 방법론은 크게 성장인자법(Growth Factor Methods)과 합성 모형(Synthetic Models)으로 구분된다. 성장인자법은 현재의 통행 패턴이 미래에도 일정하게 유지된다는 가정하에, 장래의 인구 증가나 토지 이용 변화에 따른 성장률을 기존 기종점 행렬에 곱하여 미래의 통행량을 추정하는 방식이다. 이 방법은 계산이 간편하고 기존의 통행 특성을 잘 반영한다는 장점이 있으나, 교통 시설의 신설이나 대규모 토지 이용 계획의 변화로 인한 통행 패턴의 근본적인 변동을 설명하지 못한다는 한계가 있다.
반면 합성 모형의 대표 격인 중력 모형(Gravity Model)은 뉴턴의 만유인력 법칙을 교통 공학에 응용한 것으로, 두 지역 사이의 통행량은 각 지역의 크기(매력도)에 비례하고 두 지역 간의 거리나 통행 시간과 같은 저항 요소에는 반비례한다는 원리를 기반으로 한다8). 전형적인 중력 모형의 수식은 다음과 같이 표현된다.
$$ T_{ij} = P_i \frac{A_j F_{ij} K_{ij}}{\sum_{k} A_k F_{ik} K_{ik}} $$
여기서 $T_{ij}$는 기점 $i$에서 종점 $j$로의 분포 통행량, $P_i$는 기점 $i$에서 발생하는 총 통행량, $A_j$는 종점 $j$에 도착하는 총 통행량을 의미한다. $F_{ij}$는 두 지역 간의 통행 저항을 나타내는 마찰 계수(Friction Factor)이며, 일반적으로 통행 시간이나 비용의 함수로 정의된다9). $K_{ij}$는 사회경제적 특수성을 반영하기 위한 조정 계수이다. 중력 모형은 지역 간의 상호작용을 이론적으로 설명할 수 있어 신도시 개발이나 도로망 확충과 같은 구조적 변화를 예측하는 데 널리 사용된다10).
현대적 통행 분포 이론은 통계 역학의 원리를 도입한 엔트로피 극대화 모형(Entropy Maximization Model)으로 발전하였다. 이는 주어진 제약 조건 하에서 발생 가능한 통행 조합 중 가장 확률이 높은 상태를 찾는 방식으로, 중력 모형의 이론적 정당성을 수학적으로 뒷받침한다. 특히 기점에서의 유출 합계와 종점에서의 유입 합계가 각각 통행 발생 단계에서 산정된 총량과 일치하도록 강제하는 이중 제약(Doubly Constrained) 조건을 적용함으로써 예측의 정밀도를 높인다. 이러한 과정을 통해 도출된 통행 분포 결과는 이후 수단 분담 단계와 노선 배정 단계의 기초 자료로 활용되며, 전체 교통 체계의 효율성을 평가하는 결정적인 지표가 된다.
성장인자법(Growth Factor Method)은 통행 분포(Trip Distribution) 단계에서 가장 고전적이면서도 직관적인 접근 방식으로, 기준 연도의 기종점 행렬(Origin-Destination Matrix, O-D 행렬)이 미래에도 그 구조적 패턴을 유지한다는 전제하에 각 존의 성장률을 적용하여 장래 통행량을 추정하는 기법이다. 이 방법론은 장래의 토지 이용 계획이나 교통망의 변화가 크지 않은 단기 예측 상황에서 유용하게 활용되며, 특히 기준 연도의 조사 자료가 충분히 신뢰할 만한 경우 강력한 예측력을 발휘한다. 성장인자법의 핵심은 현재의 통행 패턴이 미래의 통행 분포를 결정하는 가장 중요한 지표라는 안정성 가정에 기반한다는 점이다.
가장 단순한 형태인 단일성장인자법(Uniform Growth Factor Method)은 대상 지역 전체의 평균적인 성장률을 모든 기종점 쌍에 동일하게 적용한다. 기준 연도의 기점 $i$에서 종점 $j$로의 통행량을 $t_{ij}$, 지역 전체의 장래 총 통행 발생량을 $T$, 현재 총 통행 발생량을 $t$라고 할 때, 장래 통행량 $T_{ij}$는 다음과 같이 산출된다.
$$ T_{ij} = t_{ij} \times \frac{T}{t} = t_{ij} \times F $$
여기서 $F$는 지역 전체의 성장인자를 의미한다. 이 방식은 계산이 매우 간편하다는 장점이 있으나, 지역 내 각 교통 분석 존(Traffic Analysis Zone, TAZ)별로 상이한 성장 추세를 반영하지 못한다는 결정적인 한계가 있다. 예를 들어 특정 지역은 급격히 개발되고 다른 지역은 정체되는 상황에서도 동일한 성장률을 적용하기 때문에 현실적인 예측치와 괴리가 발생할 가능성이 크다.
이러한 한계를 보완하기 위해 제안된 것이 평균성장인자법(Average Growth Factor Method)이다. 이는 기점 $i$의 성장률 $F_i$와 종점 $j$의 성장률 $F_j$를 산술 평균하여 적용하는 방식이다. 각 존의 성장인자는 해당 존의 장래 통행 발생량(또는 도착량)을 현재량으로 나누어 구한다.
$$ T_{ij} = t_{ij} \times \frac{F_i + F_j}{2} $$
평균성장인자법은 각 존의 개별적인 성장 특성을 반영하려 노력하지만, 계산된 장래 통행량의 합이 통행 발생 단계에서 예측된 각 존의 총 유출량 및 유입량과 일치하지 않는 수렴성 문제를 야기한다. 즉, 행렬의 가로 합과 세로 합이 미리 정해진 목표치(Marginal Totals)에 도달할 때까지 반복적인 보정 과정이 필요하게 된다.
더욱 정교한 반복 계산 기법으로는 프라타법(Fratar Method)과 퍼니스법(Furness Method)이 있다. 이들은 수렴반복법(Iterative Proportional Fitting, IPF)의 일종으로, 행렬의 각 행과 열에 대해 교대로 성장인자를 적용하며 오차 범위를 좁혀나가는 방식이다. 프라타법은 기점과 종점의 상대적인 매력도를 고려하여 통행량을 배분하며, 퍼니스법은 주로 유럽에서 발전한 기법으로 행과 열의 합을 순차적으로 일치시키는 수학적 절차를 거친다. 이러한 기법들은 컴퓨터 연산 능력을 활용하여 오차가 허용 범위 이내로 들어올 때까지 반복 수행되며, 최종적으로는 목표로 하는 유출량과 유입량을 모두 만족하는 균형 잡힌 기종점 행렬을 도출한다.
성장인자법의 주요 모형별 특성을 비교하면 다음과 같다.
| 모형 구분 | 주요 특징 | 장점 | 단점 |
|---|---|---|---|
| 단일성장인자법 | 지역 전체에 동일한 성장률 적용 | 계산이 매우 단순함 | 지역별 차별적 성장 반영 불가 |
| 평균성장인자법 | 기점과 종점 성장률의 산술 평균 사용 | 존별 성장 특성 반영 시작 | 수렴성이 낮아 반복 보정 필요 |
| 디트로이트법 | 지역 전체 성장률 대비 존별 상대 성장률 고려 | 평균법보다 논리적 정밀도 향상 | 계산 과정이 상대적으로 복잡함 |
| 프라타/퍼니스법 | 주변합 일치를 위한 반복 수렴 계산 | 높은 예측 정밀도와 수렴성 확보 | 기준 연도 통행량이 0인 경우 예측 불가 |
성장인자법은 실무적으로 적용이 용이하고 과거의 통행 행태를 충실히 반영한다는 강점이 있으나, 이론적인 측면에서 몇 가지 근본적인 취약점을 지닌다. 첫째, 중력 모형과 달리 존 간의 통행 비용이나 거리의 변화를 직접적으로 반영하지 못한다. 즉, 새로운 도로가 개설되거나 철도가 확충되어 접근성이 획기적으로 개선되더라도, 기준 연도의 통행량이 적었다면 미래 통행량 역시 낮게 추정되는 경향이 있다. 둘째, 기준 연도에 통행량이 존재하지 않았던 신규 개발지(Zero-cell)의 경우, 성장인자를 곱하더라도 결과값이 항상 0이 되므로 장래 수요를 예측할 수 없는 문제가 발생한다. 따라서 성장인자법은 도시 구조의 급격한 변화가 예상되는 장기 계획보다는 기존 교통 체계의 골격이 유지되는 상황에서의 보완적 예측이나 단기 운영 계획 수립에 주로 권장된다.
중력 모형(Gravity Model)은 통행 분포 단계에서 가장 널리 활용되는 공간적 상호작용 모형으로, 아이작 뉴턴의 만유인력의 법칙을 사회 현상에 응용한 사회 물리학(Social Physics)의 대표적인 사례이다. 이 모형은 두 지역 사이의 통행량이 각 지역의 규모나 매력도에는 비례하고, 두 지역을 연결하는 거리나 비용에는 반비례한다는 가정을 바탕으로 한다. 즉, 기점의 통행 유출 잠재력과 종점의 통행 유입 매력도가 클수록 통행량은 증가하며, 공간적 거리나 통행 시간과 같은 통행 저항이 커질수록 통행량은 감소한다는 논리적 구조를 지닌다.
중력 모형의 가장 기본적인 수리적 형태는 다음과 같이 정의된다.
$$ T_{ij} = k \cdot \frac{O_i \cdot D_j}{f(c_{ij})} $$
위 식에서 $ T_{ij} $는 기점 $ i $에서 종점 $ j $로 이동하는 예측 통행량을 의미하며, $ O_i $는 기점 $ i $에서 발생하는 총 통행량, $ D_j $는 종점 $ j $로 유입되는 총 통행량을 나타낸다. $ k $는 전체 통행량의 총합을 일치시키기 위한 조정 계수이며, $ f(c_{ij}) $는 두 지역 간의 거리, 시간, 비용 등을 포함하는 일반화 비용(Generalized Cost)에 따른 저항 함수를 의미한다. 초기 연구에서는 저항 함수로 거리의 제곱에 반비례하는 형태를 주로 사용하였으나, 현대 교통 공학에서는 지수 함수나 감마 함수 등 보다 정밀한 형태의 함수를 채택하여 현실적인 통행 행태를 반영한다.
실무적인 교통 수요 예측 과정에서는 통행 발생 단계에서 산출된 각 존별 총 유출량과 총 유입량의 합계를 보존하기 위해 제약 조건이 부과된 형태의 중력 모형이 주로 사용된다. 단일 제약 중력 모형(Singly Constrained Gravity Model)은 기점의 유출량 또는 종점의 유입량 중 어느 한쪽의 합계만을 일치시키는 방식이며, 이중 제약 중력 모형(Doubly Constrained Gravity Model)은 양방향의 합계를 모두 만족시키도록 설계된다. 이중 제약 모형에서는 각 존의 제약 조건을 충족하기 위해 반복 계산을 통한 균형 인자(Balancing Factor)를 도입하며, 이는 다음과 같은 수식으로 표현된다.
$$ T_{ij} = A_i B_j O_i D_j f(c_{ij}) $$
여기서 $ A_i $와 $ B_j $는 각각 기점과 종점의 제약 조건을 만족시키기 위해 계산되는 상호 의존적인 조정 계수이다. 이러한 구조를 통해 중력 모형은 기종점 행렬(O-D Matrix)의 행 합계와 열 합계가 사전에 결정된 통행 발생량과 정확히 일치하도록 보장한다.
중력 모형의 핵심적인 구성 요소인 저항 함수는 통행자의 거리 감쇠 효과를 결정짓는 중요한 변수이다. 주로 사용되는 함수 형태로는 거리에 따른 통행 감소가 일정한 비율로 발생하는 멱함수(Power function) 형태인 $ c_{ij}^{-n} $, 장거리 통행의 급격한 감소를 반영하는 지수 함수(Exponential function) 형태인 $ (-c_{ij}) $, 그리고 이 둘을 결합한 탄너 함수(Tanner function) 등이 있다. 모형의 정확도를 높이기 위해 과거의 통행 데이터를 바탕으로 해당 지역의 특성에 맞는 매개변수 $ $나 $ n $을 추정하는 모형 정산(Calibration) 과정이 필수적으로 수반된다.
중력 모형은 구조가 명확하고 논리적이며, 교통망의 변화에 따른 통행 패턴의 변화를 민감하게 반영할 수 있다는 장점이 있다. 특히 새로운 도로나 철도가 건설되어 통행 비용이 감소할 경우, 해당 경로를 이용하는 통행량의 증가를 합리적으로 예측할 수 있다. 그러나 지역 간의 사회경제적 특성 차이나 토지 이용의 질적 측면을 충분히 반영하지 못하며, 과거의 통행 행태가 미래에도 변하지 않는다는 가정을 전제로 한다는 한계가 존재한다. 그럼에도 불구하고 중력 모형은 그 이론적 견고함과 실무적 편의성 덕분에 전 세계 도시 계획 및 교통 계획 수립 과정에서 표준적인 분석 도구로 활용되고 있다.
수단 분담(Mode Choice) 단계는 통행 발생과 통행 분포 단계를 거쳐 결정된 출발지와 목적지 간의 통행량이 구체적으로 어떠한 교통 수단에 의해 이루어지는지를 결정하는 과정이다. 이 단계는 교통 계획 수립에 있어 매우 중요한 위치를 차지하는데, 이는 도로의 혼잡도나 대중교통의 이용률, 나아가 이산화탄소 배출량과 같은 환경적 영향이 통행자가 선택하는 수단에 따라 판이하게 달라지기 때문이다. 과거에는 분석의 편의를 위해 특정 지역(Traffic Analysis Zone, TAZ) 단위로 집계된 데이터를 활용하는 집계형 모형이 주를 이루었으나, 현대 교통 수요 예측에서는 통행자 개개인의 의사결정 행태를 보다 정밀하게 반영할 수 있는 비집계 모형(Disaggregate Model)이 표준적으로 사용된다.
수단 분담의 핵심적인 이론적 기초는 미시경제학의 효용 극대화 이론(Utility Maximization Theory)에 있다. 이 이론에 따르면, 개별 통행자는 자신에게 주어진 선택 가능한 수단들의 집합 중에서 주관적인 만족감, 즉 효용(Utility)이 가장 큰 수단을 선택한다. 통행자 $ n $이 수단 $ i $를 선택함으로써 얻게 되는 효용 $ U_{in} $은 분석자가 관측할 수 있는 결정론적 부분인 체계적 효용 $ V_{in} $과 분석자가 관측할 수 없는 무작위적 요소를 포함하는 오차항 $ _{in} $의 합으로 구성된다. 이를 수식으로 나타내면 다음과 같다.
$$ U_{in} = V_{in} + \epsilon_{in} $$
여기서 체계적 효용 $ V_{in} $은 통행 시간, 통행 비용, 접근성 등 수단의 특성 변수와 소득, 차량 보유 여부 등 통행자의 사회경제적 특성 변수들의 선형 결합으로 정의되는 것이 일반적이다. 이때 시간과 비용 등 서로 다른 단위를 가진 변수들을 하나의 척도로 통합한 것을 일반화 비용(Generalized Cost)이라 하며, 이는 수단 선택의 결정적인 지표가 된다.
수단 분담 단계에서 가장 널리 활용되는 수리적 모델은 로짓 모형(Logit Model)이다. 로짓 모형은 오차항 $ %%//%%{in} $이 서로 독립적이며 동일한 제1종 극치 분포(Type I Extreme Value Distribution, Gumbel Distribution)를 따른다는 가정하에 도출된다. 특히 세 개 이상의 수단 대안이 존재할 때 사용하는 다항 로짓 모형(Multinomial Logit Model, MNL)에서 특정 수단 $ i $를 선택할 확률 $ P%%//%%{in} $은 다음과 같은 수식으로 계산된다.
$$ P_{in} = \frac{e^{V_{in}}}{\sum_{j \in C_n} e^{V_{jn}}} $$
위 식에서 $ C_n $은 통행자 $ n $이 선택할 수 있는 모든 교통수단의 집합을 의미한다. 다항 로짓 모형은 구조가 단순하고 계산이 용이하다는 장점이 있으나, 독립성 가정(Independence of Irrelevant Alternatives, IIA)이라는 강력한 제약 조건을 가진다. 이는 새로운 수단이 도입되더라도 기존 수단들 사이의 선택 확률 비율이 변하지 않는다는 가정으로, 실제 현실에서는 성격이 유사한 수단들(예: 일반버스 iterate 광역버스) 간의 상관관계를 설명하지 못하는 한계가 있다.
이러한 IIA 특성의 한계를 극복하기 위해 중첩 로짓 모형(Nested Logit Model)이 도입되었다. 중첩 로짓 모형은 선택 대안들을 유사한 특성을 가진 군집(Nest)으로 계층화하여 구조화한다. 예를 들어, 최상위 계층에서 개인교통수단과 대중교통수단을 구분하고, 대중교통수단 내에서 다시 버스와 철도를 구분하는 방식이다. 이를 통해 수단 간의 상관관계를 모형 내에 반영함으로써 보다 현실적인 수단 분담 결과를 도출할 수 있다. 이외에도 오차항의 분포를 더욱 유연하게 가정한 프로빗 모형(Probit Model)이나 확률적 매개변수를 도입한 혼합 로짓 모형(Mixed Logit Model) 등이 복잡한 통행 행태를 분석하기 위해 활용된다.
결과적으로 수단 분담 단계의 출력값은 각 출발지와 목적지 쌍(O-D pair) 사이의 수단별 통행량이 되며, 이는 최종 단계인 노선 배정 단계의 기초 입력 자료가 된다. 최근에는 공유 모빌리티나 자율주행 자동차와 같은 새로운 교통 서비스의 등장에 따라, 이러한 신규 수단들이 기존 교통 체계와 어떻게 경쟁하고 보완되는지를 예측하기 위한 고도화된 행태 모형 연구가 활발히 진행되고 있다.
개별 행태 모형(Disaggregate Behavioral Model)은 교통 분석 존과 같은 공간적 단위를 기준으로 데이터를 집계하여 분석하던 전통적인 방식에서 벗어나, 통행을 수행하는 개별 경제 주체의 의사결정 과정을 직접적인 분석 대상으로 삼는 방법론이다. 1970년대 이후 계량경제학의 비약적인 발전과 함께 도입된 이 모형은 통행자가 직면한 여러 선택 대안 중 자신의 효용을 가장 크게 만드는 대안을 선택한다는 효용 극대화(Utility Maximization) 원리에 기반한다. 집계 모형이 공간적 경계 설정에 따라 결과가 왜곡되는 가변적 지역 단위 문제(Modifiable Areal Unit Problem, MAUP)를 가졌던 것과 달리, 개별 행태 모형은 개인의 인구 통계적 특성과 교통 수단의 서비스 특성을 정밀하게 반영할 수 있다는 장점이 있다.
이 모형의 이론적 토대는 확률적 효용 이론(Random Utility Theory)에 있다. 이 이론은 분석자가 통행자의 모든 선호 체계를 완벽하게 관찰할 수 없다는 현실적 한계를 인정한다. 따라서 개별 통행자 $n$이 대안 $i$를 선택함으로써 얻는 전체 효용 $U_{in}$은 분석자가 관측할 수 있는 확정적 효용 $V_{in}$과 관측 불가능한 무작위 오차항 $\epsilon_{in}$의 합으로 정의된다.
$$U_{in} = V_{in} + \epsilon_{in}$$
여기서 확정적 효용 $V_{in}$은 통행 시간, 비용과 같은 수단 특성 변수와 소득, 연령 등 개인 특성 변수의 선형 결합으로 표현되는 것이 일반적이다. 통행자가 대안 $i$를 선택할 확률 $P_{in}$은 해당 대안의 효용이 다른 모든 대안 $j$의 효용보다 클 확률로 계산된다.
로짓 모형(Logit Model)은 확률적 효용 이론을 실무에 적용한 가장 대표적인 형태이다. 이 모형은 오차항 $\epsilon_{in}$이 서로 독립적이며 동일한 분포를 가진다는 독립 동일 분포(Independent and Identically Distributed, IID) 가정을 전제로, 오차항이 제1종 극치 분포(Type I Extreme Value Distribution) 또는 구벨 분포(Gumbel Distribution)를 따른다고 상정한다. 이러한 가정하에 유도된 다항 로짓 모형(Multinomial Logit Model, MNL)의 선택 확률 식은 다음과 같이 간결한 폐쇄형(Closed-form) 구조를 갖는다.
$$P_{in} = \frac{e^{V_{in}}}{\sum_{j \in C_n} e^{V_{jn}}}$$
로짓 모형은 계산이 용이하고 결과 해석이 직관적이라는 장점이 있어 수단 분담 단계에서 널리 활용되어 왔다11). 그러나 로짓 모형은 독립 대안 불관련(Independence of Irrelevant Alternatives, IIA)이라는 특성을 지닌다. 이는 두 대안 사이의 선택 확률 비율이 제3의 대안 존재 여부와 무관하게 일정하다는 가정으로, 실제 교통 시장에서 유사한 특성을 가진 수단들이 존재할 경우 선택 확률을 왜곡할 위험이 있다.
프로빗 모형(Probit Model)은 로짓 모형의 IIA 제약을 극복하기 위해 제안된 대안이다. 이 모형은 오차항 $\epsilon_{in}$이 다변량 정규 분포(Multivariate Normal Distribution)를 따른다고 가정한다. 프로빗 모형의 핵심적인 강점은 오차항 간의 상관관계를 허용한다는 점에 있다. 즉, 지하철과 광역철도처럼 서로 유사한 특성을 공유하는 대안들 사이의 오차항 공분산을 반영함으로써 보다 현실적인 선택 행태를 모사할 수 있다.
다만 프로빗 모형은 로짓 모형과 달리 선택 확률을 구하기 위한 적분식이 폐쇄형으로 도출되지 않는다. 따라서 대안의 수가 많아질수록 다중 적분을 계산하는 데 막대한 연산량이 소모되며, 이를 해결하기 위해 몬테카를로 시뮬레이션(Monte Carlo Simulation) 등 수치적 기법이 동원되어야 한다. 이러한 연산의 복잡성으로 인해 과거에는 실무 적용에 한계가 있었으나, 최근 컴퓨팅 성능의 향상으로 그 활용 범위가 점차 확대되고 있다.
노선 배정(Route Assignment) 단계는 교통 수요 예측의 전통적 4단계 수요 예측 모형 중 마지막 절차로, 앞선 수단 분담 단계에서 결정된 교통수단별 통행량을 실제 교통망(Network) 상의 구체적인 경로에 할당하는 과정이다. 이 단계의 핵심은 개별 통행자가 출발지에서 목적지까지 이동할 때 어떠한 경로를 선택할 것인가를 수리적으로 모형화하는 데 있다. 분석의 결과물로 각 도로 링크(Link)나 철도 구간의 구간별 교통량과 통행 시간이 산출되며, 이는 장래의 교통 혼잡도 예측 및 시설 용량의 적정성 평가를 위한 기초 자료로 활용된다.
노선 배정의 이론적 토대는 존 글렌 워드롭(John Glen Wardrop)이 제시한 두 가지 원리, 즉 워드롭의 원리에 기반한다. 제1원리인 이용자 평형(User Equilibrium, UE)은 모든 통행자가 자신의 통행 시간을 최소화하기 위해 경로를 선택한다는 가정을 바탕으로 한다. 평형 상태에 도달하면 선택된 모든 경로의 통행 시간은 동일하며, 선택되지 않은 경로의 통행 시간은 선택된 경로의 통행 시간보다 크거나 같다. 이는 개별 이용자가 자신의 이익을 극대화하려는 행태를 반영하며, 현실의 교통 흐름을 설명하는 데 가장 널리 사용되는 기준이다.
반면 제2원리인 시스템 최적(System Optimum, SO)은 네트워크 전체의 총 통행 시간을 최소화하는 방향으로 통행이 배정되는 상태를 의미한다. 이는 개별 이용자의 선택보다는 사회 전체의 효율성을 중시하는 관점으로, 교통 수요 관리 정책이나 자율 주행 환경에서의 최적 경로 제어 등의 정책적 목표치를 설정할 때 참조된다. 일반적으로 이용자 평형 상태에서의 총 통행 시간은 시스템 최적 상태보다 길게 나타나는데, 이러한 효율성의 차이를 공유지의 비극 또는 브라에스의 역설(Braess’s Paradox)과 연관 지어 설명하기도 한다.
노선 배정을 수행하기 위해서는 도로의 혼잡도에 따른 통행 시간의 변화를 정의하는 링크 성능 함수(Link Performance Function)가 필수적이다. 가장 대표적인 함수는 미국 도로국(Bureau of Public Roads, BPR)에서 제안한 BPR 함수이다. 이 함수는 특정 링크의 교통량이 증가함에 따라 통행 시간이 지수적으로 증가하는 특성을 다음과 같이 표현한다.
$$ t_a = t_0 \left[ 1 + \alpha \left( \frac{v_a}{c_a} \right)^\beta \right] $$
여기서 $ t_a $는 링크 $ a $의 통행 시간, $ t_0 $는 자유 흐름 상태에서의 통행 시간, $ v_a $는 해당 링크의 교통량, $ c_a $는 링크의 용량을 의미하며, $ $와 $ $는 도로의 특성에 따라 결정되는 파라미터이다.
실제 계산 과정에서는 다양한 수치 해석적 기법이 동원된다. 초기에는 교통 혼잡을 고려하지 않고 모든 통행량을 최단 경로에만 배정하는 전부 배정법(All-or-Nothing Assignment)이 사용되었으나, 이는 현실적인 혼잡 현상을 반영하지 못한다는 한계가 있었다. 이를 보완하기 위해 교통량 증가에 따라 통행 시간을 갱신하며 반복적으로 배정하는 용량 제약 배정법(Capacity Restraint Assignment)이나, 이용자의 경로 선택 오류나 정보의 불확실성을 반영한 확률적 노선 배정(Stochastic Assignment) 기법이 발전하였다. 현대의 정밀한 분석에서는 이용자 평형 조건을 만족시키기 위해 프랭크-울프 알고리즘(Frank-Wolfe Algorithm)과 같은 최적화 기법을 사용하여 수렴 해를 도출한다.
노선 배정 단계의 정확도는 기종점 표(Origin-Destination Matrix)의 신뢰도뿐만 아니라 교통망의 정밀한 묘사 수준에 의해서도 결정된다. 최근에는 단순히 도로망뿐만 아니라 대중교통의 환승 체계와 시간표를 반영한 다수단 노선 배정 모형이 도입되고 있으며, 지능형 교통 체계(ITS)의 발달에 따라 실시간 교통 정보를 반영한 동적 노선 배정(Dynamic Traffic Assignment, DTA) 연구도 활발히 진행되고 있다. 이는 미래 교통 환경의 변화에 대응하여 보다 유연하고 정밀한 수요 예측을 가능하게 하는 핵심적인 동력이 된다.
이용자 평형 배정법은 워드롭(John Glen Wardrop)이 1952년에 발표한 논문에서 정의한 ’제1원리’에 그 학술적 기초를 둔다. 이 원리는 개별 통행자가 자신의 통행 시간이나 비용을 최소화하기 위해 경로를 선택한다는 합리적 선택 이론을 교통망 분석에 적용한 것이다. 워드롭은 평형 상태를 어느 통행자도 자신의 경로를 단독으로 변경함으로써 통행 시간을 단축할 수 없는 상태로 정의하였다. 이러한 상태에 도달하면 특정 기종점 간에 이용되는 모든 경로의 통행 시간은 동일하게 유지되며, 이용되지 않는 경로의 통행 시간은 이용 중인 경로의 통행 시간보다 크거나 같게 된다. 이는 개별 이용자의 이기적 행태가 집합적으로 고착화된 상태를 의미하며, 게임 이론의 내쉬 평형(Nash Equilibrium) 개념과 논리적으로 궤를 같이한다.12)
수학적으로 이용자 평형 상태를 도출하기 위한 정식화는 벡만(Martin Beckmann) 등에 의해 체계화되었다. 벡만은 이를 볼록 최적화(Convex Optimization) 문제로 변환하여 해의 존재성과 유일성을 증명하였다. 이용자 평형 배정의 목적 함수는 각 링크의 통행 시간 함수를 교통량에 대해 적분한 값들의 총합을 최소화하는 형태로 정의된다. 이는 물리적인 에너지 최소화 원리와 유사한 구조를 가지며, 다음과 같은 수리 계획 모형으로 표현된다.
$$ \min Z = \sum_{a \in A} \int_{0}^{x_a} t_a(\omega) d\omega $$
위 식에서 $ x_a $는 링크 $ a $의 교통량이며, $ t_a(x_a) $는 해당 링크의 교통량에 따른 통행 시간을 나타내는 링크 성능 함수이다. 이 최적화 문제는 모든 기종점 쌍 사이의 수요가 각 경로 교통량의 합과 같아야 한다는 수요 보존 법칙과, 경로 및 링크 교통량이 음수가 될 수 없다는 비음 조건을 제약식으로 가진다. 이 모형의 해는 기종점 간의 모든 이용 경로에서 한계 비용이 아닌 평균 비용, 즉 개별 통행자가 체감하는 통행 시간이 일치하는 지점에서 결정된다.13)
이용자 평형 배정법을 실제 대규모 교통망에 적용하기 위해서는 효율적인 수치 해석 알고리즘이 필수적이다. 가장 대표적인 기법으로는 프랭크-울프 알고리즘(Frank-Wolfe Algorithm)이 사용된다. 이 알고리즘은 현재의 교통량 상태에서 가장 짧은 경로를 찾아 모든 교통량을 배정하는 전량 배정법(All-or-Nothing Assignment)을 반복 수행하며, 이전 단계의 해와 새로운 해를 선형 결합하여 점진적으로 최적 해에 수렴해 나가는 방식을 취한다. 이 과정에서 도로의 용량 제약에 따른 혼잡 효과가 반영되며, 교통량이 증가함에 따라 통행 시간이 지수적으로 증가하는 BPR 함수 등이 링크 성능 함수로 널리 활용된다.
이용자 평형 배정법은 실제 교통 현상을 비교적 정확하게 묘사한다는 장점이 있으나, 모든 통행자가 교통망의 상태에 대한 완전 정보를 보유하고 있다는 가정을 전제로 한다. 현실적으로 통행자는 정보의 불확실성이나 개인적 선호에 따라 최단 경로가 아닌 노선을 선택할 가능성이 존재한다. 이러한 한계를 보완하기 위해 통행자의 인지 오차를 확률 변수로 도입한 확률적 이용자 평형(Stochastic User Equilibrium, SUE) 모형이 제안되기도 하였다. 또한, 이용자 평형 상태가 반드시 사회 전체의 총 통행 시간을 최소화하는 시스템 최적 상태와 일치하지 않는다는 점은 브래스 역설(Braess’s Paradox)을 통해 증명되었으며, 이는 교통 정책 수립 시 개별 이용자의 선택과 사회적 효율성 사이의 간극을 관리해야 함을 시사한다.
시스템 최적 배정법(System Optimal Assignment, SO)은 교통망 내의 모든 통행자가 소비하는 총 통행 시간의 합을 최소화하도록 통행량을 배분하는 기법이다. 이는 존 워드롭(John Glen Wardrop)이 제시한 두 번째 원리, 즉 “평형 상태에서의 평균 통행 시간은 최소가 된다”는 원칙에 기반한다. 개별 이용자가 자신의 이익만을 극대화하려 하는 이용자 평형 배정법과 달리, 시스템 최적 배정법은 사회 전체의 효율성을 극대화하는 관점을 견지한다. 따라서 이 기법은 실제 통행 행태를 묘사하기보다는 교통 정책 수립 시 도달할 수 있는 이상적인 목표치나 사회적 후생의 최대치를 산정하는 기준으로 활용된다.
시스템 최적 배정법의 수학적 정식화는 네트워크 전체의 총 통행 시간을 목적 함수로 설정하여 이를 최소화하는 최적화 문제로 정의된다. 특정 경로의 통행량을 $f_p$, 링크 $a$의 통행량을 $x_a$, 그리고 링크 $a$에서의 통행 시간 함수를 $t_a(x_a)$라고 할 때, 시스템 최적 배정의 목적 함수는 다음과 같다.
$$ \min Z = \sum_{a} x_a \cdot t_a(x_a) $$
이 식에서 $x_a \cdot t_a(x_a)$는 해당 링크를 통과하는 모든 차량의 통행 시간 합계를 의미한다. 이를 제약 조건인 기종점 간 수요 보존 법칙과 비음 조건 하에서 풀이하면 시스템 최적 상태를 얻을 수 있다. 이때 최적해의 조건은 선택된 모든 경로의 한계 비용(Marginal Cost)이 동일하며, 선택되지 않은 경로의 한계 비용보다 작거나 같아야 한다는 것이다. 여기서 한계 비용이란 추가적인 차량 한 대가 도로에 진입했을 때 본인이 소비하는 시간뿐만 아니라, 그로 인해 기존 도로 이용자들에게 유발되는 지체 시간의 증가분까지 포함하는 개념이다.
이와 대비되는 이용자 평형 배정법은 개별 운전자가 자신의 통행 시간, 즉 평균 비용(Average Cost)만을 고려하여 경로를 선택하는 게임 이론적 관점을 취한다. 이용자 평형 상태에서는 어떤 통행자도 경로를 변경함으로써 자신의 통행 시간을 단축할 수 없으나, 이 상태에서의 총 통행 시간은 시스템 최적 상태보다 항상 크거나 같다. 이러한 두 배정 결과의 차이를 교통 공학에서는 무정부 상태의 대가(Price of Anarchy)라고 부르며, 이는 개별적 최적화가 전체적 최적화와 일치하지 않는 외부 효과의 발생을 정량적으로 보여준다.
시스템 최적 배정법의 함의는 브래스의 역설(Braess’s Paradox)을 통해서도 명확히 드러난다. 이용자 평형 상태에서는 도로 공급이 늘어났음에도 불구하고 개별 이용자의 이기적 경로 선택으로 인해 전체 혼잡이 가중되는 현상이 발생할 수 있으나, 시스템 최적 관점에서는 이러한 비효율이 원천적으로 차단된다. 실무적으로는 시스템 최적 상태를 구현하기 위해 혼잡 통행료(Congestion Pricing) 정책이 제안된다. 개별 이용자가 타인에게 미치는 한계 지체 비용만큼을 통행료로 지불하게 함으로써, 이용자의 경로 선택 기준을 평균 비용에서 한계 비용으로 전환하고 결과적으로 이용자 평형 상태를 시스템 최적 상태로 유도하는 것이다.
결론적으로 시스템 최적 배정법은 교통망 운영의 효율성 한계를 규정하는 이론적 틀을 제공한다. 비록 개별 이용자의 자유로운 경로 선택권을 전제로 하는 현실의 교통 체계에서 이를 직접 구현하기는 어려우나, 자율주행 자동차의 도입이나 중앙 집중식 교통 제어 시스템이 발전함에 따라 시스템 최적 배정의 원리는 미래 교통 시스템의 운영 알고리즘으로서 그 중요성이 더욱 증대되고 있다. 이는 한정된 도로 자원을 사회적으로 가장 가치 있게 배분하기 위한 수리 모델로서의 위상을 지닌다.
교통 수요 예측의 정밀도는 분석에 투입되는 기초 데이터의 품질과 이를 처리하는 체계적 분석 과정에 의해 결정된다. 신뢰성 있는 예측 결과를 도출하기 위해서는 다양한 수집원으로부터 확보된 데이터를 상호 보완적으로 활용하고, 수집된 원시 데이터(Raw data)를 정제하여 통계적 유의성을 확보하는 과정이 필수적이다.
데이터 수집 체계는 크게 설문 기반의 전통적 조사 방식과 정보통신 기술을 활용한 지능형 데이터 수집 방식으로 구분된다. 전통적 방식의 핵심인 가구 통행 실태 조사(Household Travel Survey)는 표본 가구를 대상으로 가구원의 통행 목적, 수단, 시간 등을 상세히 파악하여 기종점 통행량(Origin-Destination, OD)을 추정하는 기초 자료가 된다. 그러나 이러한 표본 조사는 막대한 비용과 시간이 소요되며, 응답자의 기억 편향이나 낮은 응답률로 인해 데이터의 최신성을 유지하기 어렵다는 한계가 있다.
이를 보완하기 위해 지능형 교통 체계(Intelligent Transport Systems, ITS) 및 빅데이터를 활용한 자동 수집 체계가 적극적으로 도입되고 있다. 루프 검지기(Loop Detector)나 영상 검지기(Video Detection System, VDS)를 통해 수집되는 지점별 교통량 데이터는 노선 배정 결과의 검증 자료로 활용된다. 또한, 교통카드 데이터는 대중교통 이용자의 승하차 지점과 환승 행태를 전수(全數)에 가깝게 파악할 수 있게 하며, 모바일 데이터는 휴대전화 기지국 신호를 분석하여 특정 지역 간의 유동인구 패턴을 실시간으로 추적할 수 있는 가능성을 열어주었다.
수집된 데이터는 예측 모형에 직접 입력되기 전 엄격한 데이터 전처리(Data Preprocessing) 과정을 거친다. 이 단계에서는 측정 오류로 인한 이상치(Outlier)를 제거하고, 통신 장애 등으로 발생한 결측치(Missing value)를 보정한다. 특히 표본 데이터를 전체 인구의 통행량으로 변환하는 전수화(Expansion) 과정은 분석 체계의 핵심적인 단계이다. 표본 확장 계수 $ w_i $는 다음과 같이 정의된다.
$$ w_i = \frac{N_h}{n_h} $$
여기서 $ N_h $는 모집단의 해당 층(strata) 크기이며, $ n_h $는 조사된 표본의 크기이다. 분석가는 이 계수를 적용하여 표본의 특성이 전체 지역의 통행 특성을 대표할 수 있도록 보정한다. 최근에는 단일 데이터원만을 사용하는 방식에서 벗어나, 서로 다른 성격의 데이터를 결합하는 데이터 융합(Data Fusion) 기술이 강조되고 있다. 예를 들어, 설문 조사로 얻은 통행 목적 데이터와 모바일 신호로 얻은 시공간 경로 데이터를 결합하여 보다 정밀한 활동 기반의 예측 체계를 구축하는 방식이다.
데이터 수집원별 특성을 비교하면 다음과 같다.
| 수집원 | 주요 데이터 항목 | 장점 | 단점 |
|---|---|---|---|
| 가구 통행 실태 조사 | 통행 목적, 가구 특성 | 개인의 사회경제적 특성 파악 가능 | 높은 비용, 장기 조사 주기 |
| 교통카드 데이터 | 승하차 시각 및 지점, 환승 | 대중교통 전수 분석 가능 | 승용차 통행 파악 불가 |
| 모바일 데이터 | 기지국 기반 위치 정보 | 대규모 유동인구 추적 용이 | 통행 목적 파악의 어려움 |
| ITS 검지기 | 지점 교통량, 속도 | 실시간성 및 정확도 높음 | 구간 전체의 흐름 파악 한계 |
현대적 분석 체계는 수집된 데이터를 바탕으로 기계학습(Machine Learning) 알고리즘을 적용하여 비선형적인 교통 패턴을 학습하기도 한다14). 이러한 인공지능 기반 분석은 과거의 이력 데이터뿐만 아니라 날씨, 행사, 사고 등 외부 변수를 통합적으로 고려하여 단기적인 수요 변동을 예측하는 데 강점을 보인다. 결국 데이터 수집 및 분석 체계의 고도화는 단순한 양적 확대를 넘어, 데이터 간의 정합성을 확보하고 예측의 불확실성을 최소화하는 방향으로 전개되고 있다.
전통적 조사 방법론은 교통 수요 예측에 필요한 기초 자료를 확보하기 위해 개별 통행자의 행태를 직접 관찰하거나 설문을 통해 수집하는 일련의 과정을 의미한다. 이는 주로 기종점 조사(Origin-Destination Survey, O-D 조사)를 중심으로 이루어지며, 특정 지역 내에서 발생하는 통행의 출발지와 목적지, 통행 수단, 통행 목적 등을 정량화하는 것을 목적으로 한다. 이러한 방식은 지능형 교통 체계가 도입되기 이전부터 교통 계획의 핵심적인 데이터 구축 수단으로 활용되어 왔으며, 현재에도 표본의 대표성을 확보하고 통행자의 사회경제적 특성을 파악하는 데 있어 매우 중요한 역할을 수행한다.
가장 대표적인 전통적 조사 방식은 가구 통행 실태 조사(Household Travel Survey)이다. 이 조사는 분석 대상 지역인 교통 분석 존(Traffic Analysis Zone, TAZ) 내에 거주하는 가구를 표본으로 추출하여, 가구원 개개인이 하루 동안 수행한 모든 이동 기록을 파악하는 방식이다. 조사 항목에는 가구원 수, 차량 보유 대수, 가구 소득 등 사회경제적 지표와 더불어, 개별 통행의 출발·도착 시각, 목적, 이용 수단 등이 포함된다. 과거에는 조사원이 직접 가구를 방문하여 면접하는 방식을 주로 사용하였으나, 응답자의 편의와 정확성을 기하기 위해 일정 기간의 이동 사항을 스스로 기록하게 하는 통행 일지(Travel Diary) 방식이나 전화 및 우편 설문이 병행되기도 한다. 가구 통행 실태 조사는 통행 발생과 수단 선택 모형 구축에 필수적인 미시 데이터를 제공하지만, 막대한 예산과 인력이 소요되며 응답자의 기억 편향에 따른 오차가 발생할 수 있다는 특징이 있다.
노상 면접 조사(Roadside Interview Survey)는 특정 지점을 통과하는 차량을 정차시킨 후 운전자에게 직접 질문하여 통행 특성을 파악하는 방법이다. 이는 주로 도시 경계나 주요 간선도로의 코돈 라인(Cordon Line) 상에서 수행되며, 해당 지역을 통과하는 외래 통행(Through Traffic)이나 외부 유입·유출 통행의 기종점을 파악하는 데 효과적이다. 노상 면접 조사는 실제 도로 이용자를 대상으로 하므로 데이터의 실효성이 높으나, 조사 과정에서 교통 흐름을 방해하여 혼잡을 야기할 수 있다는 단점이 있다. 이를 보완하기 위해 차량 번호판을 기록한 후 소유주에게 설문지를 발송하는 번호판 조사나, 비디오 카메라를 활용한 관측 조사가 대안으로 활용되기도 한다.
또한, 물류 체계 분석을 위한 화물차 통행 실태 조사와 업무용 차량의 이동 패턴을 파악하는 기업체 조사 등도 전통적 방법론의 범주에 포함된다. 화물 통행은 일반 승용차와는 다른 독특한 운행 패턴과 적재 특성을 지니므로, 화주나 운송업체를 대상으로 한 별도의 설문 설계가 요구된다. 이러한 다양한 조사들을 통해 수집된 표본 데이터는 전체 인구 및 교통량에 맞추어 보정하는 과정을 거치는데, 이를 위해 전수화(Expansion) 작업이 수행된다. 표본 통행량에 확대 계수(Expansion Factor)를 곱하여 전체 통행량을 추정하며, 그 결과의 신뢰도를 검증하기 위해 주요 지점의 관측 교통량과 비교하는 스크린 라인(Screen Line) 검증을 실시한다.
전통적 조사 방법론에서 확보된 데이터의 질은 표본 추출의 과학성에 의해 결정된다. 표본의 크기가 너무 작으면 통계적 유의성을 확보하기 어렵고, 특정 계층에 편중된 표본은 예측 결과의 왜곡을 초래할 수 있다. 일반적으로 표본 크기 $ n $은 허용 오차와 신뢰 수준에 따라 결정되며, 다음과 같은 기본 식을 바탕으로 설계된다.
$$ n = \frac{Z^2 \cdot p \cdot (1-p)}{e^2} $$
여기서 $ Z $는 신뢰 수준에 따른 임계값, $ p $는 예상되는 통행 특성의 비율, $ e $는 허용 오차를 의미한다. 전통적 조사 방법론은 이처럼 엄격한 통계학적 기초 위에 설계되지만, 최근에는 스마트폰 데이터나 교통카드 데이터 등 자동 수집 데이터와의 통합을 통해 조사의 효율성을 높이고 비표본 오차를 줄이려는 연구가 활발히 진행되고 있다. 그럼에도 불구하고 통행의 구체적인 목적이나 개별 행태의 동기를 파악할 수 있다는 점에서 전통적 설문 방식은 여전히 대체 불가능한 가치를 지닌다.
지능형 교통 체계(Intelligent Transport Systems, ITS)의 비약적인 발전은 교통 수요 예측의 방법론적 패러다임을 전수 조사 중심에서 실시간 빅데이터 분석 중심으로 전환하는 결정적 계기가 되었다. 전통적인 가구 통행 실태 조사는 설문 응답자의 기억에 의존하므로 주관적 오류가 개입될 여지가 크고, 조사 주기와 비용 문제로 인해 급격한 도시 변화를 적시에 반영하기 어렵다는 한계가 있었다. 반면 ITS를 통해 수집되는 데이터는 정보통신 기술을 활용하여 실제 통행 행태를 객관적이고 연속적인 시계열로 기록하므로, 보다 정밀하고 동적인 수요 분석을 가능케 한다.
핵심적인 데이터 수집원 중 하나인 차량 검지 시스템(Vehicle Detection System, VDS)은 도로에 설치된 루프 검지기나 영상 검지기를 통해 교통량, 지점 속도, 점유율(Occupancy)을 실시간으로 산출한다. 이러한 자료는 단기 교통 상태 예측과 혼잡 관리를 위한 기초 자료로 활용되며, 도로 네트워크의 공급 성능을 정량화하는 데 기여한다. 특히 지점별 교통류 특성은 시계열 분석 모형이나 딥러닝 알고리즘과 결합하여 미래의 도로 소통 상태를 예측하는 핵심 변수로 기능한다.
단거리 전용 통신(Dedicated Short Range Communications, DSRC) 기술을 기반으로 하는 하이패스 데이터와 교통 카드 시스템(Transaction Control System, TCS) 데이터는 광역 교통망의 기종점 통행량(Origin-Destination matrix, O-D)을 파악하는 데 탁월한 효용성을 지닌다. 하이패스 단말기를 장착한 차량의 진출입 시각과 지점 정보는 개별 차량의 구간 통행 시간과 경로 선택 행태를 명확히 보여준다. 이는 과거의 정적 노선 배정 모형을 검증하거나, 실제 통행 패턴에 기반한 동적 기종점 행태를 분석하는 데 필수적인 자산이다.
대중교통 부문에서는 스마트 카드(Smart Card) 데이터가 수요 예측의 정밀도를 혁신적으로 향상시켰다. 교통카드 데이터는 이용자의 승하차 지점, 환승 횟수, 환승 대기 시간 등을 전수 기록하므로, 대중교통 이용자의 복잡한 통행 사슬(Trip Chain)을 개별 단위에서 재구성할 수 있게 한다. 이를 통해 교통 계획가는 특정 노선의 수요 변화를 예측하거나 환승 센터 구축에 따른 편익을 보다 과학적으로 산출할 수 있으며, 이는 활동 기반 모형(Activity-based Model)의 고도화로 이어진다.
이러한 개별 데이터들은 단독으로 활용되기보다 데이터 융합(Data Fusion) 기술을 통해 상호 보완적으로 결합될 때 분석적 가치가 극대화된다. 예를 들어, 디지털 운행 기록계(Digital Tachograph, DTG)나 GPS 궤적 데이터와 같은 프로브 차량(Probe Vehicle) 데이터와 지점 검지기 데이터를 결합하면, 네트워크 전체의 소통 상태를 전수 수준에 가깝게 추정할 수 있다. 수집된 빅데이터는 데이터 정제와 맵 매칭(Map Matching) 과정을 거쳐 분석 가능한 형태로 가공되며, 이는 인공 신경망(Artificial Neural Network) 등 고도화된 수리 모형의 학습 데이터로 투입되어 예측의 신뢰도를 제고한다15).
결과적으로 지능형 교통 체계 데이터의 활용은 교통 수요 예측을 과거의 정적이고 집계적인 방식에서 탈피시켜, 개별 행태를 반영한 동적이고 미시적인 체계로 진화시키고 있다. 이는 급변하는 도시 환경과 모빌리티 서비스의 다양화에 대응하여 보다 실효성 있는 교통 정책을 수립하는 데 중추적인 역할을 수행한다.
전통적인 4단계 수요 예측 모형은 분석 단위를 교통 분석 존(Traffic Analysis Zone, TAZ)이라는 공간적 범위로 집계(aggregate)하여 처리함으로써 계산의 효율성을 확보하였으나, 개별 통행자의 구체적인 행태적 특성과 통행 간의 상호 의존성을 반영하는 데 한계를 보였다. 이러한 제약을 극복하기 위해 등장한 미래 지향적 수요 예측 기법은 분석의 단위를 개별 경제 주체로 전환하는 비집계(disaggregate) 접근법과 인공지능을 활용한 고차원 데이터 분석에 초점을 맞춘다.
최근의 학술적 논의와 실무적 적용에서 가장 주목받는 기법 중 하나인 활동 기반 모형(Activity-Based Model, ABM)은 통행(trip) 자체를 분석의 목적으로 삼지 않고, 개인이 하루 동안 수행하는 활동(activity)의 연속체로 파악한다. 이는 통행이 특정 장소에서 활동을 수행하기 위해 발생하는 파생 수요(derived demand)라는 본질에 충실한 접근이다. 활동 기반 모형은 개인이나 가구 구성원이 직장, 학교, 쇼핑, 여가 등 다양한 활동을 시간적·공간적 제약 하에서 어떻게 배치하는지를 시뮬레이션하며, 이를 통해 통행 연쇄(trip chain)와 활동 간의 전이 과정을 정밀하게 묘사한다16). 이러한 방식은 혼잡통행료 징수나 유연 근무제 도입과 같은 정책 변화가 개인의 활동 시간대 변경에 미치는 영향을 평가하는 데 탁월한 성능을 발휘한다.
에이전트 기반 모델링(Agent-Based Modeling, ABM)은 활동 기반 모형의 철학을 시스템 전반으로 확장한 기법이다. 여기에서 각 통행자는 고유한 속성과 의사결정 규칙을 가진 에이전트(agent)로 정의되며, 이들이 가상의 교통 네트워크상에서 상호작용하며 발생하는 거시적 교통 현상을 관찰한다. 에이전트 기반 접근법은 고정된 수식을 풀이하는 대신, 개별 주체의 행동을 반복적으로 실행하여 평형 상태를 찾아가는 상향식(bottom-up) 방식을 취한다. 이는 자율주행 자동차의 도입이나 수요 응답형 교통(Demand Responsive Transport, DRT)과 같은 새로운 모빌리티 서비스가 기존 교통 체계에 미치는 동적인 변화를 예측하는 데 필수적인 도구로 자리 잡고 있다.
현대적 수요 예측의 또 다른 축은 기계학습(Machine Learning)과 딥러닝(Deep Learning)을 활용한 데이터 주도형(data-driven) 접근법이다. 전통적 통계 모형이 변수 간의 선형 관계를 가정하는 것과 달리, 인공 신경망 구조는 교통 시스템의 복잡한 비선형성과 시공간적 상관관계를 스스로 학습한다. 특히 시간적 의존성을 분석하는 데 특화된 순환 신경망(Recurrent Neural Network, RNN)의 일종인 장단기 메모리(Long Short-Term Memory, LSTM)와 도로 네트워크의 기하학적 구조를 반영할 수 있는 그래프 신경망(Graph Neural Network, GNN)은 단기 및 중기 교통 수요 예측에서 높은 정확도를 보여준다17). 이러한 모형은 빅데이터 기술과 결합하여 모바일 데이터, 교통카드 이력, 차량 검지기 데이터 등으로부터 실시간에 가까운 수요 변화를 추정하는 데 활용된다18).
미래 지향적 기법들은 단순히 예측의 정밀도를 높이는 데 그치지 않고, 공유 경제와 지속 가능한 교통 체계로의 전환을 지원하는 정책적 의사결정 도구로서의 역할을 수행한다. 개별 통행자의 효용 극대화 원리를 수리적으로 표현하는 과정에서, 확률적 선택 모형은 다음과 같은 일반화된 비용 함수를 포함할 수 있다.
$$ U_{in} = \beta_0 + \beta_1 T_{in} + \beta_2 C_{in} + \epsilon_{in} $$
여기서 $ U_{in} $은 개인 $ n $이 대안 $ i $를 선택할 때 얻는 효용이며, $ T_{in} $은 통행 시간, $ C_{in} $은 통행 비용, $ $는 각 변수의 가중치를 나타내는 파라미터이다. 최신 기법들은 이러한 전통적 효용 함수에 환경적 가치, 심리적 태도, 잠재적 선호도와 같은 비계량적 요소를 통합하여 더욱 인간 중심적인 수요 예측을 지향하고 있다. 결과적으로 미래 지향적 수요 예측은 정적인 통계 산출에서 벗어나, 기술 발전과 사회적 가치 변화를 유연하게 수용하는 동적 시뮬레이션 체계로 진화하고 있다.
활동 기반 모형(Activity-Based Model, ABM)은 통행 그 자체를 분석의 기본 단위로 삼던 전통적인 4단계 수요 예측 모형의 한계를 극복하고, 인간의 삶을 영위하기 위한 ’활동’의 관점에서 교통 수요를 파악하려는 시도에서 출발하였다. 이 모형의 근본적인 전제는 교통이 그 자체로 목적이 되는 것이 아니라, 직장 업무, 교육, 쇼핑, 여가 등 특정 목적을 달성하기 위해 발생하는 파생 수요(Derived Demand)라는 점에 있다. 따라서 활동 기반 모형은 개인이 하루 동안 수행하는 일련의 활동 스케줄을 분석하고, 그 결과로서 발생하는 통행의 연쇄적 흐름을 모형화하는 데 집중한다. 이는 통행을 개별적이고 독립적인 사건으로 처리하던 기존 방식에서 벗어나, 통행 간의 시간적·공간적 상호 의존성을 명확히 규명하려는 행태적 접근법(Behavioral approach)의 일환이다.
이 모형의 이론적 토대는 토르스텐 헤게르스트란트(Torsten Hägerstrand)가 제시한 시간지리학(Time Geography)에 깊이 뿌리를 두고 있다. 시간지리학은 인간의 활동이 물리적 공간뿐만 아니라 시간이라는 유한한 자원 속에서 이루어진다는 점을 강조하며, 능력 제약(Capability constraints), 결합 제약(Coupling constraints), 권위 제약(Authority constraints)과 같은 다양한 제약 요인이 개인의 활동 선택 범위를 결정한다고 본다. 활동 기반 모형은 이러한 제약 조건을 반영하여, 개인이 가용한 시간 예산 내에서 최적의 활동 경로를 어떻게 구성하는지를 마이크로시뮬레이션(Microsimulation) 기법을 통해 추정한다. 이를 통해 분석가는 특정 교통 정책이 개별 경제 주체의 일일 활동 유형을 어떻게 변화시키는지 보다 정교하게 예측할 수 있다.
활동 기반 모형의 구조적 특징 중 하나는 ‘투어(Tour)’ 개념의 도입이다. 기존의 통행 기반 모형이 기점과 종점 사이의 단일 통행(Trip)을 독립적으로 다루었다면, 활동 기반 모형은 집에서 출발하여 여러 지점을 거쳐 다시 집으로 돌아오는 일련의 통행 묶음인 투어를 기본 단위로 설정한다. 이러한 접근은 다목적 통행(Multi-purpose trip)이나 연쇄 통행(Trip chaining) 행태를 효과적으로 설명할 수 있게 한다. 예를 들어, 퇴근길에 식료품점에 들러 쇼핑을 하고 귀가하는 행태는 두 개의 독립된 통행이 아니라, 하나의 투어 내에서 발생한 상호 연관된 활동으로 분석된다. 이는 교통 수요 관리 정책, 특히 혼잡통행료 부과나 유연근무제 도입이 통행 시간대 변경이나 경로 선택에 미치는 영향을 평가할 때 탁월한 분석력을 제공한다.
또한, 활동 기반 모형은 집계 데이터가 아닌 개별 행태 데이터를 활용함으로써 인구 통계적 특성의 변화를 민감하게 반영한다. 가구 구성원의 수, 소득 수준, 차량 보유 여부뿐만 아니라 가구원 간의 상호작용까지 고려하여 활동을 할당한다. 예를 들어, 부모가 자녀를 학교에 데려다주는 활동은 두 개인의 스케줄이 결합된 결과이며, 이는 단순한 통행 발생 확률로 계산하기 어려운 복잡한 의사결정 과정을 내포한다. 이러한 정밀함 덕분에 활동 기반 모형은 지능형 교통 체계나 자율주행 자동차의 도입과 같은 미래 교통 환경 변화에 따른 개별 이용자의 행태 변화를 예측하는 데 있어 핵심적인 도구로 주목받고 있다. 비록 모형의 구축에 방대한 양의 활동 일지 조사(Activity diary survey) 데이터와 고성능의 연산 자원이 요구된다는 실무적 어려움이 있으나, 정책의 정밀한 환류 체계를 구축하기 위한 필수적인 방법론으로 자리 잡고 있다.19)
전통적인 수리 모델과 계량경제학적 방법론은 변수 간의 선형적 관계를 가정하거나 엄격한 통계적 전제 조건을 요구하는 경우가 많아, 복잡한 도시 교통 체계에서 발생하는 비선형적 패턴과 급격한 변동성을 포착하는 데 한계를 보였다. 이러한 제약을 극복하기 위해 등장한 인공지능(Artificial Intelligence, AI) 기반 예측 기법은 대규모의 빅데이터로부터 교통 흐름의 내재된 규칙성을 스스로 학습하며, 특히 기계학습(Machine Learning)과 딥러닝(Deep Learning) 알고리즘을 통해 예측의 정밀도를 획기적으로 향상시켰다. 인공지능 모델은 과거의 교통량, 속도, 기상 조건, 이벤트 정보 등 이질적인 데이터원(data source)을 통합하여 분석할 수 있는 유연성을 지니며, 이는 현대 교통 공학의 패러다임을 데이터 주도형 모델(Data-driven model)로 전환하는 계기가 되었다.
기계학습 단계에서 주로 활용되는 알고리즘으로는 서포트 벡터 머신(Support Vector Machine, SVM), 랜덤 포레스트(Random Forest), 그리고 그래디언트 부스팅(Gradient Boosting) 계열의 모델들이 있다. 이러한 기법들은 고차원의 입력 변수들 사이의 복잡한 상호작용을 효과적으로 처리하며, 특히 회귀 분석에서 발생하는 다중공선성 문제를 비교적 자유롭게 다룰 수 있다는 장점이 있다. 예를 들어, 랜덤 포레스트는 다수의 결정 트리를 구축하고 그 결과를 앙상블(ensemble)함으로써 모델의 일반화 성능을 높이고 과적합(overfitting)을 방지한다. 그러나 이러한 기법들은 교통 데이터가 지닌 시계열적 연속성과 공간적 상관관계를 명시적으로 모형화하는 데에는 여전히 일정한 한계를 지니고 있었다.
이후 등장한 딥러닝 기술은 신경망의 층을 깊게 쌓아 데이터의 추상적인 특징을 계층적으로 추출함으로써 예측 성능을 한 단계 더 진보시켰다. 교통 수요는 시간적 흐름에 따라 변화하는 시계열 데이터(Time-series data)의 특성을 가지므로, 이를 처리하기 위해 순환 신경망(Recurrent Neural Network, RNN)과 그 변형인 장단기 메모리(Long Short-Term Memory, LSTM)가 널리 도입되었다. LSTM은 셀 상태(cell state)와 다양한 게이트 구조를 통해 장기 의존성(long-term dependency) 문제를 해결하며, 과거의 특정 시점의 교통 정보가 현재와 미래의 수요에 미치는 영향을 효과적으로 학습한다. 신경망의 은닉 상태를 갱신하는 기본적인 수식은 다음과 같이 표현된다.
$$ h_t = \sigma(W_h h_{t-1} + W_x x_t + b) $$
여기서 $ h_t $는 시점 $ t $에서의 은닉 상태, $ x_t $는 입력 벡터, $ W $는 가중치 행렬, $ b $는 편향(bias), 그리고 $ $는 활성화 함수를 의미한다. 이러한 구조를 통해 모델은 교통 수요의 일간, 주간 주기성뿐만 아니라 비정형적인 변동까지 학습할 수 있게 되었다.
최근의 연구 동향은 교통망의 공간적 위상 구조를 반영하기 위해 합성곱 신경망(Convolutional Neural Network, CNN)과 그래프 신경망(Graph Neural Network, GNN)을 결합하는 방향으로 전개되고 있다. 도로는 격자 형태가 아닌 노드(node)와 링크(link)로 구성된 그래프 구조이므로, 그래프 합성곱 네트워크(Graph Convolutional Network, GCN)를 활용하여 인접한 도로 구간 사이의 공간적 상호의존성을 포착한다. 특히 시공간 그래프 신경망(Spatio-Temporal GNN)은 시간적 변화를 학습하는 RNN 계열의 유닛과 공간적 특징을 추출하는 GCN 유닛을 통합하여, 특정 지점의 정체가 주변 네트워크로 확산되는 양상을 정밀하게 예측한다. 이러한 모델은 지능형 교통 체계(Intelligent Transportation Systems, ITS)에서 실시간 교통 관리 및 최적 경로 안내를 위한 핵심 기술로 활용되고 있다.
다만 인공지능 기반 예측 모델은 높은 정확도에도 불구하고 모델의 내부 의사결정 과정을 인간이 이해하기 어렵다는 ‘블랙박스(black box)’ 문제를 안고 있다. 이는 교통 정책의 근거를 마련하거나 대규모 예산이 투입되는 사업의 타당성을 설명해야 하는 실무 환경에서 제약 요인이 된다. 이에 따라 최근에는 모델의 예측 결과에 대한 원인을 분석할 수 있는 설명 가능한 인공지능(Explainable AI, XAI) 기법을 교통 수요 예측에 접목하려는 시도가 활발히 이루어지고 있다. 또한 전통적인 교통 공학의 물리적 법칙이나 제약 조건을 신경망의 손실 함수(loss function)에 반영하는 물리 기반 기계학습(Physics-informed Machine Learning) 연구도 미래 지향적인 대안으로 주목받고 있다20)21).
교통 수요 예측은 국가 및 지역의 교통 체계를 구축하고 운영하는 실무 과정에서 중추적인 역할을 수행한다. 이 과정은 단순히 장래의 통행량을 추정하는 기술적 단계를 넘어, 한정된 국가 자원을 효율적으로 배분하기 위한 의사결정의 객관적 근거를 제공한다. 특히 사회간접자본(Social Overhead Capital, SOC) 건설 사업에서 수요 예측 결과는 해당 사업의 경제적 사활을 결정짓는 핵심 지표로 활용된다. 대한민국을 비롯한 많은 국가에서 시행하는 예비타당성조사 제도는 교통 수요 예측을 통해 산출된 비용 편익 분석(Benefit-Cost Analysis, BCA) 결과를 바탕으로 대규모 재정 투입의 적절성을 검토한다. 이때 예측된 수요가 기준치에 미달할 경우 사업 추진이 보류되거나 계획이 수정되기도 하며, 이는 예산 낭비를 방지하고 사회적 효율성을 극대화하는 기제로 작용한다22).
도시 및 지역 계획의 관점에서 교통 수요 예측은 도시기본계획과 교통정비기본계획 수립의 기초가 된다. 도시의 확장에 따른 신규 도로 건설, 도시철도 노선 확충, 환승 센터 입지 선정 등은 모두 장래의 인구 이동 패턴과 교통 수요 변화를 전제로 설계된다23). 특히 최근 주목받는 대중교통 지향형 개발(Transit-Oriented Development, TOD) 전략은 역세권을 중심으로 고밀도 복합 개발을 유도하여 교통 수요를 효율적으로 관리하려는 시도이며, 이를 성공적으로 수행하기 위해서는 정밀한 수요 분석이 필수적적이다. 또한, 예측 모형은 교통수요관리(Transportation Demand Management, TDM) 정책의 효과를 사전에 시뮬레이션하는 데에도 활용된다. 혼잡통행료 부과, 차량 요일제 시행, 버스 전용 차로 확대와 같은 정책이 실제 교통 흐름과 대중교통 이용률에 미치는 영향을 분석함으로써 정책의 실효성을 높이고 부작용을 최소화할 수 있다.
환경 정책 및 미래 기술 도입 과정에서도 교통 수요 예측의 중요성은 갈수록 증대되고 있다. 기후 변화 대응을 위한 탄소 중립 전략의 일환으로, 교통 부문의 탄소 배출량을 감축하기 위해 친환경 교통수단으로의 전환 수요를 예측하는 연구가 활발히 진행 중이다. 전기차 및 수소차 보급 확대에 따른 충전 인프라의 최적 입지 선정이나, 자율주행 자동차와 도심 항공 교통(Urban Air Mobility, UAM)과 같은 미래 모빌리티 서비스가 기존 교통 체계에 가져올 변화를 예측하는 것은 차세대 국가 정책 수립의 핵심 과제이다24). 이러한 실무적 응용은 단순히 과거의 추세를 연장하는 것이 아니라, 사회적 가치와 기술적 변혁을 반영한 시나리오 분석을 통해 보다 지속 가능한 국토 공간 구조를 형성하는 데 기여한다. 따라서 교통 수요 예측은 공학적 분석과 정책적 판단이 교차하는 지점에서 국가의 미래 경쟁력을 결정짓는 전략적 도구이다.
타당성 조사는 대규모 공공 자금이 투입되는 교통 시설 확충 사업의 경제적, 정책적 타당성을 사전에 검토하여 투자 우선순위를 결정하고 예산 집행의 효율성을 제고하는 절차이다. 이는 교통 수요 예측의 결과를 바탕으로 사업 시행 시 예상되는 사회적 이득과 소요 비용을 정량적으로 비교하는 과정을 포함한다. 특히 대한민국에서는 예비타당성조사 제도를 통해 총사업비가 일정 규모 이상인 대형 국책 사업에 대해 엄격한 심사를 진행하며, 이를 통해 선심성 사업으로 인한 재정 낭비를 방지하고 사회적 후생을 극대화하는 의사결정을 내린다.
경제성 분석의 핵심적 방법론은 비용-편익 분석(Cost-Benefit Analysis, CBA)이다. 이는 사업의 수명 주기 동안 발생하는 모든 비용과 편익을 화폐 단위로 환산하여 비교하는 기법이다. 교통 사업의 특성상 비용은 건설 단계에 집중되는 반면, 편익은 운영 단계에서 장기간에 걸쳐 발생하므로 시간 가치를 반영하는 과정이 필수적이다. 이를 위해 미래의 가치를 현재 시점으로 환산하는 사회적 할인율(Social Discount Rate)을 적용한다. 경제성 평가의 주요 지표로는 순현재가치(Net Present Value, NPV), 편익-비용 비율(Benefit-Cost Ratio, B/C Ratio), 내부수익률(Internal Rate of Return, IRR)이 활용된다.
순현재가치는 분석 기간 내 발생하는 편익의 총합에서 비용의 총합을 뺀 값으로, 다음과 같이 정의된다.
$$ NPV = \sum_{t=0}^{n} \frac{B_t}{(1+r)^t} - \sum_{t=0}^{n} \frac{C_t}{(1+r)^t} $$
여기서 $ B_t $는 $ t $년도의 편익, $ C_t $는 $ t $년도의 비용, $ r $은 사회적 할인율, $ n $은 분석 대상 기간(통상 30~40년)이다. $ NPV $가 0보다 크면 경제적 타당성이 있는 것으로 간주한다. 편익-비용 비율은 총편익의 현재가치를 총비용의 현재가치로 나눈 비율로, $ B/C $일 때 사업의 경제성을 인정한다. 내부수익률은 $ NPV $를 0으로 만드는 할인율을 의미하며, 이 값이 사회적 할인율보다 클 경우 사업 추진의 경제적 근거가 확보된다.
교통 사업에서 산출되는 편익은 직접 편익과 간접 편익으로 구분된다. 직접 편익은 주로 도로 및 철도 이용자가 누리는 혜택으로 구성되며, 교통 수요 예측 모델을 통해 도출된 통행량, 통행 시간, 통행 거리의 변화량을 화폐 가치로 환산하여 계산한다. 대표적인 편익 항목과 그 세부 내용은 아래의 표와 같다.
| 편익 항목 | 주요 내용 |
|---|---|
| 통행 시간 절감 편익 | 도로 혼잡 완화 및 운행 속도 증가에 따른 통행 시간 가치의 보존 |
| 차량 운행 비용 절감 편익 | 주행 거리 단축 및 속도 최적화에 따른 연료비, 소모품비, 감가상각비 감소 |
| 교통사고 감소 편익 | 도로 선형 개량 및 안전 시설 확충으로 인한 사고 발생 건수 및 피해액 감소 |
| 환경 비용 절감 편익 | 대기 오염 물질 배출 감소 및 이산화탄소 배출 저감에 따른 사회적 비용 감소 |
상기 항목 중 통행 시간 절감 편익은 대다수 교통 사업에서 가장 큰 비중을 차지한다. 이를 산정하기 위해서는 업무 통행과 비업무 통행으로 구분된 시간 가치 원단위가 적용되며, 이는 한계 저축률이나 평균 임금 수준 등을 고려하여 결정된다. 차량 운행 비용의 경우 유류비뿐만 아니라 차량의 내구 연한 연장에 따른 기회비용까지 포함하여 정밀하게 산출한다.
비용 산정 단계에서는 공사비, 보상비, 설계비, 감리비 등을 포함하는 총사업비뿐만 아니라, 완공 후 운영 기간 동안 발생하는 유지관리비와 재투자비를 모두 고려해야 한다. 특히 보상비 산정 시 토지 수용에 따른 지가 상승분이나 민원 처리 비용 등 불확실성 요소를 적절히 반영하는 것이 중요하다.
경제성 분석 결과가 사업의 효율성을 나타낸다면, 최종적인 사업 추진 여부는 정책적 분석과 지역 균형 발전 분석을 포함한 종합 평가를 통해 결정된다. 이를 위해 계층화 분석 과정(Analytic Hierarchy Process, AHP)이 널리 사용된다. AHP는 경제성, 정책적 일관성, 사업 추진 의지, 지역 낙후도 등 계량화하기 어려운 다각적 요소를 전문가 설문을 통해 가중치를 부여하고 수치화하는 기법이다. 일반적으로 종합 평점(AHP Score)이 0.5 이상일 때 사업의 타당성이 최종적으로 확보된 것으로 판단한다. 이러한 체계적 분석 과정은 교통 수요 예측이 단순한 수치 추정을 넘어 국가 자원의 최적 배분을 위한 의사결정 지원 시스템으로서 기능하게 한다. 25)
교통 수요 관리(Transportation Demand Management, TDM) 정책은 도로 공급의 물리적 한계를 극복하고 기존 교통 시설의 효율성을 극대화하기 위해 통행자의 행태 변화를 유도하는 일련의 전략을 의미한다. 전통적인 교통 계획이 ’예측 후 공급(Predict and Provide)’의 원칙에 따라 도로 확충에 집중했다면, 교통 수요 관리는 통행의 발생 자체를 억제하거나 통행 시간, 경로, 수단을 분산시키는 데 목적을 둔다. 이러한 정책의 효과를 정밀하게 예측하는 것은 교통 정책의 타당성을 검증하고 사회적 편익을 산출하는 데 있어 필수적인 과정이다.
교통 수요 관리 정책의 효과 예측에서 가장 핵심적인 분석 틀은 개별 행태 모형에 기반한 효용 함수(Utility Function)의 변화를 추적하는 것이다. 예를 들어, 혼잡통행료(Congestion Pricing) 부과 정책의 경우, 개별 통행자가 체감하는 일반화 비용(Generalized Cost)에 직접적인 금전적 비용을 추가함으로써 효용의 변화를 유발한다. 통행자 $i$가 수단 $m$을 선택할 때의 효용 $U_{im}$은 다음과 같이 정의될 수 있다.
$$ U_{im} = V_{im} + \epsilon_{im} = \beta_t T_{im} + \beta_c (C_{im} + P_m) + \dots + \epsilon_{im} $$
여기서 $T_{im}$은 통행 시간, $C_{im}$은 운행 비용, $P_m$은 정책적으로 부과된 통행료나 주차 요금 등을 의미하며, $\beta$는 각 변수의 가중치를 나타내는 파라미터이다. 정책 시행으로 인해 특정 수단이나 경로의 비용 $P_m$이 상승하면 해당 대안의 효용이 감소하며, 이는 로짓 모형(Logit Model)을 통해 다른 수단으로의 전환 확률이나 통행 포기 확률로 전이된다.
차량 요일제(Weekly No-drive Day Program)와 같은 규제 중심의 정책 효과를 예측할 때는 통행 발생(Trip Generation) 단계와 수단 분담(Mode Choice) 단계의 연계 분석이 요구된다. 특정 요일에 차량 운행이 제한될 경우, 해당 가구의 통행은 타 수단으로 전환되거나 통행 목적의 시급성에 따라 다른 날짜로 전이(Temporal Shift)된다. 이를 정교하게 예측하기 위해서는 단순히 과거의 통행 패턴을 관찰하는 것을 넘어, 정책 변화에 따른 통행자의 반응을 설문하는 진술 선호 조사(Stated Preference Survey, SP 조사) 데이터를 활용하여 모형을 보정해야 한다.
정책 수단별 수요 변화의 민감도는 탄력성(Elasticity) 개념을 통해 정량화된다. 교통 수요의 가격 탄력성은 통행 요금의 변화율 대비 통행량의 변화율로 정의되며, 이는 도시 구조나 대체 교통수단의 발달 정도에 따라 상이하게 나타난다. 예를 들어, 지하철망이 잘 갖춰진 대도시에서는 혼잡통행료 부과 시 도로 수요의 가격 탄력성이 높게 나타나 정책 효과가 극대화되지만, 대체 수단이 부족한 지역에서는 수요의 가격 탄력성이 낮아 통행량 감소보다는 통행자의 경제적 부담 증가로 이어질 가능성이 크다.
최근에는 정책의 효과를 더욱 미시적으로 예측하기 위해 활동 기반 모형(Activity-based Model)과 미시 시뮬레이션(Micro-simulation) 기법이 결합되고 있다. 이는 개별 가구의 하루 일과를 시뮬레이션하여 특정 시간대의 통행 규제가 전체 일과와 가구원 간의 통행 공유에 미치는 영향을 분석한다. 이러한 고도화된 예측 기법은 주차 수요 관리, 카풀 장려, 탄소 적립제 등 비금전적이고 복합적인 TDM 정책이 실제 교통량 감축에 기여하는 정도를 보다 객관적으로 평가할 수 있는 근거를 제공한다.
교통 수요 예측은 미래의 불확실한 상황을 전제로 수행되기에 실제 관측치와 예측치 사이의 괴리가 필연적으로 발생한다. 이러한 오차는 단순한 기술적 한계를 넘어 사회간접자본 투자 결정의 왜곡과 예산 낭비라는 심각한 부작용을 초래할 수 있다. 따라서 예측 과정에서 발생하는 오차의 원인을 체계적으로 분석하고, 이를 관리하기 위한 전략을 수립하는 것은 교통 계획의 신뢰성을 확보하는 핵심적인 과정이다.
예측 오차의 원인은 크게 세 가지 측면으로 분류할 수 있다. 첫째는 입력 데이터의 불확실성이다. 예측 모형의 기초가 되는 사회경제지표, 즉 미래의 인구 규모, 국내총생산(GDP), 자동차 보유 대수 및 토지 이용 계획 등이 실제와 다르게 전개될 경우 예측 결과는 근본적인 한계에 봉착한다. 둘째는 모형 자체의 구조적 결함과 매개변수 설정의 오류이다. 현실의 복잡한 통행 행태를 수식화하는 과정에서 발생하는 모형의 명세 오류(Model Misspecification)나, 과거 데이터를 기반으로 추정된 매개변수가 미래에도 불변할 것이라는 가정은 오차를 유발하는 주요 요인이 된다. 셋째는 전략적 요인으로, 특정 사업의 추진 가능성을 높이기 위해 수요를 낙관적으로 추정하는 낙관적 편향(Optimism Bias)이나 전략적 왜곡(Strategic Misrepresentation)이 개입되는 경우이다. 특히 대규모 국책 사업의 타당성 조사 과정에서 이러한 인위적 편향이 빈번하게 보고된다.
오차의 크기를 정량적으로 평가하기 위해 실무에서는 다양한 통계적 지표를 활용한다. 대표적으로 평균 절대 백분율 오차(Mean Absolute Percentage Error, MAPE)와 평균 제곱근 오차(Root Mean Square Error, RMSE)가 있다. 특정 노선 $i$에 대한 실제 통행량을 $A_i$, 예측 통행량을 $F_i$라 할 때, MAPE는 다음과 같이 정의된다.
$$ MAPE = \frac{1}{n} \sum_{i=1}^{n} \left| \frac{A_i - F_i}{A_i} \right| \times 100 $$
이러한 지표는 과거 사업들의 예측 성과를 검토하고 현재 모형의 신뢰도를 진단하는 기초 자료가 된다. 특히 철도와 같은 대규모 시설 사업에서는 개통 초기 수요가 예측치의 절반에도 미치지 못하는 사례가 빈번하며, 이는 노선망 개통 시점의 지연이나 주변 개발 계획의 미이행 등 외부 환경 변화에 민감하게 반응하기 때문이다26).
불확실성을 체계적으로 관리하기 위한 대응 방안으로는 민감도 분석(Sensitivity Analysis)과 시나리오 분석(Scenario Analysis)이 널리 활용된다. 민감도 분석은 입력 변수 중 특정 요인(예: 유가, 통행료, 경제성장률)이 일정 비율 변화할 때 최종 수요가 얼마나 변동하는지를 파악하여 핵심 위험 요인을 식별하는 기법이다. 시나리오 분석은 미래에 발생 가능한 여러 상황을 ‘낙관적’, ‘중립적’, ‘비관적’ 시나리오로 설정하고 각각의 수요 범위를 제시함으로써 의사결정자에게 단일 수치가 아닌 합리적인 예측 범위를 제공한다.
최근에는 고정된 수치 예측에서 벗어나 확률적 분포를 활용하는 기법도 도입되고 있다. 몬테카를로 시뮬레이션(Monte Carlo Simulation)을 통해 입력 변수의 확률 분포를 정의하고 수만 번의 반복 계산을 수행함으로써, 특정 수요 수준이 발생할 확률을 도출하는 방식이다. 또한, 사업 시행 이후 실제 수요를 지속적으로 모니터링하고 이를 차기 예측에 환류하는 사후 평가(Ex-post evaluation) 체계의 강화는 예측 모형의 자기 학습 기능을 높이는 데 기여한다. 이러한 다각적인 불확실성 관리 방안은 교통 정책 수립 시 리스크를 최소화하고 공공 투자의 효율성을 극대화하는 실무적 기반이 된다.