사용자 도구

사이트 도구


교통_수요_예측

차이

문서의 선택한 두 판 사이의 차이를 보여줍니다.

차이 보기로 링크

양쪽 이전 판이전 판
다음 판
이전 판
교통_수요_예측 [2026/04/13 15:09] – 교통 수요 예측 sync flyingtext교통_수요_예측 [2026/04/13 15:12] (현재) – 교통 수요 예측 sync flyingtext
줄 162: 줄 162:
 === 원단위법과 회귀분석법 === === 원단위법과 회귀분석법 ===
  
-단위당 통행 발생량을 기으로 하는 법과 변수 간의 상관관계를 이용한 분석 기법을 비교한다.+원단위법(Trip Rate Method)은 특정 단위당 발생하는 통행량을 기초로 장래의 통행 발생량을 추정하는 가장 직관적이고 고전적인 법이다. 이 방법은 [[교통 분석 존]](Traffic Analysis Zone, TAZ) 내의 인구, 가구 수, 종사자 수, 또는 건축물 연면적과 같은 특정 지표를 단위(Unit)로 설정하고, 해당 단위 하나가 하루 동안 생성하거나 유입시키는 평균 통행량을 조사하여 예측에 활용한다. 원단위법의 기본 가정은 현재 관측된 단위당 통행 발생 특성이 미래에도 일정하게 유지되거나, 예측 가능한 추세에 따라 변화한다는 것이다. 특정 존 $i$에서 발생하는 총 통행량 $T_i$를 산출하는 수식은 다음과 같이 정의할 수 있다. 
 + 
 +$$ T_i = \sum_{k} (R_k \times X_{ik}) $$ 
 + 
 +위 식에서 $R_k$는 활동 유형 또는 토지 이용 형태 $k$에 따른 단위당 통행 발생률(Trip Rate)을 의미하며, $X_{ik}$는 해당 존의 사회경제적 지표인 독립변수의 양을 나타낸다. 원단위법은 계산 과정이 단순하고 실무적으로 적용기 용이하다는 장점이 있으나, 통행 발생에 영향을 미치는 다양한 변수 간의 복잡한 상호작용을 반영하지 못한다는 한계가 있다. 또한, 동일한 범주 내의 개체들이 모두 동일한 통행 특성을 가진다고 가정하므로, 존 내부의 이질성을 무시할 위험이 크다. 
 + 
 +회귀분석(Regression Analysis Method)은 통행 발생량과 이에 영향을 미치는 여러 사회경제적 변수 간의 인과관계를 통계적 함수로 정립하는 기법이다. 원단위법이 단순한 비율에 의존한다면, 회귀분석법은 [[계량경제학]]적 접근을 통해 변수 간의 상관관계를 수치화한다. 일반적으로 [[선형 회귀 분석]](Linear Regression Analysis)이 가장 널리 사되며, 통행 발생량인 [[종속변수]] $Y$와 인구, 자동차 보유 대수, 가구 소득 등의 [[독립변수]] $X_j$ 간의 관계를 다음과 같은 수식으로 표현다. 
 + 
 +$$ Y = \beta_0 + \beta_1 X_1 + \beta_2 X_2 + \dots + \beta_n X_n + \epsilon $$ 
 + 
 +여기서 $\beta_0$는 상수항, $\beta_j$는 각 독립변수의 영향력을 나타내는 회귀계수이며, $\epsilon$은 모형이 설명하지 못하는 오차항을 의미한다. 회귀분석법은 [[최소제곱법]](Ordinary Least Squares, OLS)을 통해 잔차의 제곱합을 최소화하는 방향으로 계수를 추정한다. 이 방법론의 핵심적인 강점은 모형의 통계적 신뢰성을 정량적으로 검증할 수 있다는 점에 있다. 분석가는 [[결정계수]](Coefficient of Determination, $R^2$)를 통해 모형의 설명력을 파악하고, $t$-검정이나 $F$-검정을 통해 개별 변수와 모형 전체의 [[통계적 유의성]]을 판정한다. 
 + 
 +두 기법을 비교했을 때, 원단위법은 데이터 수집이 제한적이거나 신속한 판단이 필요한 예비 타당성 조사 단계에서 유용하게 활용된다. 반면, 회귀분석법은 도시의 성장에 따른 복합적인 통행 행태 변화를 설명하는 데 적합하다. 특히 회귀분석법은 변수 간의 [[다중공선성]](Multicollinearity) 문제를 사전에 검토함으로써 독립변수 간의 중복 설명을 배제하고 모형의 정밀도를 높일 수 있다. 그러나 회귀분석법은 독립변수의 장래치를 예측하는 과정에서 또 다른 오차가 개입될 수 있으며, 과거의 상관관계가 미래에도 지속될 것이라는 가정이 무너질 경우 예측력이 급격히 저하될 우려가 있다. 따라서 현대의 교통 계획에서는 분석 대상 지역의 규모와 데이터의 가용성을 고려하여 두 기법을 상호 보완적으로 사용하거나, 집계형 모형의 한계를 극복하기 위해 가구 단위의 미시적 분석을 병행하기도 한다.
  
 === 카테고리 분석법 === === 카테고리 분석법 ===
  
-가구의 소득이나 차량 보유 대수 등 특정 집단별 특성에 라 통행 발생량을 분화하여 예측하는 방식을 다.+카테고리 분석법(Category Analysis) 또는 교차 분류 분석법(Cross-Classification Analysis)은 가구의 사회경제적 특성에 따라 통행 발생 행태가 유사한 집단을 구분하고, 각 집단별 평균 통행 발생량을 산출하여 미래의 수요를 예측하는 기법다. 이는 [[통행 발생]] 단계에서 [[회귀 분석]]과 함께 가장 널리 사용되는 방법론 중 하로, 개별 가구의 특성을 직접적으로 모형에 반영할 수 있다는 점에서 [[행태 모형]]으로의 이행 단계에 위치한 기법이라 평가받는다. 이 방법은 분석 대상 지역의 전체 가구를 소득 수준, [[자동차 보유 대수]], 가구원 수, 주거 형태 등 통행에 직접적인 영향을 미치는 주요 변수들의 조합으로 이루어진 다차원 행렬(Matrix) 내의 특정 ’카테고리’로 분류하는 것에서 시작한다. 
 + 
 +이 기법의 핵심적인 전제는 동일한 카테고리에 속하는 가구들은 지리적 위치나 공간적 특성에 관계없이 유사한 통행 발생 특성을 공유한다는 것이다. 예를 들어, 소득이 높고 차량을 2대 이상 보유한 4인 가구는 특정 [[교통 분석 존]](Traffic Analysis Zone, TAZ)에 거주하더도 다른 존에 거주하는 동일 조건의 가구와 유사한 빈도의 통행을 생성한다고 가정한다. 분석 과정에서는 기준 연도의 설문 조사 데이터를 바탕으로 각 카테고리별 가구당 평균 통행 발생량인 [[원단위]]를 산출한다. 이후 장래의 인구 통계적 변화를 예측하여 각 카테고리에 속하게 될 가구의 수를 추정한 뒤, 이를 기 산출된 원단위와 곱하여 최종적인 총 통행 발생량을 도출한다. 
 + 
 +카테고리 석법은 [[회귀 분석]]이 지니는 몇 가지 구조적 한계를 효과적으로 극복한다. 첫째, 변수 간의 관계가 반드시 선형적(Linear)일 필요가 없으므로 사회경제적 변수와 통행량 사이의 복잡한 [[비선형성]]을 유연하게 수용할 수 있다. 둘째, 존 단위의 집계 데이터를 사용하는 것이 아니라 가구 단위의 개별 데이터를 기초로 하므로, 집계 과정에서 발생하는 정보의 손실과 [[생태학적 오류]](Ecological Fallacy)를 최소할 수 있다. 셋째, 모형의 구조가 직관적이고 연산 과정이 단순하여 정책 결정자나 실무자가 결과를 해석하고 활용하기에 용이하다는 실무적 장점을 지닌다. 
 + 
 +그러나 카테고리 분석법의 정밀도는 분류 기준이 되는 카테고리의 설정과 데이터의 충분성에 크게 의존한다. 분류 기준이 되는 변수가 늘어날수록 행렬의 셀(Cell) 수가 기하급수적으로 증가하게 되는데, 이는 각 셀마다 통계적 유의성을 확보하기 위한 충분한 [[표본 크기]]를 요구한다. 만약 특정 카테고리에 할당된 표본이 부족할 경우 해당 셀의 원단위는 신뢰하기 어려워지며, 이는 전체 예측 결과의 왜곡으로 이어진다. 또한, [[회귀 분석]]과 달리 모형 전체의 적합도를 검증할 수 있는 [[결정계수]]와 같은 표준화된 통계 지표가 미비는 점도 한계로 지적된
 + 
 +더욱이 장래 예측 시점에서 각 카테고리별 가구 분포를 정밀하게 추정하는 작업은 그 자체로 매우 까다로운 과제이다. 미래의 [[가구 소득]] 분포나 가구 구조의 변화를 예측하는 과정에서 수반되는 불확실성은 카테고리 분석법의 최종 결과에 그대로 전이된다. 따라서 이 기법을 효과적으로 운용하기 위해서는 인구 구조 변화와 [[경제 성장]] 추세에 대한 심도 있는 분석이 선행되어야 하며, 최근에는 이러한 한계를 보완하기 위해 [[이산 선택 모형]]이나 [[시뮬레이션]] 기법을 결합한 하이브리드 형태의 분석 방법론이 연구되고 있다.
  
 ==== 통행 분포 단계 ==== ==== 통행 분포 단계 ====
줄 187: 줄 207:
 === 성장인자법 === === 성장인자법 ===
  
-현재의 통행 패턴이 미래에도 지된다는 가정하에 성장률을 적용하여 분를 정하는 기법이다.+성장인자법(Growth Factor Method)은 [[통행 분포]](Trip Distribution) 단계에서 가장 고전적이면서도 직관적인 접근 방식으로, 기준 연도의 [[기종점 행렬]](Origin-Destination Matrix, O-D 행렬)이 미래에도 그 구조적 패턴을 유지한다는 전제하에 각 존의 성장률을 적용하여 장래 통행량을 추정하는 기법이다. 이 방법론은 장래의 [[토지 이용]] 계획이나 교통망의 변화가 크지 않은 단기 예측 상황에서 유용하게 활용되며, 특히 기준 연도의 조사 자료가 충분히 신뢰할 만한 경우 강력한 예측력을 발휘한다. 성장인자법의 핵심은 현재의 통행 패턴이 미래의 통행 분포를 결정하는 가장 중요한 지표라는 [[안정성 가정]]에 기반한다는 점이다. 
 + 
 +가장 단순한 형태인 단일성장인자법(Uniform Growth Factor Method)은 대상 지역 전체의 평균적인 성장률을 모든 기종점 쌍에 동일하게 적용한다. 기준 연의 기점 $i$에서 종점 $j$로의 통행량을 $t_{ij}$, 역 전체의 장래 총 통행 발생량을 $T$, 현재 총 통행 발생량을 $t$라고 할 때, 장래 통행량 $T_{ij}$는 다음과 같이 산출된다
 + 
 +$$ T_{ij} = t_{ij} \times \frac{T}{t} = t_{ij} \times F $$ 
 + 
 +여기서 $F$는 지역 전체의 성장인자를 의미한다. 이 방식은 계산이 매우 간편하다는 장점이 있으나, 지역 내 각 [[교통 분석 존]](Traffic Analysis Zone, TAZ)별로 상이한 성장 추세를 반영하지 못한다는 결정적인 한계가 있다. 예를 들어 특정 지역은 급격히 개발되고 다른 지역은 정체되는 상황에서도 동일한 성장률을 적용기 때문에 현실적인 예측치와 괴리가 발생할 가능성이 크다. 
 + 
 +이러한 한계를 보완하기 위해 제안된 것이 평균성장인자법(Average Growth Factor Method)이다. 이는 기점 $i$의 성장률 $F_i$와 종점 $j$의 성장률 $F_j$를 산술 평균하여 적용하는 방식이다. 각 존의 성장인자는 해당 존의 장래 통행 발생량(또는 도착량)을 현재량으로 나누어 구한다. 
 + 
 +$$ T_{ij} = t_{ij} \times \frac{F_i + F_j}{2} $$ 
 + 
 +평균성장인자법은 각 존의 개별적인 성장 특성을 반영하려 노력하지만, 계산된 장래 통행량의 합이 [[통행 발생]] 단계에서 예측된 각 존의 총 유출량 및 유입량과 일치하지 않는 [[수렴]]성 문제를 야기한다. 즉, 행렬의 가로 합과 세로 합이 미리 정해진 목표치(Marginal Totals)에 도달할 때까지 반복적인 보정 과정이 필요하게 된다. 
 + 
 +더욱 정교한 반복 계산 기법으로는 [[프라타법]](Fratar Method)과 [[퍼니스법]](Furness Method)이 있다. 이들은 수렴반복법(Iterative Proportional Fitting, IPF)의 일종으로, 행렬의 각 행과 열에 대해 교대로 성장인자를 적용하며 오차 범위를 좁혀나가는 방식이다. 프라타법은 기점과 종점의 상대적인 매력도를 고려하여 통행량을 배하며, 퍼니스법은 주로 유럽에서 발전한 기법으로 행과 열의 합을 순차적으로 일치시키는 수학적 절차를 거친다. 이러한 기법들은 컴퓨터 연산 능력을 활용하여 오차가 허용 범위 이내로 들어올 때까지 반복 수행되며, 최종적으로는 목표로 하는 유출량과 유입량을 모두 만족하는 균형 잡힌 기종점 행렬을 도출한다. 
 + 
 +성장인자법의 주요 모형별 특성을 비교하면 다음과 같다. 
 + 
 +^ 모형 구분 ^ 주요 특징 ^ 장점 ^ 단점 ^ 
 +| 단일성장인자법 | 지역 전체에 동일한 성장률 적용 | 계산이 매우 단순함 | 지역별 차별적 성장 반영 불가 | 
 +| 평균성장인자법 | 기점과 종점 성장률의 산술 평균 사용 | 존별 성장 특성 반영 시작 | 수렴성이 낮아 반복 보정 필요 | 
 +| 디트로이트법 | 지역 전체 성장률 대비 존별 상대 성장률 고려 | 평균법보다 논리적 정밀도 향상 | 계산 과정이 상대적으로 복잡함 | 
 +| 프라타/퍼니스법 | 주변합 일치를 위한 반복 수렴 계산 | 높은 예측 정밀도와 수렴성 확보 | 기준 연도 통행량이 0인 경우 예측 불가 | 
 + 
 +성장인자법은 실무적으로 적용이 용이고 과거의 통행 행태를 충실히 반영한다는 강점이 있으나, 이론적인 측면에서 몇 가지 근본적인 취약점을 지닌다. 첫째, [[중력 모형]]과 달리 존 간의 [[통행 비용]]이나 거리의 변화를 직접적으로 반영하지 못한다. 즉, 새로운 도로가 개설되거나 철도가 확충되어 접근성이 획적으로 개선되더라도, 기준 연도의 통행량이 적었다면 미래 통행량 역시 낮게 추정되는 경향이 있다. 둘째, 기준 연도에 통행량이 존재하지 않았던 신규 개발지(Zero-cell)의 경우, 성장인자를 곱하더라도 결과값이 항상 0이 되므로 장래 수요를 예측할 수 없는 문제가 발생한다. 따라서 성장인자은 도시 구조의 급격한 변화가 예상되는 장기 계획보다는 기존 교통 체계의 골격이 유지되는 상황에서의 보완적 예측이나 단기 운영 계획 수립에 주로 권장된다.
  
 === 중력 모형 === === 중력 모형 ===
  
-뉴턴의 만유인력 법칙을 응용하여 지역 간 거리와 매력도에 비례하는 통행량을 산하는 모형을 분한다.+중력 모형(Gravity Model)은 [[통행 분포]] 단계에서 가장 널리 활용되는 공간적 상호작용 모형으로, [[아이작 뉴턴]]의 [[만유인력의 법칙]]을 사회 현상에 응용한 [[사회 물리학]](Social Physics)의 대표적인 사례이다. 이 모형은 두 지역 사이의 통행량이 각 지역의 규모나 매력도에는 비례고, 두 지역을 연결하는 거리나 비용에는 반비례한다는 가정을 바탕으로 한다. 즉, 기점의 통행 유출 잠재력과 종점의 통행 유입 매력도가 클수록 통행량은 증가하며, 공간적 거리나 통행 시간과 같은 [[통행 저항]]이 커질수록 통행량은 감소한다는 논리적 구조를 지닌다. 
 + 
 +중력 모형의 가장 기본적인 수리적 형태는 다음과 같이 정의된다. 
 + 
 +$$ T_{ij} = k \cdot \frac{O_i \cdot D_j}{f(c_{ij})} $$ 
 + 
 +위 식에서 $ T_{ij} $는 기점 $ i $에서 종점 $ j $로 이동하는 예측 통행량을 의미하며, $ O_i $는 기점 $ i $에서 발생하는 총 통행량, $ D_j $는 종점 $ j $로 유입되는 총 통행량을 나타낸다. $ k $는 전체 통행량의 총합을 일치시키기 위한 조정 계수이며, $ f(c_{ij}) $는 두 지역 간의 거리, 시간, 비용 등을 포함하는 [[일반화 비용]](Generalized Cost)에 따른 저항 함수를 의미한다. 초기 연구에서는 저항 함수로 거리의 제곱에 비례하는 형태를 주로 사용하였으나, 현대 [[교통 공학]]에서는 지수 함수나 감마 함수 등 보다 정밀한 형태의 함수를 채택하여 현실적인 통행 행태를 반영한다. 
 + 
 +실무적인 [[교통 수요 예측]] 과정에서는 [[통행 발생]] 단계에서 산출된 각 존별 총 유출과 총 유입량의 합계를 보존하기 위해 제약 조건이 부과된 형태의 중력 모형이 주로 사용된다. [[단일 제약 중력 모형]](Singly Constrained Gravity Model)은 기점의 유출량 또는 종점의 유입량 중 어느 한쪽의 합계만을 일치시키는 방식이며, [[이중 제약 중력 모형]](Doubly Constrained Gravity Model)은 양방향의 합계를 모두 만족시키도록 설계된다. 이중 제약 모형에서는 각 존의 제약 조건을 충족하기 위해 반복 계을 통한 균형 인자(Balancing Factor)를 도입며, 이는 다음과 같은 수식으로 표현된다. 
 + 
 +$$ T_{ij} = A_i B_j O_i D_j f(c_{ij}) $$ 
 + 
 +여기서 $ A_i $와 $ B_j $는 각각 기점과 종점의 제약 조건을 만족시키기 위해 계산되는 상호 의존적인 조정 계수이다. 이러한 구조를 통해 중력 모형은 [[기종점 행렬]](O-D Matrix)의 행 합계와 열 합계가 사전에 결정된 통행 발생량과 정확히 일치하도록 보장한다. 
 + 
 +중력 모형의 핵심적인 구성 요소인 저항 함수는 통행자의 거리 감쇠 효과를 결정짓는 중요한 변수이다. 주로 사용되는 함수 형태로는 거리에 따른 통행 감소가 일정한 비율로 발생하는 멱함수(Power function) 형태인 $ c_{ij}^{-n} $, 장거리 통행의 급격한 감소를 반영하는 지수 함수(Exponential function) 형태인 $ (-c_{ij}) $, 그리고 이 둘을 결합한 탄너 함수(Tanner function) 등이 있다. 모형의 정확도를 높이기 위해 과거의 통행 데이터를 바탕으로 해당 지역의 특성에 맞는 매개변수 $ $나 $ n $을 추정하는 [[모형 정산]](Calibration) 과정이 필수적으로 수반된다. 
 + 
 +중력 모형은 구조가 명확하고 논리적이며, [[교통망]]의 변화에 따른 통행 패턴의 변화를 민감하게 반영할 수 있다는 장점이 있다. 특히 새로운 도로나 철도가 건설되어 통행 비용이 감소할 경우, 해당 경로를 이용하는 통행량의 증가를 합리적으로 예측할 수 있다. 그러나 지역 간의 사회경제적 특성 차이나 토지 이용의 질적 측면을 충히 반영하지 못하며, 과거의 통행 행태가 미래에도 변하지 않는다는 가정을 전제로 다는 한계가 존재한다. 그럼에도 불구하고 중력 모형은 그 이론적 견고함과 실무적 편의성 덕분에 전 세계 [[도시 계획]] 및 교통 계획 수립 과정에서 표준적인 분석 도구로 활용되고 있다.
  
 ==== 수단 분담 단계 ==== ==== 수단 분담 단계 ====
줄 215: 줄 275:
 === 개별 행태 모형 === === 개별 행태 모형 ===
  
-자의 효용 극대화 원리를 바탕으로 한 로짓 모형과 프로빗 모형의 구를 설명한다.+개별 행태 모형(Disaggregate Behavioral Model)은 교통 분석 존과 같은 공간적 단위를 기준으로 데터를 집계하여 분석하던 전통적인 방식에서 벗어나, 통행을 수행하는 개별 경제 주체의 의사결정 과정을 직접적인 분석 대상으로 삼는 방법론이다. 1970년대 이후 [[계량경제학]]의 비약적인 발전과 함께 도입된 이 모형은 통행자가 직면한 여러 선택 대안 중 의 효용을 가장 크게 만드는 대안을 선택한다는 [[효용 극대화]](Utility Maximization) 원리에 기반한다. 집계 모형이 공간적 경계 설정에 따라 결과가 왜곡되는 [[가변적 지역 단위 문제]](Modifiable Areal Unit Problem, MAUP)를 가졌던 것과 달리, 개별 행태 모형은 개인의 인구 통계적 특성과 교통 수단의 서비스 특성을 정밀하게 반영할 수 있다는 장점이 있다. 
 + 
 +이 모형의 이론적 토대는 [[확률적 효용 이론]](Random Utility Theory)에 있다. 이 이론은 분석자가 통행자의 모든 선호 체계를 완벽하게 관찰할 수 없다는 현실적 한계를 인정한다. 따라서 개별 통행자 $n$이 대안 $i$를 선택함으로써 얻는 전체 효용 $U_{in}$은 분석자가 관측할 수 있는 확정적 효용 $V_{in}$과 관측 불가능한 무작위 오차항 $\epsilon_{in}$의 합으로 정의된다. 
 + 
 +$$U_{in} = V_{in} + \epsilon_{in}$$ 
 + 
 +여기서 확정적 효용 $V_{in}$은 통행 시간, 비용과 같은 수단 특성 변수와 소득, 연령 등 개인 특성 변수의 선형 결합으로 표현되는 것이 일반적이다. 통행자가 대안 $i$를 선택할 확률 $P_{in}$은 해당 대안의 효용이 다른 모든 대안 $j$의 효용보다 클 확률로 계산된다. 
 + 
 +로짓 모형(Logit Model)은 확률적 효용 이론을 실무에 적용한 가장 대표적인 형태이다. 이 모형은 오차항 $\epsilon_{in}$이 서로 독립적이며 동일한 분포를 가진다는 [[독립 동일 분포]](Independent and Identically Distributed, IID) 가정을 전제로, 오차항이 [[제1종 극치 분포]](Type I Extreme Value Distribution) 또는 구벨 분포(Gumbel Distribution)를 따른다고 상정한다. 이러한 가정하에 유도된 [[다항 로짓 모형]](Multinomial Logit Model, MNL)의 선택 확률 식은 다음과 같이 간결한 폐쇄형(Closed-form) 구조를 갖는다. 
 + 
 +$$P_{in} = \frac{e^{V_{in}}}{\sum_{j \in C_n} e^{V_{jn}}}$$ 
 + 
 +로짓 모형은 계산이 용이하고 결과 해석이 직관적이라는 장점이 있어 수단 분담 단계에서 널리 활용되어 왔다((원제무, 종로축 출근통행에 대한 “로-짓” 모형의 적용, https://doi.or.kr/10.KS/JAKO198411919400343 
 +)). 그러나 로짓 모형은 [[독립 대안 불관련]](Independence of Irrelevant Alternatives, IIA)이라는 특성을 지닌다. 이는 두 대안 사이의 선택 확률 비율이 제3의 대안 존재 여부와 무관하게 일정하다는 가정으로, 실제 교통 시장에서 유사한 특성을 가진 수단들이 존재할 경우 선택 확률을 왜곡할 위험이 있다. 
 + 
 +프로빗 모형(Probit Model)은 로짓 모형의 IIA 제약을 극복하기 위해 제안된 대안이다. 이 모형은 오차항 $\epsilon_{in}$이 [[다변량 정규 분포]](Multivariate Normal Distribution)를 따른다고 가정한다. 프로빗 모형의 핵심적인 강점은 오차항 간의 상관관계를 허용한다는 점에 있다. 즉, 지하철과 광역철도처럼 서로 유사한 특성을 공유하는 대안들 사이의 오차항 공분산을 반영함으로써 보다 현실적인 선택 행태를 모사할 수 있다. 
 + 
 +다만 프로빗 모형은 로짓 모형과 달리 선택 확률을 하기 위한 적분식이 폐쇄형으로 도출되지 않는다. 따라서 대안의 수가 많아질수록 다중 적분을 계산하는 데 막대한 연산량이 소모되며,를 해결하기 위해 [[몬테카를로 시뮬레이션]](Monte Carlo Simulation) 등 수치적 기법이 동원되어야 다. 이러한 연산의 복잡성으로 인해 과거에는 실무 적용에 한계가 있었으나, 최근 컴퓨팅 성능의 향상으로 그 활용 범위가 점차 확대되고 있다.
  
 ==== 노선 배정 단계 ==== ==== 노선 배정 단계 ====
  
-된 교통수단이 실제 도로망이나 철도의 어느 경로를 이용할지 결정하는 최종 단계를 다다.+선 배정(Route Assignment) 단계는 [[교통 수요 예측]]의 전통적 [[4단계 수요 예측 모형]] 중 마지막 절차로, 앞선 [[수단 분담]] 단계에서 결정된 교통수단별 통행량을 실제 [[교통]](Network) 상의 구체적인 경로에 할당하는 과정다. 이 단계의 핵심은 개별 통행자가 출발지에서 목적지까지 이동할 때 어떠한 경로를 선택할 것인가를 수리적으로 모형화하는 데 있다. 분석의 결과물로 각 도로 링크(Link)나 철도 구간의 구간별 교통량과 [[통행 시간]]이 산출되며, 이는 장래의 교통 혼잡도 예측 및 시설 용량의 적정성 평가를 위한 기초 자료로 활용된다. 
 + 
 +노선 배정의 이론적 토대는 [[존 글렌 워드롭]](John Glen Wardrop)이 제시한 두 가지 원리, 즉 [[워드롭의 원리]]에 기반한다. 제1원리인 [[이용자 평형]](User Equilibrium, UE)은 모든 통행자가 자신의 통행 시간을 최소화하기 위해 경로를 선택한다는 가정을 바탕으로 한다. 평형 상태에 도달하면 선택된 모든 경로의 통행 시간은 동일하며, 선택되지 않은 경로의 통행 시간은 선택된 경로의 통행 시간보다 크거나 같다. 이는 개별 이용자가 자신의 이익을 극대화하려는 행태를 반영하며, 현실의 교통 흐름을 설명하는 데 가장 널리 사용되는 기준이다. 
 + 
 +반면 제2원리인 [[시스템 최적]](System Optimum, SO)은 네트워크 전체의 총 통행 시간을 최소화하는 방향으로 통행이 배정되는 상태를 의미한다. 이는 개별 이용자의 선택보다는 사회 전체의 효율성을 중시하는 관점으로, [[교통 수요 관리]] 정책이나 자율 주행 환경에서의 최적 경로 제어 등의 정책적 목표치를 설정할 때 참조된다. 일반적으로 이용자 평형 상태에서의 총 통행 시간은 시스템 최적 상태보다 길게 나타나는데, 이러한 효율성의 차이를 [[공유의 비극]] 또는 [[브라에스의 역설]](Braess’s Paradox)과 연관 지어 설명하기도 한다. 
 + 
 +노선 배정을 수행하기 위해서는 도로의 혼잡도에 따른 통행 시간의 변화를 정의하는 [[링크 성능 함수]](Link Performance Function)가 필수적이다. 가장 대표적인 함수는 미국 [[도로국]](Bureau of Public Roads, BPR)에서 제안한 [[BPR 함수]]이다. 이 함수는 특정 링크의 교통량이 증가함에 따라 통행 시간이 지수적으로 증가하는 특성을 다음과 같이 표현한다. 
 + 
 +$$ t_a = t_0 \left[ 1 + \alpha \left( \frac{v_a}{c_a} \right)^\beta \right] $$ 
 + 
 +여기서 $ t_a $는 링크 $ a $의 통행 시간, $ t_0 $는 자유 흐름 상태에서의 통행 시간, $ v_a $는 해당 링크의 교통량, $ c_a $는 링크의 용량을 의미하며, $ $와 $ $는 도로의 특성에 따라 정되는 파라미터이다. 
 + 
 +실제 계산 과정에서는 다양한 수치 해석적 기법이 동원된다. 초기에는 교통 혼잡을 고려하지 않고 모든 통행량을 최단 경로에만 배정하는 [[전부 배정법]](All-or-Nothing Assignment)이 사용되었으나, 이는 현실적인 혼잡 현상을 반영하지 못한다는 한계가 있었다. 이를 보완하기 위해 교통량 증가에 따라 통행 시간을 갱신하며 반복적으로 배정하는 [[용량 제약 배정법]](Capacity Restraint Assignment)이나, 이용자의 경로 선택 오류나 정보의 불확실성을 반영한 [[확률적 노선 배정]](Stochastic Assignment) 기법이 발전하였다. 현대의 정밀한 분석에서는 이용자 평형 조건을 만족시키기 위해 [[프랭크-울프 알고리즘]](Frank-Wolfe Algorithm)과 같은 적화 기법을 사용하여 수렴 해를 도출한다. 
 + 
 +노선 배정 단계의 정확도는 [[기점 표]](Origin-Destination Matrix)의 신뢰도뿐만 아니라 교통망의 정밀한 묘사 수준에 의해서도 결정된다. 최근에는 순히 도로망뿐만 아니라 대중교통의 환승 체와 시간표를 반영한 [[수단 노선 배정]] 모형이 도입되고 있으며, 지능형 교통 체계(ITS)의 발달에 따라 실시간 교통 정보를 반영한 동적 노선 배정(Dynamic Traffic Assignment, DTA) 연구도 활발히 진행되고 있다. 이는 미래 교통 환경의 변화에 대응하여 보다 유연하고 정밀한 수요 예측을 가능하게 하는 핵심적인 동력이 된다.
  
 === 이용자 평형 배정법 === === 이용자 평형 배정법 ===
  
-모든 이용자가 자의 통행 시간을 최소화하려 한다는 제하에 도하는 평형 상태를 계한다.+이용자 평형 배정법은 [[워드롭]](John Glen Wardrop)이 1952년에 발표한 논문에서 정의한 ’제1원리’에 그 학술적 기초를 둔다. 이 원리는 개별 통행자가 자신의 [[통행 시간]]이나 비용을 최소화하기 위해 경로를 선택한다는 [[합리적 선택 이론]]을 교통망 분석에 적용한 것이다. 워드롭은 평형 상태를 어느 통행자도 자신의 경로를 단독으로 변경함으로써 통행 시간을 단축할 수 없는 상태로 정의하였다. 이러한 상태에 도달하면 특정 기종점 간에 이용되는 모든 경로의 통행 시간은 동일하게 유지되며, 이용되지 않는 경로의 통행 시간은 이용 중인 경로의 통행 시간보다 크거나 같게 된다. 이는 개별 이용자의 이기적 행태가 집합적으로 고착화된 상태를 의미하며, [[게임 이론]]의 [[내쉬 평형]](Nash Equilibrium) 개념과 논리적으로 궤를 같이한다.((Wardrop, J. G., Some theoretical aspects of road traffic research, https://www.icevirtuallibrary.com/doi/abs/10.1680/ipeds.1952.18159 
 +)) 
 + 
 +수학적으로 이용자 평형 상태를 도출하기 위한 정식화는 [[벡만]](Martin Beckmann) 등에 해 체계화되었다. 벡만은 이를 [[볼록 최적화]](Convex Optimization) 문제로 변환하여 해의 존재성과 유일성을 증명하였다. 이용자 평형 배정의 목적 함수는 각 링크의 [[통행 시간 함수]]를 교통량에 대해 적분한 값들의 총합을 최소화하는 형태로 정의된다. 이는 물리적인 에너지 최소화 원리와 유사한 구조를 가지며, 음과 같은 수리 계획 모형으로 표현된다. 
 + 
 +$$ \min Z = \sum_{a \in A} \int_{0}^{x_a} t_a(\omega) d\omega $$ 
 + 
 +위 식에서 $ x_a $는 링크 $ a $의 교통량이며, $ t_a(x_a) $는 해당 링크의 교통량에 따른 통행 시간을 나타내는 [[링크 성능 함수]]이다. 이 최적화 문는 모든 기종점 쌍 사이의 수요가 각 경로 교통량의 합과 같아야 한다는 [[수요 보존 법칙]]과, 경로 및 링크 교통량이 음수가 될 수 없다는 비음 조건을 제약식으로 가진다. 이 모형의 해는 기종점 간의 모든 이용 경로에서 [[한계 비용]]이 아닌 평균 비용, 즉 개별 통행자가 체감는 통행 시간이 일치하는 지점서 결정된다.((Beckmann, M., McGuire, C. B., & Winsten, C. B., Studies in the Economics of Transportation, https://cowles.yale.edu/sites/default/files/files/pub/mon/m13-all.pdf 
 +)) 
 + 
 +이용자 평형 배정법을 실제 대규모 [[교통망]]에 적용하기 위해서는 효율적인 수치 해석 알고리즘이 필수적이다. 가장 대표적인 기법으로는 [[프랭크-울프 알고리즘]](Frank-Wolfe Algorithm)이 사용된다. 이 알고리즘은 현재의 교통량 상태에서 가장 짧은 경로를 찾아 모든 교통량을 배정하는 [[전량 배정법]](All-or-Nothing Assignment)을 반복 수행하며, 이전 단계의 해와 새로운 해를 선형 결합하여 점진적으로 최적 해에 수렴해 나가는 방식을 취한다. 이 과정에서 로의 용량 제약에 따른 혼잡 효과가 반영되며, 교통량이 증가함에 따라 통행 시간이 지수적으로 증가하는 [[BPR 함수]] 등이 링크 성능 함수로 널리 활용된다. 
 + 
 +이용자 평형 배정법은 실제 교통 현상을 비교적 정확하게 묘사한다는 장점이 있으나, 모든 통행자가 교통망의 상태에 대한 [[완전 정보]]를 보유하고 있다는 가정을 전제로 한다. 현실적으로 통행자는 정보의 불확실성이나 개인적 선호에 따라 최단 경로가 아닌 노선을 선택할 가능성이 존재한다. 이러한 한를 보완하기 위해 통행자의 인지 오차를 확률 변수로 도입한 [[확률적 이용자 평형]](Stochastic User Equilibrium, SUE) 모형이 제안되기도 하였다. 또한, 이용자 평형 상태가 반드시 사회 전체의 총 통행 시간을 최소화하는 [[시스템 최적]] 상태와 일치하지 않는다는 점은 [[브래스 역설]](Braess’s Paradox)을 통해 증명되었으며, 이는 [[교통 정책]] 수립 시 개별 이용자의 선택과 사회적 효율성 사이의 간극을 관리해야 함을 시사한다.
  
 === 시스템 최적 배정법 === === 시스템 최적 배정법 ===
  
-사회 전체의 총 통행 시간을 최소화하는 점에서의 선 배정 원리와 평형 배정과의 차이점을 비교한다.+시스템 최적 배정법(System Optimal Assignment, SO)은 교통망 내의 모든 통행자가 소비하는 총 통행 시간의 합을 최소화하도록 통행량을 배분하는 기법이다. 이는 [[존 워드롭]](John Glen Wardrop)이 제시한 두 번째 원리, 즉 “평형 상태에서의 평균 통행 시간은 최소가 된다”는 원칙에 기반한다. 개별 이용자가 자신의 이익만을 극대화하려 하는 [[이용자 평형 배정법]]과 달리, 시스템 최적 배정법은 사회 전체의 효율성을 극대화하는 관점을 견지한다. 따라서 이 기법은 실제 통행 행태를 묘사하기보다는 [[교통 정책]] 수립 시 도달할 수 있는 이상적인 목표치나 [[사회적 후생]]의 최대치를 산정하는 기준으로 활용된다. 
 + 
 +시스템 최적 배정법의 수학적 정식화는 네트워크 전체의 총 통행 시간을 목적 함수로 설정하여 이를 최소화하는 [[최적화]] 문제로 정의된다. 특정 경로의 통행량을 $f_p$, 링크 $a$의 통행량을 $x_a$, 그리고 링크 $a$에서의 통행 시간 함수를 $t_a(x_a)$라고 할 때, 시스템 최적 배정의 목적 함수는 다음과 같다. 
 + 
 +$$ \min Z = \sum_{a} x_a \cdot t_a(x_a) $$ 
 + 
 +이 식에서 $x_a \cdot t_a(x_a)$는 해당 링크를 통과하는 모든 차량의 통행 시간 합계를 의미한다. 이를 제약 조건인 기종점 간 수요 보존 법칙과 비음 조건 하에서 풀이하면 시스템 최적 상태를 얻을 수 있다. 이때 최적해의 조건은 택된 모든 경로의 [[한계 비용]](Marginal Cost)이 동일하며, 선택되지 않은 경로의 한계 비용보다 작거나 같아야 한다는 것이다. 여기서 한계 비용이란 추가적인 차량 한 대가 도로에 진입했을 때 본인이 소비하는 시간뿐만 아니라, 그로 인해 기존 도로 이용자들에게 유발되는 지체 시간의 증가분까지 포함하는 개념이다. 
 + 
 +이와 대비되는 [[이용자 평형 배정법]]은 개별 운전자가 자신의 통행 시간, 즉 [[평균 비용]](Average Cost)만을 고려하여 경로를 선택하는 [[게임 이론]]적 관점을 취한다. 이용자 평형 상태에서는 어떤 통행자도 경로를 변경함으로써 자신의 통행 시간을 단축할 수 없으나, 이 상태에서의 총 통행 시간은 시스템 최적 상태보다 항상 크거나 같다. 이러한 두 배정 과의 차이를 [[교통 공학]]에서는 [[무정부 상태의 대가]](Price of Anarchy)라고 부르며, 이는 개별적 최적화가 전체적 최적화와 일치하지 않는 [[외부 효과]]의 발생을 정량적으로 보여준다. 
 + 
 +시스템 최적 배정법의 함의는 [[브래스의 역설]](Braess’s Paradox)을 통해서도 명확히 드러난다. 이용자 평형 상태에서는 도로 공급이 늘어났음에도 불구하고 개별 이용자의 이기적 경로 선택으로 인해 전체 혼잡이 가중되는 현상이 발생할 수 있으나, 시스템 최적 관에서는 이러한 비효율이 원천적으로 차단된다. 실무적으로는 시스템 최적 상태를 구현하기 위해 [[혼잡 통행료]](Congestion Pricing) 정책이 제안된다. 개별 이용자가 타인에게 미치는 한계 지체 비용만큼을 통행료로 지불하게 함으로써, 이용자의 경로 선택 기준을 평균 용에서 한계 비용으로 전환하고 결과적으로 이용자 평형 상태를 시스템 최적 상태로 유도하는 것이다. 
 + 
 +결론적으로 시스템 최적 배정법은 통망 운영의 효율성 계를 규정하는 이론적 틀을 제공한다. 비록 개별 이용자의 자유로운 경로 선택권을 전제로 하는 현실의 교통 체계에서 이를 직접 구현하기는 어려우나, [[자율주행 자동차]]의 도입이나 [[중앙 집중식 교통 제어]] 시스템이 발전함에 따라 시스템 최적 배정의 원리는 미래 교통 시스템의 운영 알고리즘으로서 그 중요성이 더욱 증대되고 있다. 이는 한정된 도로 자원을 사회적으로 가장 가치 있게 배분하기 위한 [[수리 모델]]로서의 위상을 지닌다.
  
 ===== 데이터 수집 및 분석 체계 ===== ===== 데이터 수집 및 분석 체계 =====
줄 272: 줄 387:
 ==== 지능형 교통 체계 데이터 ==== ==== 지능형 교통 체계 데이터 ====
  
-검지기, 하이패스교통카드 등 정보통신 기술을 통해 실시간으로 수집되는 빅데이터의 활용 방안을 다다.+[[지능형 교통 체계]](Intelligent Transport Systems, ITS)의 비약적인 발전은 [[교통 수요 예측]]의 방법론적 패러다임을 [[전수 조사]] 중심에서 실시간 [[빅데이터]] 분석 중심으로 전환하는 결정적 계기가 되었다. 전통적인 [[가구 통행 실태 조사]]는 설문 응답자의 기억에 의존하므로 주관적 오류가 개입될 여지가 크고, 조사 주기와 비용 문제로 인해 급격한 도시 변화를 적시에 반영하기 어렵다는 한계가 있었다. 반면 ITS를 통해 수집되는 데이터는 정보통신 기술을 활용하여 실제 통행 행태를 객관적이고 연속적인 시계열로 기록하므로, 보다 정밀하고 동적인 수요 분석을 가능케 한다. 
 + 
 +핵심적인 데이터 수집원 중 하나인 [[차량 검지 시스템]](Vehicle Detection System, VDS)은 도로에 설치된 루프 검지기나 영상 검지기를 통해 교통량지점 속도, [[점유율]](Occupancy)을 실시간으로 산출한다. 이러한 자료는 단기 교통 상태 예측과 혼잡 관리를 위한 기초 자료로 활용되며, 도로 네트워크의 공급 성능을 정량화하는 데 기여한다. 특히 지점별 교통류 특성은 [[시계열 분석]] 모형이나 [[딥러닝]] 알고리즘과 결합하여 미래의 도로 소통 상태를 예측하는 핵심 변수로 기능한다. 
 + 
 +[[단거리 전용 통신]](Dedicated Short Range Communications, DSRC) 기술을 기반으로 하는 하이패스 데이터와 [[교통 카드 시스템]](Transaction Control System, TCS) 데이터는 광역 교통망의 [[기종점 통행량]](Origin-Destination matrix, O-D)을 파악하는 데 탁월한 효용성을 지닌다. 하이패스 단말기를 장착한 차량의 진출입 시각과 지점 정보는 개별 차량의 구간 [[행 시간]]과 경로 선택 행태를 명확히 보여준다. 이는 과거의 정적 [[노선 배정 모형]]을 검증하거나, 실제 통행 패턴에 기반한 동적 기종점 행태를 분석하는 데 필수적인 자산이다. 
 + 
 +대중교통 부문에서는 [[스마트 카드]](Smart Card) 데이터가 수요 예측의 정밀도를 혁적으로 향상시켰다. 교통카드 데이터는 이용자의 승하차 지점, 환승 횟수, 환승 대기 시간 등을 전수 기록하므로, 대중교통 이용자의 복잡한 통행 사슬(Trip Chain)을 개별 단위에서 재구성할 수 있게 한다. 이를 통해 [[교통 계획]]가는 특정 노선의 수요 변화를 예측하거나 환승 센터 구축에 따른 편익을 보다 과학적으로 산출할 수 있으며, 이는 [[활동 기반 모형]](Activity-based Model)의 고도화로 이어진다. 
 + 
 +이러한 개별 데이터들은 단독으로 활용되기보다 [[데이터 융합]](Data Fusion) 기술을 통해 상호 보완적으로 결합될 때 분석적 가치가 극대화된다. 예를 들어, [[디지털 운행 기록계]](Digital Tachograph, DTG)나 GPS 궤적 데이터와 같은 프로브 차량(Probe Vehicle) 데이터와 지점 검지기 데이터를 결합하면, 네트워크 전체의 소통 상태를 전수 수준에 가깝게 추정할 수 있다. 수집된 빅데이터는 [[데이터 정제]]와 [[맵 매칭]](Map Matching) 과정을 거쳐 분석 가능한 형태로 가공며, 이는 [[인공 신경망]](Artificial Neural Network) 등 고도화된 수리 모형의 학습 데이터로 투입되어 예측의 신뢰도를 제고한다((데이터 기반의 교통수요 예측의 신뢰도 제고 연구(2차년도), https://www.koti.re.kr/user/bbs/bassRsrchReprtView.do?bbs_no=663 
 +)). 
 + 
 +결과적으로 지능형 교통 체계 데이터의 활용은 교통 수요 예측을 과거의 정적이고 집계적인 방식에서 탈피시켜, 개별 행태를 반영한 동적이고 미시적인 체계로 진화시키고 있. 이는 급변하는 도시 환경과 [[모빌리티 서비스]]의 다양화에 대응하여 보다 실효성 있는 [[교통 정책]]을 수립하는 데 중추적인 역할을 수행한다.
  
 ===== 미래 지향적 수요 예측 기법 ===== ===== 미래 지향적 수요 예측 기법 =====
줄 306: 줄 432:
 ==== 인공지능 기반 예측 ==== ==== 인공지능 기반 예측 ====
  
-기계학습과 딥러닝 알고리즘을 활용하여 비형적인 교통 패턴을 학습하고 예측하는 최신 동향을 다다.+전통적인 [[수리 모델]]과 [[계량경제학]]적 방법론은 변수 간의 선형적 관계를 가정하거나 엄격한 통계적 전제 조건을 요구하는 경우가 많아, 복잡한 도시 교통 체계에서 발생하는 비선형적 패턴과 급격한 변동성을 포착하는 데 한계를 보였다. 이러한 제약을 극복하기 위해 등장한 [[인공지능]](Artificial Intelligence, AI) 기반 예측 기법은 대규모의 [[빅데이터]]로부터 교통 흐름의 내재된 규칙성을 스스로 학습하며, 특히 [[기계학습]](Machine Learning)과 [[딥러닝]](Deep Learning) 알고리즘을 통해 예측의 정밀도를 획기적으로 향상시켰다. 인공지능 모델은 과거의 교통량, 속도, 기상 조건, 이벤트 정보 등 이질적인 데이터원(data source)을 통합하여 분석할 수 있는 유연성을 지니며, 이는 현대 교통 공학의 패러다임을 [[데이터 주도형 모델]](Data-driven model)로 전환하는 계기가 되었다. 
 + 
 +기계학습 단계에서 주로 활용되는 알고리즘으로는 [[서포트 벡터 머신]](Support Vector Machine, SVM), [[랜덤 포레스트]](Random Forest), 그리고 [[그래디언트 부스팅]](Gradient Boosting) 계열의 모델들이 있다. 이러한 기법들은 고차원의 입력 변수들 사이의 복잡한 상호작용을 효과적으로 처리며, 특히 [[회귀 분석]]에서 발생하는 [[다중공선성]] 문제를 비교적 자유롭게 다룰 수 있다는 장점이 있다. 예를 들어, 랜덤 포레스트는 다수의 [[결정 트리]]를 구축하고 그 결과를 앙상블(ensemble)함으로써 모델의 일반화 성능을 높이고 과적합(overfitting)을 방지한다. 그러나 이러한 기법들은 교통 데이터가 지닌 시계열적 연속성과 공간적 상관관계를 명시적으로 모형화하는 데에는 전히 일정한 한계를 지니고 있었다. 
 + 
 +이후 등장한 딥러닝 기술은 신경망의 층을 깊게 쌓아 데이터의 추상적인 특징을 계층적으로 추출함으로써 예측 성능을 한 단계 더 진보시켰다. 교통 수요는 시간적 흐름에 따라 변화하는 [[시계열 데이터]](Time-series data)의 특성을 가지므로, 이를 처리하기 위해 [[순환 신경망]](Recurrent Neural Network, RNN)과 그 변형인 [[장단기 메모리]](Long Short-Term Memory, LSTM)가 널리 도입되었다. LSTM은 셀 상태(cell state)와 다양한 게이트 구조를 통해 장기 의존성(long-term dependency) 문제를 해결하며, 과거의 특정 시점의 교통 정보가 현재와 미래의 수요에 미치는 영향을 효과적으로 학습한다. 신경망의 은닉 상태를 갱신하는 기본적인 수식은 다음과 같이 표현된다. 
 + 
 +$$ h_t = \sigma(W_h h_{t-1} + W_x x_t + b) $$ 
 + 
 +여기서 $ h_t $는 시점 $ t $에서의 은닉 상태, $ x_t $는 입력 벡터, $ W $는 가중치 행렬, $ b $는 편향(bias), 그리고 $ $는 [[활성화 함수]]를 의미한다. 이러한 구조를 통해 모델은 교통 수요의 일간, 주간 주기성뿐만 아니라 형적인 변동까지 학습할 수 있게 되었다. 
 + 
 +최근의 연구 동향은 교통망의 공간적 위상 구조를 반영하기 위해 [[합성곱 신경망]](Convolutional Neural Network, CNN)과 [[그래프 신경망]](Graph Neural Network, GNN)을 결합하는 방향으로 전개되고 있다. 도로는 격자 형태가 아닌 노드(node)와 링크(link)로 구성된 그래프 구조이므로, [[그래프 합성곱 네트워크]](Graph Convolutional Network, GCN)를 활용하여 인접한 도로 구간 사이의 공간적 상호의존성을 포착한다. 특히 시공간 그래프 신경망(Spatio-Temporal GNN)은 시간적 변화를 학습하는 RNN 계열의 유닛과 공간적 특징을 추출하는 GCN 유닛을 통합하여, 특정 지점의 정체가 주변 네트워크로 확산되는 양상을 정밀하게 예측한다. 이러한 모델은 [[지능형 교통 체계]](Intelligent Transportation Systems, ITS)에서 실시간 교통 관리 및 최적 경로 안내를 위한 핵심 기술로 활용되고 있다. 
 + 
 +다만 인공지능 기반 예측 모델은 높은 정확도에도 불구고 모델의 내부 의사결정 과정을 인간이 이해하기 어렵다는 ‘블랙박스(black box)’ 문제를 안고 있다. 이는 교통 정책의 근거를 마련하거나 대규모 예산이 투입되는 사업의 타당성을 설명해야 하는 실무 환경에서 제약 요인이 된다. 이에 따라 근에는 모델의 예측 결과에 대한 원인을 분석할 수 있는 [[설명 가능한 인공지능]](Explainable AI, XAI) 기법을 교통 수요 예측에 접목하려는 시도가 활발히 이루어지고 있. 또한 전통적인 [[교통 공학]]의 물리적 법칙이나 제약 조건을 신경망의 손실 함수(loss function)에 반영하는 [[물리 기반 기계학습]](Physics-informed Machine Learning) 연구도 미래 지향적인 대안으로 주목받고 있((Tedjopurnomo, D. A., et al., “A Survey on Modern Deep Learning Configurations for Time Series Forecasting”, https://ieeexplore.ieee.org/document/9044815 
 +))((Li, Y., et al., “Diffusion Convolutional Recurrent Neural Network: Data-Driven Traffic Forecasting”, https://arxiv.org/abs/1707.01926 
 +)).
  
 ===== 실무적 응용과 정책적 활용 ===== ===== 실무적 응용과 정책적 활용 =====
줄 321: 줄 461:
 ==== 타당성 조사와 경제성 분석 ==== ==== 타당성 조사와 경제성 분석 ====
  
-대규모 교통 시설 확충 사업의 비용 대비 편익을 산하여 사업 추진 여부를 결정하는 과정을 설한다.+타당성 조사는 대규모 공공 자금이 투입되는 교통 시설 확충 사업의 경제적, 정책적 타당성을 사전에 검토하여 투자 우선순위를 결정하고 예산 집행의 효율성을 제고하는 절차이다. 이는 [[교통 수요 예측]]의 결과를 바탕으로 사업 시행 시 예상되는 사회적 이득과 소요 비용을 정량적으로 비교하는 과정을 포함한다. 특히 한민국에서는 [[예타당성조사]] 제도를 통해 총사업비가 일정 규모 이상인 대형 국책 사업에 대해 엄격한 심사를 진행하며, 이를 통해 선심성 사업으로 인한 재정 낭비를 방지하고 [[사회적 후생]]을 극대화하는 의사결정을 내린다. 
 + 
 +경제성 분석의 핵심적 방법론은 [[비용-편익 분석]](Cost-Benefit Analysis, CBA)이다. 이는 사업의 수명 주기 동안 발생하는 모든 비용과 편익을 화폐 단위로 환산하여 비교하는 기법이다. 교통 사업의 특성상 비용은 건설 단계에 집중되는 반면, 편익은 운영 단계에서 장기간에 걸쳐 발생하므로 시간 가치를 반영하는 과정이 필수적이다. 이를 위해 미래의 가치를 현재 시점으로 환산하는 [[사회적 할인율]](Social Discount Rate)을 적용한다. 경제성 평가의 주요 지표로는 [[순현재가치]](Net Present Value, NPV), [[편익-비용 비율]](Benefit-Cost Ratio, B/C Ratio), [[내부수익률]](Internal Rate of Return, IRR)이 활용된다. 
 + 
 +순현재가치는 분석 기간 내 발생하는 편익의 총합에서 비용의 총합을 뺀 값으로, 다음과 같이 정의된다. 
 + 
 +$$ NPV = \sum_{t=0}^{n} \frac{B_t}{(1+r)^t} - \sum_{t=0}^{n} \frac{C_t}{(1+r)^t} $$ 
 + 
 +여기서 $ B_t $는 $ t $년도의 편익, $ C_t $는 $ t $년도의 비용, $ r $은 사회적 할인율, $ n $은 분석 대상 기간(통상 30~40년)이다. $ NPV $가 0보다 크면 경제적 타당성이 있는 것으로 간주한다. 편익-비용 비율은 총편익의 현재가치를 총비용의 현재가치로 나눈 비율로, $ B/C  $일 때 사업의 경제성을 인정한다. 내부수익률은 $ NPV $를 0으로 만드는 할인율을 의미하며, 이 값이 사회적 할인율보다 클 경우 사업 추진의 경제적 근거가 확보된다. 
 + 
 +교통 사업에서 산출되는 편익은 직접 편익과 간접 편익으로 구분된다. 직접 편익은 주로 도로 및 철도 이용자가 누리는 혜택으로 구성되며, 교통 수요 예측 모델을 통해 도출된 통행량, 통행 시간, 통행 거리의 변화량을 화폐 가치로 환산하여 계산한다. 대표적인 편익 항목과 그 세부 내용은 아래의 표와 같다. 
 + 
 +^ 편익 항목 ^ 주요 내용 ^ 
 +| 통행 시간 절감 편익 | 도로 혼잡 완화 및 운행 속도 증가에 따른 [[통행 시간 가치]]의 보존 | 
 +| 차량 운행 비용 절감 편익 | 주행 거리 단축 및 속도 최적화에 따른 연료비, 소모품비, 감가상각비 감소 | 
 +| 교통사고 감소 편익 | 도로 선형 개량 및 안전 시설 확충으로 인한 사고 발생 건수 및 피해액 감소 | 
 +| 환경 비용 절감 편익 | 대기 오염 물질 배출 감소 및 [[이산화탄소]] 배출 저감에 따른 사회적 비용 감소 | 
 + 
 +상기 항목 중 통행 시간 절감 편익은 대다수 교통 사업에서 가장 큰 비중을 차지한다. 이를 산정하기 위해서는 업무 통행과 비업무 통행으로 구분된 시간 가치 원단위가 적용되며, 이는 [[한계 저축률]]이나 평균 임금 수준 등을 고려하여 결정된다. 차량 운행 비용의 경우 유류비뿐만 아니라 차량의 내구 연한 연장에 따른 [[기회비용]]까지 포함여 정밀하게 산출한다. 
 + 
 +비용 산정 단계에서는 공사비, 보상비, 설계비, 감리비 등을 포함하는 총사업비뿐만 아니라, 완공 후 운영 기간 동안 발생하는 유지관리비와 재투자비를 모두 고려해야 한다. 특히 보상비 산정 시 [[토지 수용]]에 따른 지가 상승분이나 민원 처리 비용 등 불확실성 요소를 적절히 반영하는 것이 중요하다. 
 + 
 +경제성 분석 결가 사업의 효율성을 나타낸다면, 최종적인 사업 추진 여부는 책적 분석과 지역 균형 발전 분석을 포함한 종합 평가를 통해 결정된다. 이를 위해 [[계층화 분석 과정]](Analytic Hierarchy Process, AHP)이 널리 사용된다. AHP는 경제성, 정책적 일관성, 사업 추진 의지, 지역 낙후도 등 계량화하기 어려운 다각적 요소를 전문가 문을 통해 가중치를 부여하고 수치화하는 기법이다. 일반적으로 종합 평점(AHP Score)이 0.5 이상일 때 사업의 타당성이 최종적으로 확보된 것으로 판단한다. 이러한 체계적 분석 과정은 교통 수요 예측이 단순한 수치 추정을 넘어 국가 자원의 최적 배분을 위한 [[의사결정 지원 시스템]]으로서 기능하게 한다. ((한국개발연구원, 도로·철도 부문 사업의 예비타당성조사 표준지침 수정·보완 연구(제6판), https://www.kdi.re.kr/research/commonView?pub_no=17273 
 +))
  
 ==== 교통 수요 관리 정책 ==== ==== 교통 수요 관리 정책 ====
  
-혼잡통행료 부과, 차량 요일제 등 수요를 인위적으로 조절하기 위한 정책의 효과를 예측하는 방법을 다다.+교통 수요 관리(Transportation Demand Management, TDM) 정책은 도로 공급의 물리적 한계를 극복하고 기존 교통 시설의 효율성을 극대화하기 위해 통행자의 행태 변화를 유도하는 일련의 전략을 의미한다. 전통적인 [[교통 계획]]이 ’예측 후 공급(Predict and Provide)’의 원칙에 따라 도로 확충에 집중했다면, 교통 수요 관리는 통행의 발생 자체를 억제하거나 통행 시간, 경로, 수단을 분산시키는 데 목적을 둔다. 이러한 정책의 효과를 정밀하게 예측하는 것은 [[교통 정책]]의 타당성을 검증하고 사회적 편익을 산출하는 데 있어 필수적인 과정이다. 
 + 
 +교통 수요 관리 정책의 효과 예측에서 가장 핵심적인 분석 틀은 [[개별 행태 모형]]에 기반한 [[효용 함수]](Utility Function)의 변화를 추적하는 것이다. 예를 들어, [[혼잡통행료]](Congestion Pricing) 부과 정책의 경우개별 통행자가 체감하는 일반화 비용(Generalized Cost)에 직접적인 금전적 비용을 추가함으로써 효용의 변화를 유발한다. 통행자 $i$가 수단 $m$을 선택할 때의 효용 $U_{im}$은 다음과 같이 정의될 수 있다. 
 + 
 +$$ U_{im} = V_{im} + \epsilon_{im} = \beta_t T_{im} + \beta_c (C_{im} + P_m) + \dots + \epsilon_{im} $$ 
 + 
 +여기서 $T_{im}$은 통행 시간, $C_{im}$은 운행 비용, $P_m$은 정책적으로 부과된 통행료나 주차 요금 등을 의미하며, $\beta$는 각 변수의 가중치를 나타내는 파라미터이다. 정책 시행으로 인해 특정 수단이나 경로의 비용 $P_m$이 상승하면 해당 대안의 효용이 감소하며, 이는 [[로짓 모형]](Logit Model)을 통해 다른 수단으로의 전환 확률이나 통행 포기 확률로 전이된다. 
 + 
 +[[차량 요일제]](Weekly No-drive Day Program)와 같은 규제 중심의 정책 효과를 예측할 때는 통행 발생(Trip Generation) 단계와 단 분담(Mode Choice) 단계의 연계 분석이 구된다. 특정 요일에 차량 운행이 제한될 경우, 해당 가구의 통행은 타 수단으로 전환되거나 통행 목적의 시급성에 따라 다른 날짜로 전이(Temporal Shift)된다. 이를 정교하게 예측하기 위해서는 단순히 과거의 통행 패턴을 관찰하는 것을 넘어, 정책 변화에 따른 통행자의 반응을 설문하는 [[진술 선호 조사]](Stated Preference Survey, SP 조사) 데이터를 활용하여 모형을 보정해야 다. 
 + 
 +정책 수단별 수요 변화의 민감도는 [[탄력성]](Elasticity) 개념을 통해 정량화된다. 교통 수요의 가격 탄력성은 통행 요금의 변화율 대비 통행량의 변화율로 정의되며, 이는 [[도시 구조]]나 대체 교통수단의 발달 정도에 따라 상이하게 나타난다. 예를 들어, 지하철망이 잘 갖춰진 대도시에서는 혼잡통행료 부과 시 도로 수요의 가격 탄력성이 높게 나타나 정책 효과가 극대화되지만, 대체 수단이 부족한 지역에서는 수요의 가격 탄력성이 낮아 통행량 감소보다는 통행자의 경제적 부담 증가로 이어질 가능성이 크다. 
 + 
 +최근에는 정책의 효과를 더욱 미시적으로 예측하기 위해 [[활동 기반 모형]](Activity-based Model)과 [[미시 시뮬레이션]](Micro-simulation) 기이 결합되고 있다. 이는 개별 가구의 하루 일과를 시뮬레이션하여 특정 시간대의 통행 규제가 전체 일과와 가구원 간의 통행 공유에 미치는 영향을 분석한. 이러한 고도화된 예측 기법은 [[주차 수요 관리]], [[카풀]] 장려, [[탄소 적립제]] 등 비금전적이고 복합적인 TDM 정책이 실제 교통량 감축에 기여하는 정도를 보다 객관적으로 평가할 수 있는 근거를 제공한다.
  
 ==== 예측의 오차와 불확실성 관리 ==== ==== 예측의 오차와 불확실성 관리 ====
  
-예측치와 실제치의 괴리가 발생하는 원인을 분석하고, 시나오 분석 을 통한 대응 방안을 제시한다.+교통 수요 예측은 미래의 불확한 상황을 전로 수행되기에 실제 관측치와 예측치 사이의 괴리가 필연적으로 발생한다. 이러한 오차는 단순한 기술적 한계를 넘어 [[사회간접자본]] 투자 결정의 왜곡과 [[예산]] 낭비라는 심각한 부작용을 초래할 수 있다. 따라서 예측 과정에서 발생하는 오차의 원인을 체계적으로 분석하고, 이를 관리하기 위한 전략을 수립하는 것은 [[교통 계획]]의 신뢰성을 확보하는 핵심적인 과정이다. 
 + 
 +예측 오차의 원인은 크게 세 가지 측면으로 분류할 수 있다. 첫째는 입력 데이터의 불확실성이다. 예측 모형의 기초가 되는 [[사회경제지표]], 즉 미래의 인구 규모, [[국내총생산]](GDP), 자동차 보유 대수 및 [[토지 이용]] 계획 등이 실제와 다르게 전개될 경우 예측 결과는 근본적인 한계에 봉착한다. 둘째는 모형 자체의 구조적 결함과 매개변수 설정의 오류이다. 현실의 복잡한 통행 행태를 수식화하는 과정에서 발생하는 [[모형의 명세 오류]](Model Misspecification)나, 과거 데이터를 기반으로 추정된 매개변수가 미래에도 불변할 것이라는 가정은 오차를 유발하는 주요 요인이 된다. 셋째는 전략적 요인으로, 특정 사업의 추진 가능성을 높이기 위해 수요를 낙관적으로 추정하는 [[낙관적 편향]](Optimism Bias)이나 [[전략적 왜곡]](Strategic Misrepresentation)이 개입되는 경우이다. 특히 대규모 국책 사업의 [[타당성 조사]] 과정에서 이러한 인위적 편향이 빈번하게 보고된다. 
 + 
 +오차의 크기를 정량적으로 평가하기 위해 실무에서는 다양한 통계적 지표를 활용한다. 대표적으로 평균 절대 백분율 오차(Mean Absolute Percentage Error, MAPE)와 평균 제곱근 오차(Root Mean Square Error, RMSE)가 있다. 특정 노선 $i$에 대한 실제 통행량을 $A_i$, 예측 통행량을 $F_i$라 할 때, MAPE는 다음과 같이 정의된다. 
 + 
 +$$ MAPE = \frac{1}{n} \sum_{i=1}^{n} \left| \frac{A_i - F_i}{A_i} \right| \times 100 $$ 
 + 
 +이러한 지표는 과거 사업들의 예측 성과를 검토하고 현재 모형의 신뢰도를 진단하는 기초 자료가 된다. 특히 철도와 같은 대규모 설 사업에서는 개통 초기 수요가 예측치의 절반에도 미치지 못하는 사례가 빈번하며, 이는 노선망 개통 시점의 지연이나 주변 개발 계획의 미이행 등 외부 환경 변화에 민감하게 반응하기 때문이다((철도 통행량 추정의 차 분석을 통한 예측 정확도 향상 방안, https://www.kci.go.kr/kciportal/landing/article.kci?arti_id=ART001415144 
 +)). 
 + 
 +불확실성을 체계적으로 관리하기 위한 대응 방안으로는 [[민감도 분석]](Sensitivity Analysis)과 [[시나리오 분석]](Scenario Analysis)이 널리 활용된다. 민감도 분석은 입력 변수 중 특정 요인(예: 유가, 통행료, 경제성장률)이 일정 비율 변화할 때 최종 수요가 얼마나 변동하는지를 파악하여 핵심 위험 요인을 식별하는 기법이다. 시나리오 분석은 미래에 발생 가능한 여러 상황을 ‘낙관적’, ‘중립적’, ‘비관적’ 시나리오로 설정하고 각각의 수요 범위를 제시함으로써 [[의사결정]]자에게 단일 수치가 아닌 합리적인 예측 범위를 제공다. 
 + 
 +최근에는 고정된 수치 예측에서 벗어나 확률적 분포를 활용하는 기법도 도입되고 있다. [[몬테카를로 시뮬레이션]](Monte Carlo Simulation)을 통해 입력 변수의 확률 분포를 정의하고 수만 번의 반복 계산을 수행함으로써, 특정 수요 수준이 발생할 확률을 도출하는 방식이다. 또한, 사업 시행 이후 실제 수요를 지속적으로 모니터링하고 이를 차기 예측에 환류하는 사후 평가(Ex-post evaluation) 체계의 강화는 예측 모형의 자기 학습 기능을 높이는 데 기여한다. 이러한 다각적인 불확실성 관리 방안은 [[교통 정책]] 수립 시 리스크를 최소화하고 공공 투자의 효율성을 극대화하는 실무적 기반이 된다.
  
교통_수요_예측.1776060599.txt.gz · 마지막으로 수정됨: 저자 flyingtext