사용자 도구

사이트 도구


교통_수요_예측

차이

문서의 선택한 두 판 사이의 차이를 보여줍니다.

차이 보기로 링크

양쪽 이전 판이전 판
다음 판
이전 판
교통_수요_예측 [2026/04/13 15:11] – 교통 수요 예측 sync flyingtext교통_수요_예측 [2026/04/13 15:12] (현재) – 교통 수요 예측 sync flyingtext
줄 162: 줄 162:
 === 원단위법과 회귀분석법 === === 원단위법과 회귀분석법 ===
  
-단위당 통행 발생량을 기으로 하는 법과 변수 간의 상관관계를 이용한 분석 기법을 비교한다.+원단위법(Trip Rate Method)은 특정 단위당 발생하는 통행량을 기초로 장래의 통행 발생량을 추정하는 가장 직관적이고 고전적인 법이다. 이 방법은 [[교통 분석 존]](Traffic Analysis Zone, TAZ) 내의 인구, 가구 수, 종사자 수, 또는 건축물 연면적과 같은 특정 지표를 단위(Unit)로 설정하고, 해당 단위 하나가 하루 동안 생성하거나 유입시키는 평균 통행량을 조사하여 예측에 활용한다. 원단위법의 기본 가정은 현재 관측된 단위당 통행 발생 특성이 미래에도 일정하게 유지되거나, 예측 가능한 추세에 따라 변화한다는 것이다. 특정 존 $i$에서 발생하는 총 통행량 $T_i$를 산출하는 수식은 다음과 같이 정의할 수 있다. 
 + 
 +$$ T_i = \sum_{k} (R_k \times X_{ik}) $$ 
 + 
 +위 식에서 $R_k$는 활동 유형 또는 토지 이용 형태 $k$에 따른 단위당 통행 발생률(Trip Rate)을 의미하며, $X_{ik}$는 해당 존의 사회경제적 지표인 독립변수의 양을 나타낸다. 원단위법은 계산 과정이 단순하고 실무적으로 적용기 용이하다는 장점이 있으나, 통행 발생에 영향을 미치는 다양한 변수 간의 복잡한 상호작용을 반영하지 못한다는 한계가 있다. 또한, 동일한 범주 내의 개체들이 모두 동일한 통행 특성을 가진다고 가정하므로, 존 내부의 이질성을 무시할 위험이 크다. 
 + 
 +회귀분석(Regression Analysis Method)은 통행 발생량과 이에 영향을 미치는 여러 사회경제적 변수 간의 인과관계를 통계적 함수로 정립하는 기법이다. 원단위법이 단순한 비율에 의존한다면, 회귀분석법은 [[계량경제학]]적 접근을 통해 변수 간의 상관관계를 수치화한다. 일반적으로 [[선형 회귀 분석]](Linear Regression Analysis)이 가장 널리 사되며, 통행 발생량인 [[종속변수]] $Y$와 인구, 자동차 보유 대수, 가구 소득 등의 [[독립변수]] $X_j$ 간의 관계를 다음과 같은 수식으로 표현다. 
 + 
 +$$ Y = \beta_0 + \beta_1 X_1 + \beta_2 X_2 + \dots + \beta_n X_n + \epsilon $$ 
 + 
 +여기서 $\beta_0$는 상수항, $\beta_j$는 각 독립변수의 영향력을 나타내는 회귀계수이며, $\epsilon$은 모형이 설명하지 못하는 오차항을 의미한다. 회귀분석법은 [[최소제곱법]](Ordinary Least Squares, OLS)을 통해 잔차의 제곱합을 최소화하는 방향으로 계수를 추정한다. 이 방법론의 핵심적인 강점은 모형의 통계적 신뢰성을 정량적으로 검증할 수 있다는 점에 있다. 분석가는 [[결정계수]](Coefficient of Determination, $R^2$)를 통해 모형의 설명력을 파악하고, $t$-검정이나 $F$-검정을 통해 개별 변수와 모형 전체의 [[통계적 유의성]]을 판정한다. 
 + 
 +두 기법을 비교했을 때, 원단위법은 데이터 수집이 제한적이거나 신속한 판단이 필요한 예비 타당성 조사 단계에서 유용하게 활용된다. 반면, 회귀분석법은 도시의 성장에 따른 복합적인 통행 행태 변화를 설명하는 데 적합하다. 특히 회귀분석법은 변수 간의 [[다중공선성]](Multicollinearity) 문제를 사전에 검토함으로써 독립변수 간의 중복 설명을 배제하고 모형의 정밀도를 높일 수 있다. 그러나 회귀분석법은 독립변수의 장래치를 예측하는 과정에서 또 다른 오차가 개입될 수 있으며, 과거의 상관관계가 미래에도 지속될 것이라는 가정이 무너질 경우 예측력이 급격히 저하될 우려가 있다. 따라서 현대의 교통 계획에서는 분석 대상 지역의 규모와 데이터의 가용성을 고려하여 두 기법을 상호 보완적으로 사용하거나, 집계형 모형의 한계를 극복하기 위해 가구 단위의 미시적 분석을 병행하기도 한다.
  
 === 카테고리 분석법 === === 카테고리 분석법 ===
  
-가구의 소득이나 차량 보유 대수 등 특정 집단별 특성에 라 통행 발생량을 분화하여 예측하는 방식을 다.+카테고리 분석법(Category Analysis) 또는 교차 분류 분석법(Cross-Classification Analysis)은 가구의 사회경제적 특성에 따라 통행 발생 행태가 유사한 집단을 구분하고, 각 집단별 평균 통행 발생량을 산출하여 미래의 수요를 예측하는 기법다. 이는 [[통행 발생]] 단계에서 [[회귀 분석]]과 함께 가장 널리 사용되는 방법론 중 하로, 개별 가구의 특성을 직접적으로 모형에 반영할 수 있다는 점에서 [[행태 모형]]으로의 이행 단계에 위치한 기법이라 평가받는다. 이 방법은 분석 대상 지역의 전체 가구를 소득 수준, [[자동차 보유 대수]], 가구원 수, 주거 형태 등 통행에 직접적인 영향을 미치는 주요 변수들의 조합으로 이루어진 다차원 행렬(Matrix) 내의 특정 ’카테고리’로 분류하는 것에서 시작한다. 
 + 
 +이 기법의 핵심적인 전제는 동일한 카테고리에 속하는 가구들은 지리적 위치나 공간적 특성에 관계없이 유사한 통행 발생 특성을 공유한다는 것이다. 예를 들어, 소득이 높고 차량을 2대 이상 보유한 4인 가구는 특정 [[교통 분석 존]](Traffic Analysis Zone, TAZ)에 거주하더도 다른 존에 거주하는 동일 조건의 가구와 유사한 빈도의 통행을 생성한다고 가정한다. 분석 과정에서는 기준 연도의 설문 조사 데이터를 바탕으로 각 카테고리별 가구당 평균 통행 발생량인 [[원단위]]를 산출한다. 이후 장래의 인구 통계적 변화를 예측하여 각 카테고리에 속하게 될 가구의 수를 추정한 뒤, 이를 기 산출된 원단위와 곱하여 최종적인 총 통행 발생량을 도출한다. 
 + 
 +카테고리 석법은 [[회귀 분석]]이 지니는 몇 가지 구조적 한계를 효과적으로 극복한다. 첫째, 변수 간의 관계가 반드시 선형적(Linear)일 필요가 없으므로 사회경제적 변수와 통행량 사이의 복잡한 [[비선형성]]을 유연하게 수용할 수 있다. 둘째, 존 단위의 집계 데이터를 사용하는 것이 아니라 가구 단위의 개별 데이터를 기초로 하므로, 집계 과정에서 발생하는 정보의 손실과 [[생태학적 오류]](Ecological Fallacy)를 최소할 수 있다. 셋째, 모형의 구조가 직관적이고 연산 과정이 단순하여 정책 결정자나 실무자가 결과를 해석하고 활용하기에 용이하다는 실무적 장점을 지닌다. 
 + 
 +그러나 카테고리 분석법의 정밀도는 분류 기준이 되는 카테고리의 설정과 데이터의 충분성에 크게 의존한다. 분류 기준이 되는 변수가 늘어날수록 행렬의 셀(Cell) 수가 기하급수적으로 증가하게 되는데, 이는 각 셀마다 통계적 유의성을 확보하기 위한 충분한 [[표본 크기]]를 요구한다. 만약 특정 카테고리에 할당된 표본이 부족할 경우 해당 셀의 원단위는 신뢰하기 어려워지며, 이는 전체 예측 결과의 왜곡으로 이어진다. 또한, [[회귀 분석]]과 달리 모형 전체의 적합도를 검증할 수 있는 [[결정계수]]와 같은 표준화된 통계 지표가 미비는 점도 한계로 지적된
 + 
 +더욱이 장래 예측 시점에서 각 카테고리별 가구 분포를 정밀하게 추정하는 작업은 그 자체로 매우 까다로운 과제이다. 미래의 [[가구 소득]] 분포나 가구 구조의 변화를 예측하는 과정에서 수반되는 불확실성은 카테고리 분석법의 최종 결과에 그대로 전이된다. 따라서 이 기법을 효과적으로 운용하기 위해서는 인구 구조 변화와 [[경제 성장]] 추세에 대한 심도 있는 분석이 선행되어야 하며, 최근에는 이러한 한계를 보완하기 위해 [[이산 선택 모형]]이나 [[시뮬레이션]] 기법을 결합한 하이브리드 형태의 분석 방법론이 연구되고 있다.
  
 ==== 통행 분포 단계 ==== ==== 통행 분포 단계 ====
줄 187: 줄 207:
 === 성장인자법 === === 성장인자법 ===
  
-현재의 통행 패턴이 미래에도 지된다는 가정하에 성장률을 적용하여 분를 정하는 기법이다.+성장인자법(Growth Factor Method)은 [[통행 분포]](Trip Distribution) 단계에서 가장 고전적이면서도 직관적인 접근 방식으로, 기준 연도의 [[기종점 행렬]](Origin-Destination Matrix, O-D 행렬)이 미래에도 그 구조적 패턴을 유지한다는 전제하에 각 존의 성장률을 적용하여 장래 통행량을 추정하는 기법이다. 이 방법론은 장래의 [[토지 이용]] 계획이나 교통망의 변화가 크지 않은 단기 예측 상황에서 유용하게 활용되며, 특히 기준 연도의 조사 자료가 충분히 신뢰할 만한 경우 강력한 예측력을 발휘한다. 성장인자법의 핵심은 현재의 통행 패턴이 미래의 통행 분포를 결정하는 가장 중요한 지표라는 [[안정성 가정]]에 기반한다는 점이다. 
 + 
 +가장 단순한 형태인 단일성장인자법(Uniform Growth Factor Method)은 대상 지역 전체의 평균적인 성장률을 모든 기종점 쌍에 동일하게 적용한다. 기준 연의 기점 $i$에서 종점 $j$로의 통행량을 $t_{ij}$, 역 전체의 장래 총 통행 발생량을 $T$, 현재 총 통행 발생량을 $t$라고 할 때, 장래 통행량 $T_{ij}$는 다음과 같이 산출된다
 + 
 +$$ T_{ij} = t_{ij} \times \frac{T}{t} = t_{ij} \times F $$ 
 + 
 +여기서 $F$는 지역 전체의 성장인자를 의미한다. 이 방식은 계산이 매우 간편하다는 장점이 있으나, 지역 내 각 [[교통 분석 존]](Traffic Analysis Zone, TAZ)별로 상이한 성장 추세를 반영하지 못한다는 결정적인 한계가 있다. 예를 들어 특정 지역은 급격히 개발되고 다른 지역은 정체되는 상황에서도 동일한 성장률을 적용기 때문에 현실적인 예측치와 괴리가 발생할 가능성이 크다. 
 + 
 +이러한 한계를 보완하기 위해 제안된 것이 평균성장인자법(Average Growth Factor Method)이다. 이는 기점 $i$의 성장률 $F_i$와 종점 $j$의 성장률 $F_j$를 산술 평균하여 적용하는 방식이다. 각 존의 성장인자는 해당 존의 장래 통행 발생량(또는 도착량)을 현재량으로 나누어 구한다. 
 + 
 +$$ T_{ij} = t_{ij} \times \frac{F_i + F_j}{2} $$ 
 + 
 +평균성장인자법은 각 존의 개별적인 성장 특성을 반영하려 노력하지만, 계산된 장래 통행량의 합이 [[통행 발생]] 단계에서 예측된 각 존의 총 유출량 및 유입량과 일치하지 않는 [[수렴]]성 문제를 야기한다. 즉, 행렬의 가로 합과 세로 합이 미리 정해진 목표치(Marginal Totals)에 도달할 때까지 반복적인 보정 과정이 필요하게 된다. 
 + 
 +더욱 정교한 반복 계산 기법으로는 [[프라타법]](Fratar Method)과 [[퍼니스법]](Furness Method)이 있다. 이들은 수렴반복법(Iterative Proportional Fitting, IPF)의 일종으로, 행렬의 각 행과 열에 대해 교대로 성장인자를 적용하며 오차 범위를 좁혀나가는 방식이다. 프라타법은 기점과 종점의 상대적인 매력도를 고려하여 통행량을 배하며, 퍼니스법은 주로 유럽에서 발전한 기법으로 행과 열의 합을 순차적으로 일치시키는 수학적 절차를 거친다. 이러한 기법들은 컴퓨터 연산 능력을 활용하여 오차가 허용 범위 이내로 들어올 때까지 반복 수행되며, 최종적으로는 목표로 하는 유출량과 유입량을 모두 만족하는 균형 잡힌 기종점 행렬을 도출한다. 
 + 
 +성장인자법의 주요 모형별 특성을 비교하면 다음과 같다. 
 + 
 +^ 모형 구분 ^ 주요 특징 ^ 장점 ^ 단점 ^ 
 +| 단일성장인자법 | 지역 전체에 동일한 성장률 적용 | 계산이 매우 단순함 | 지역별 차별적 성장 반영 불가 | 
 +| 평균성장인자법 | 기점과 종점 성장률의 산술 평균 사용 | 존별 성장 특성 반영 시작 | 수렴성이 낮아 반복 보정 필요 | 
 +| 디트로이트법 | 지역 전체 성장률 대비 존별 상대 성장률 고려 | 평균법보다 논리적 정밀도 향상 | 계산 과정이 상대적으로 복잡함 | 
 +| 프라타/퍼니스법 | 주변합 일치를 위한 반복 수렴 계산 | 높은 예측 정밀도와 수렴성 확보 | 기준 연도 통행량이 0인 경우 예측 불가 | 
 + 
 +성장인자법은 실무적으로 적용이 용이고 과거의 통행 행태를 충실히 반영한다는 강점이 있으나, 이론적인 측면에서 몇 가지 근본적인 취약점을 지닌다. 첫째, [[중력 모형]]과 달리 존 간의 [[통행 비용]]이나 거리의 변화를 직접적으로 반영하지 못한다. 즉, 새로운 도로가 개설되거나 철도가 확충되어 접근성이 획적으로 개선되더라도, 기준 연도의 통행량이 적었다면 미래 통행량 역시 낮게 추정되는 경향이 있다. 둘째, 기준 연도에 통행량이 존재하지 않았던 신규 개발지(Zero-cell)의 경우, 성장인자를 곱하더라도 결과값이 항상 0이 되므로 장래 수요를 예측할 수 없는 문제가 발생한다. 따라서 성장인자은 도시 구조의 급격한 변화가 예상되는 장기 계획보다는 기존 교통 체계의 골격이 유지되는 상황에서의 보완적 예측이나 단기 운영 계획 수립에 주로 권장된다.
  
 === 중력 모형 === === 중력 모형 ===
  
-뉴턴의 만유인력 법칙을 응용하여 지역 간 거리와 매력도에 비례하는 통행량을 산하는 모형을 분한다.+중력 모형(Gravity Model)은 [[통행 분포]] 단계에서 가장 널리 활용되는 공간적 상호작용 모형으로, [[아이작 뉴턴]]의 [[만유인력의 법칙]]을 사회 현상에 응용한 [[사회 물리학]](Social Physics)의 대표적인 사례이다. 이 모형은 두 지역 사이의 통행량이 각 지역의 규모나 매력도에는 비례고, 두 지역을 연결하는 거리나 비용에는 반비례한다는 가정을 바탕으로 한다. 즉, 기점의 통행 유출 잠재력과 종점의 통행 유입 매력도가 클수록 통행량은 증가하며, 공간적 거리나 통행 시간과 같은 [[통행 저항]]이 커질수록 통행량은 감소한다는 논리적 구조를 지닌다. 
 + 
 +중력 모형의 가장 기본적인 수리적 형태는 다음과 같이 정의된다. 
 + 
 +$$ T_{ij} = k \cdot \frac{O_i \cdot D_j}{f(c_{ij})} $$ 
 + 
 +위 식에서 $ T_{ij} $는 기점 $ i $에서 종점 $ j $로 이동하는 예측 통행량을 의미하며, $ O_i $는 기점 $ i $에서 발생하는 총 통행량, $ D_j $는 종점 $ j $로 유입되는 총 통행량을 나타낸다. $ k $는 전체 통행량의 총합을 일치시키기 위한 조정 계수이며, $ f(c_{ij}) $는 두 지역 간의 거리, 시간, 비용 등을 포함하는 [[일반화 비용]](Generalized Cost)에 따른 저항 함수를 의미한다. 초기 연구에서는 저항 함수로 거리의 제곱에 비례하는 형태를 주로 사용하였으나, 현대 [[교통 공학]]에서는 지수 함수나 감마 함수 등 보다 정밀한 형태의 함수를 채택하여 현실적인 통행 행태를 반영한다. 
 + 
 +실무적인 [[교통 수요 예측]] 과정에서는 [[통행 발생]] 단계에서 산출된 각 존별 총 유출과 총 유입량의 합계를 보존하기 위해 제약 조건이 부과된 형태의 중력 모형이 주로 사용된다. [[단일 제약 중력 모형]](Singly Constrained Gravity Model)은 기점의 유출량 또는 종점의 유입량 중 어느 한쪽의 합계만을 일치시키는 방식이며, [[이중 제약 중력 모형]](Doubly Constrained Gravity Model)은 양방향의 합계를 모두 만족시키도록 설계된다. 이중 제약 모형에서는 각 존의 제약 조건을 충족하기 위해 반복 계을 통한 균형 인자(Balancing Factor)를 도입며, 이는 다음과 같은 수식으로 표현된다. 
 + 
 +$$ T_{ij} = A_i B_j O_i D_j f(c_{ij}) $$ 
 + 
 +여기서 $ A_i $와 $ B_j $는 각각 기점과 종점의 제약 조건을 만족시키기 위해 계산되는 상호 의존적인 조정 계수이다. 이러한 구조를 통해 중력 모형은 [[기종점 행렬]](O-D Matrix)의 행 합계와 열 합계가 사전에 결정된 통행 발생량과 정확히 일치하도록 보장한다. 
 + 
 +중력 모형의 핵심적인 구성 요소인 저항 함수는 통행자의 거리 감쇠 효과를 결정짓는 중요한 변수이다. 주로 사용되는 함수 형태로는 거리에 따른 통행 감소가 일정한 비율로 발생하는 멱함수(Power function) 형태인 $ c_{ij}^{-n} $, 장거리 통행의 급격한 감소를 반영하는 지수 함수(Exponential function) 형태인 $ (-c_{ij}) $, 그리고 이 둘을 결합한 탄너 함수(Tanner function) 등이 있다. 모형의 정확도를 높이기 위해 과거의 통행 데이터를 바탕으로 해당 지역의 특성에 맞는 매개변수 $ $나 $ n $을 추정하는 [[모형 정산]](Calibration) 과정이 필수적으로 수반된다. 
 + 
 +중력 모형은 구조가 명확하고 논리적이며, [[교통망]]의 변화에 따른 통행 패턴의 변화를 민감하게 반영할 수 있다는 장점이 있다. 특히 새로운 도로나 철도가 건설되어 통행 비용이 감소할 경우, 해당 경로를 이용하는 통행량의 증가를 합리적으로 예측할 수 있다. 그러나 지역 간의 사회경제적 특성 차이나 토지 이용의 질적 측면을 충히 반영하지 못하며, 과거의 통행 행태가 미래에도 변하지 않는다는 가정을 전제로 다는 한계가 존재한다. 그럼에도 불구하고 중력 모형은 그 이론적 견고함과 실무적 편의성 덕분에 전 세계 [[도시 계획]] 및 교통 계획 수립 과정에서 표준적인 분석 도구로 활용되고 있다.
  
 ==== 수단 분담 단계 ==== ==== 수단 분담 단계 ====
줄 215: 줄 275:
 === 개별 행태 모형 === === 개별 행태 모형 ===
  
-자의 효용 극대화 원리를 바탕으로 한 로짓 모형과 프로빗 모형의 구를 설명한다.+개별 행태 모형(Disaggregate Behavioral Model)은 교통 분석 존과 같은 공간적 단위를 기준으로 데터를 집계하여 분석하던 전통적인 방식에서 벗어나, 통행을 수행하는 개별 경제 주체의 의사결정 과정을 직접적인 분석 대상으로 삼는 방법론이다. 1970년대 이후 [[계량경제학]]의 비약적인 발전과 함께 도입된 이 모형은 통행자가 직면한 여러 선택 대안 중 의 효용을 가장 크게 만드는 대안을 선택한다는 [[효용 극대화]](Utility Maximization) 원리에 기반한다. 집계 모형이 공간적 경계 설정에 따라 결과가 왜곡되는 [[가변적 지역 단위 문제]](Modifiable Areal Unit Problem, MAUP)를 가졌던 것과 달리, 개별 행태 모형은 개인의 인구 통계적 특성과 교통 수단의 서비스 특성을 정밀하게 반영할 수 있다는 장점이 있다. 
 + 
 +이 모형의 이론적 토대는 [[확률적 효용 이론]](Random Utility Theory)에 있다. 이 이론은 분석자가 통행자의 모든 선호 체계를 완벽하게 관찰할 수 없다는 현실적 한계를 인정한다. 따라서 개별 통행자 $n$이 대안 $i$를 선택함으로써 얻는 전체 효용 $U_{in}$은 분석자가 관측할 수 있는 확정적 효용 $V_{in}$과 관측 불가능한 무작위 오차항 $\epsilon_{in}$의 합으로 정의된다. 
 + 
 +$$U_{in} = V_{in} + \epsilon_{in}$$ 
 + 
 +여기서 확정적 효용 $V_{in}$은 통행 시간, 비용과 같은 수단 특성 변수와 소득, 연령 등 개인 특성 변수의 선형 결합으로 표현되는 것이 일반적이다. 통행자가 대안 $i$를 선택할 확률 $P_{in}$은 해당 대안의 효용이 다른 모든 대안 $j$의 효용보다 클 확률로 계산된다. 
 + 
 +로짓 모형(Logit Model)은 확률적 효용 이론을 실무에 적용한 가장 대표적인 형태이다. 이 모형은 오차항 $\epsilon_{in}$이 서로 독립적이며 동일한 분포를 가진다는 [[독립 동일 분포]](Independent and Identically Distributed, IID) 가정을 전제로, 오차항이 [[제1종 극치 분포]](Type I Extreme Value Distribution) 또는 구벨 분포(Gumbel Distribution)를 따른다고 상정한다. 이러한 가정하에 유도된 [[다항 로짓 모형]](Multinomial Logit Model, MNL)의 선택 확률 식은 다음과 같이 간결한 폐쇄형(Closed-form) 구조를 갖는다. 
 + 
 +$$P_{in} = \frac{e^{V_{in}}}{\sum_{j \in C_n} e^{V_{jn}}}$$ 
 + 
 +로짓 모형은 계산이 용이하고 결과 해석이 직관적이라는 장점이 있어 수단 분담 단계에서 널리 활용되어 왔다((원제무, 종로축 출근통행에 대한 “로-짓” 모형의 적용, https://doi.or.kr/10.KS/JAKO198411919400343 
 +)). 그러나 로짓 모형은 [[독립 대안 불관련]](Independence of Irrelevant Alternatives, IIA)이라는 특성을 지닌다. 이는 두 대안 사이의 선택 확률 비율이 제3의 대안 존재 여부와 무관하게 일정하다는 가정으로, 실제 교통 시장에서 유사한 특성을 가진 수단들이 존재할 경우 선택 확률을 왜곡할 위험이 있다. 
 + 
 +프로빗 모형(Probit Model)은 로짓 모형의 IIA 제약을 극복하기 위해 제안된 대안이다. 이 모형은 오차항 $\epsilon_{in}$이 [[다변량 정규 분포]](Multivariate Normal Distribution)를 따른다고 가정한다. 프로빗 모형의 핵심적인 강점은 오차항 간의 상관관계를 허용한다는 점에 있다. 즉, 지하철과 광역철도처럼 서로 유사한 특성을 공유하는 대안들 사이의 오차항 공분산을 반영함으로써 보다 현실적인 선택 행태를 모사할 수 있다. 
 + 
 +다만 프로빗 모형은 로짓 모형과 달리 선택 확률을 하기 위한 적분식이 폐쇄형으로 도출되지 않는다. 따라서 대안의 수가 많아질수록 다중 적분을 계산하는 데 막대한 연산량이 소모되며,를 해결하기 위해 [[몬테카를로 시뮬레이션]](Monte Carlo Simulation) 등 수치적 기법이 동원되어야 다. 이러한 연산의 복잡성으로 인해 과거에는 실무 적용에 한계가 있었으나, 최근 컴퓨팅 성능의 향상으로 그 활용 범위가 점차 확대되고 있다.
  
 ==== 노선 배정 단계 ==== ==== 노선 배정 단계 ====
줄 237: 줄 314:
 === 이용자 평형 배정법 === === 이용자 평형 배정법 ===
  
-모든 이용자가 자의 통행 시간을 최소화하려 한다는 제하에 도하는 평형 상태를 계한다.+이용자 평형 배정법은 [[워드롭]](John Glen Wardrop)이 1952년에 발표한 논문에서 정의한 ’제1원리’에 그 학술적 기초를 둔다. 이 원리는 개별 통행자가 자신의 [[통행 시간]]이나 비용을 최소화하기 위해 경로를 선택한다는 [[합리적 선택 이론]]을 교통망 분석에 적용한 것이다. 워드롭은 평형 상태를 어느 통행자도 자신의 경로를 단독으로 변경함으로써 통행 시간을 단축할 수 없는 상태로 정의하였다. 이러한 상태에 도달하면 특정 기종점 간에 이용되는 모든 경로의 통행 시간은 동일하게 유지되며, 이용되지 않는 경로의 통행 시간은 이용 중인 경로의 통행 시간보다 크거나 같게 된다. 이는 개별 이용자의 이기적 행태가 집합적으로 고착화된 상태를 의미하며, [[게임 이론]]의 [[내쉬 평형]](Nash Equilibrium) 개념과 논리적으로 궤를 같이한다.((Wardrop, J. G., Some theoretical aspects of road traffic research, https://www.icevirtuallibrary.com/doi/abs/10.1680/ipeds.1952.18159 
 +)) 
 + 
 +수학적으로 이용자 평형 상태를 도출하기 위한 정식화는 [[벡만]](Martin Beckmann) 등에 해 체계화되었다. 벡만은 이를 [[볼록 최적화]](Convex Optimization) 문제로 변환하여 해의 존재성과 유일성을 증명하였다. 이용자 평형 배정의 목적 함수는 각 링크의 [[통행 시간 함수]]를 교통량에 대해 적분한 값들의 총합을 최소화하는 형태로 정의된다. 이는 물리적인 에너지 최소화 원리와 유사한 구조를 가지며, 음과 같은 수리 계획 모형으로 표현된다. 
 + 
 +$$ \min Z = \sum_{a \in A} \int_{0}^{x_a} t_a(\omega) d\omega $$ 
 + 
 +위 식에서 $ x_a $는 링크 $ a $의 교통량이며, $ t_a(x_a) $는 해당 링크의 교통량에 따른 통행 시간을 나타내는 [[링크 성능 함수]]이다. 이 최적화 문는 모든 기종점 쌍 사이의 수요가 각 경로 교통량의 합과 같아야 한다는 [[수요 보존 법칙]]과, 경로 및 링크 교통량이 음수가 될 수 없다는 비음 조건을 제약식으로 가진다. 이 모형의 해는 기종점 간의 모든 이용 경로에서 [[한계 비용]]이 아닌 평균 비용, 즉 개별 통행자가 체감는 통행 시간이 일치하는 지점서 결정된다.((Beckmann, M., McGuire, C. B., & Winsten, C. B., Studies in the Economics of Transportation, https://cowles.yale.edu/sites/default/files/files/pub/mon/m13-all.pdf 
 +)) 
 + 
 +이용자 평형 배정법을 실제 대규모 [[교통망]]에 적용하기 위해서는 효율적인 수치 해석 알고리즘이 필수적이다. 가장 대표적인 기법으로는 [[프랭크-울프 알고리즘]](Frank-Wolfe Algorithm)이 사용된다. 이 알고리즘은 현재의 교통량 상태에서 가장 짧은 경로를 찾아 모든 교통량을 배정하는 [[전량 배정법]](All-or-Nothing Assignment)을 반복 수행하며, 이전 단계의 해와 새로운 해를 선형 결합하여 점진적으로 최적 해에 수렴해 나가는 방식을 취한다. 이 과정에서 로의 용량 제약에 따른 혼잡 효과가 반영되며, 교통량이 증가함에 따라 통행 시간이 지수적으로 증가하는 [[BPR 함수]] 등이 링크 성능 함수로 널리 활용된다. 
 + 
 +이용자 평형 배정법은 실제 교통 현상을 비교적 정확하게 묘사한다는 장점이 있으나, 모든 통행자가 교통망의 상태에 대한 [[완전 정보]]를 보유하고 있다는 가정을 전제로 한다. 현실적으로 통행자는 정보의 불확실성이나 개인적 선호에 따라 최단 경로가 아닌 노선을 선택할 가능성이 존재한다. 이러한 한를 보완하기 위해 통행자의 인지 오차를 확률 변수로 도입한 [[확률적 이용자 평형]](Stochastic User Equilibrium, SUE) 모형이 제안되기도 하였다. 또한, 이용자 평형 상태가 반드시 사회 전체의 총 통행 시간을 최소화하는 [[시스템 최적]] 상태와 일치하지 않는다는 점은 [[브래스 역설]](Braess’s Paradox)을 통해 증명되었으며, 이는 [[교통 정책]] 수립 시 개별 이용자의 선택과 사회적 효율성 사이의 간극을 관리해야 함을 시사한다.
  
 === 시스템 최적 배정법 === === 시스템 최적 배정법 ===
  
-사회 전체의 총 통행 시간을 최소화하는 점에서의 선 배정 원리와 평형 배정과의 차이점을 비교한다.+시스템 최적 배정법(System Optimal Assignment, SO)은 교통망 내의 모든 통행자가 소비하는 총 통행 시간의 합을 최소화하도록 통행량을 배분하는 기법이다. 이는 [[존 워드롭]](John Glen Wardrop)이 제시한 두 번째 원리, 즉 “평형 상태에서의 평균 통행 시간은 최소가 된다”는 원칙에 기반한다. 개별 이용자가 자신의 이익만을 극대화하려 하는 [[이용자 평형 배정법]]과 달리, 시스템 최적 배정법은 사회 전체의 효율성을 극대화하는 관점을 견지한다. 따라서 이 기법은 실제 통행 행태를 묘사하기보다는 [[교통 정책]] 수립 시 도달할 수 있는 이상적인 목표치나 [[사회적 후생]]의 최대치를 산정하는 기준으로 활용된다. 
 + 
 +시스템 최적 배정법의 수학적 정식화는 네트워크 전체의 총 통행 시간을 목적 함수로 설정하여 이를 최소화하는 [[최적화]] 문제로 정의된다. 특정 경로의 통행량을 $f_p$, 링크 $a$의 통행량을 $x_a$, 그리고 링크 $a$에서의 통행 시간 함수를 $t_a(x_a)$라고 할 때, 시스템 최적 배정의 목적 함수는 다음과 같다. 
 + 
 +$$ \min Z = \sum_{a} x_a \cdot t_a(x_a) $$ 
 + 
 +이 식에서 $x_a \cdot t_a(x_a)$는 해당 링크를 통과하는 모든 차량의 통행 시간 합계를 의미한다. 이를 제약 조건인 기종점 간 수요 보존 법칙과 비음 조건 하에서 풀이하면 시스템 최적 상태를 얻을 수 있다. 이때 최적해의 조건은 택된 모든 경로의 [[한계 비용]](Marginal Cost)이 동일하며, 선택되지 않은 경로의 한계 비용보다 작거나 같아야 한다는 것이다. 여기서 한계 비용이란 추가적인 차량 한 대가 도로에 진입했을 때 본인이 소비하는 시간뿐만 아니라, 그로 인해 기존 도로 이용자들에게 유발되는 지체 시간의 증가분까지 포함하는 개념이다. 
 + 
 +이와 대비되는 [[이용자 평형 배정법]]은 개별 운전자가 자신의 통행 시간, 즉 [[평균 비용]](Average Cost)만을 고려하여 경로를 선택하는 [[게임 이론]]적 관점을 취한다. 이용자 평형 상태에서는 어떤 통행자도 경로를 변경함으로써 자신의 통행 시간을 단축할 수 없으나, 이 상태에서의 총 통행 시간은 시스템 최적 상태보다 항상 크거나 같다. 이러한 두 배정 과의 차이를 [[교통 공학]]에서는 [[무정부 상태의 대가]](Price of Anarchy)라고 부르며, 이는 개별적 최적화가 전체적 최적화와 일치하지 않는 [[외부 효과]]의 발생을 정량적으로 보여준다. 
 + 
 +시스템 최적 배정법의 함의는 [[브래스의 역설]](Braess’s Paradox)을 통해서도 명확히 드러난다. 이용자 평형 상태에서는 도로 공급이 늘어났음에도 불구하고 개별 이용자의 이기적 경로 선택으로 인해 전체 혼잡이 가중되는 현상이 발생할 수 있으나, 시스템 최적 관에서는 이러한 비효율이 원천적으로 차단된다. 실무적으로는 시스템 최적 상태를 구현하기 위해 [[혼잡 통행료]](Congestion Pricing) 정책이 제안된다. 개별 이용자가 타인에게 미치는 한계 지체 비용만큼을 통행료로 지불하게 함으로써, 이용자의 경로 선택 기준을 평균 용에서 한계 비용으로 전환하고 결과적으로 이용자 평형 상태를 시스템 최적 상태로 유도하는 것이다. 
 + 
 +결론적으로 시스템 최적 배정법은 통망 운영의 효율성 계를 규정하는 이론적 틀을 제공한다. 비록 개별 이용자의 자유로운 경로 선택권을 전제로 하는 현실의 교통 체계에서 이를 직접 구현하기는 어려우나, [[자율주행 자동차]]의 도입이나 [[중앙 집중식 교통 제어]] 시스템이 발전함에 따라 시스템 최적 배정의 원리는 미래 교통 시스템의 운영 알고리즘으로서 그 중요성이 더욱 증대되고 있다. 이는 한정된 도로 자원을 사회적으로 가장 가치 있게 배분하기 위한 [[수리 모델]]로서의 위상을 지닌다.
  
 ===== 데이터 수집 및 분석 체계 ===== ===== 데이터 수집 및 분석 체계 =====
줄 403: 줄 504:
 ==== 예측의 오차와 불확실성 관리 ==== ==== 예측의 오차와 불확실성 관리 ====
  
-예측치와 실제치의 괴리가 발생하는 원인을 분석하고, 시나오 분석 을 통한 대응 방안을 제시한다.+교통 수요 예측은 미래의 불확한 상황을 전로 수행되기에 실제 관측치와 예측치 사이의 괴리가 필연적으로 발생한다. 이러한 오차는 단순한 기술적 한계를 넘어 [[사회간접자본]] 투자 결정의 왜곡과 [[예산]] 낭비라는 심각한 부작용을 초래할 수 있다. 따라서 예측 과정에서 발생하는 오차의 원인을 체계적으로 분석하고, 이를 관리하기 위한 전략을 수립하는 것은 [[교통 계획]]의 신뢰성을 확보하는 핵심적인 과정이다. 
 + 
 +예측 오차의 원인은 크게 세 가지 측면으로 분류할 수 있다. 첫째는 입력 데이터의 불확실성이다. 예측 모형의 기초가 되는 [[사회경제지표]], 즉 미래의 인구 규모, [[국내총생산]](GDP), 자동차 보유 대수 및 [[토지 이용]] 계획 등이 실제와 다르게 전개될 경우 예측 결과는 근본적인 한계에 봉착한다. 둘째는 모형 자체의 구조적 결함과 매개변수 설정의 오류이다. 현실의 복잡한 통행 행태를 수식화하는 과정에서 발생하는 [[모형의 명세 오류]](Model Misspecification)나, 과거 데이터를 기반으로 추정된 매개변수가 미래에도 불변할 것이라는 가정은 오차를 유발하는 주요 요인이 된다. 셋째는 전략적 요인으로, 특정 사업의 추진 가능성을 높이기 위해 수요를 낙관적으로 추정하는 [[낙관적 편향]](Optimism Bias)이나 [[전략적 왜곡]](Strategic Misrepresentation)이 개입되는 경우이다. 특히 대규모 국책 사업의 [[타당성 조사]] 과정에서 이러한 인위적 편향이 빈번하게 보고된다. 
 + 
 +오차의 크기를 정량적으로 평가하기 위해 실무에서는 다양한 통계적 지표를 활용한다. 대표적으로 평균 절대 백분율 오차(Mean Absolute Percentage Error, MAPE)와 평균 제곱근 오차(Root Mean Square Error, RMSE)가 있다. 특정 노선 $i$에 대한 실제 통행량을 $A_i$, 예측 통행량을 $F_i$라 할 때, MAPE는 다음과 같이 정의된다. 
 + 
 +$$ MAPE = \frac{1}{n} \sum_{i=1}^{n} \left| \frac{A_i - F_i}{A_i} \right| \times 100 $$ 
 + 
 +이러한 지표는 과거 사업들의 예측 성과를 검토하고 현재 모형의 신뢰도를 진단하는 기초 자료가 된다. 특히 철도와 같은 대규모 설 사업에서는 개통 초기 수요가 예측치의 절반에도 미치지 못하는 사례가 빈번하며, 이는 노선망 개통 시점의 지연이나 주변 개발 계획의 미이행 등 외부 환경 변화에 민감하게 반응하기 때문이다((철도 통행량 추정의 차 분석을 통한 예측 정확도 향상 방안, https://www.kci.go.kr/kciportal/landing/article.kci?arti_id=ART001415144 
 +)). 
 + 
 +불확실성을 체계적으로 관리하기 위한 대응 방안으로는 [[민감도 분석]](Sensitivity Analysis)과 [[시나리오 분석]](Scenario Analysis)이 널리 활용된다. 민감도 분석은 입력 변수 중 특정 요인(예: 유가, 통행료, 경제성장률)이 일정 비율 변화할 때 최종 수요가 얼마나 변동하는지를 파악하여 핵심 위험 요인을 식별하는 기법이다. 시나리오 분석은 미래에 발생 가능한 여러 상황을 ‘낙관적’, ‘중립적’, ‘비관적’ 시나리오로 설정하고 각각의 수요 범위를 제시함으로써 [[의사결정]]자에게 단일 수치가 아닌 합리적인 예측 범위를 제공다. 
 + 
 +최근에는 고정된 수치 예측에서 벗어나 확률적 분포를 활용하는 기법도 도입되고 있다. [[몬테카를로 시뮬레이션]](Monte Carlo Simulation)을 통해 입력 변수의 확률 분포를 정의하고 수만 번의 반복 계산을 수행함으로써, 특정 수요 수준이 발생할 확률을 도출하는 방식이다. 또한, 사업 시행 이후 실제 수요를 지속적으로 모니터링하고 이를 차기 예측에 환류하는 사후 평가(Ex-post evaluation) 체계의 강화는 예측 모형의 자기 학습 기능을 높이는 데 기여한다. 이러한 다각적인 불확실성 관리 방안은 [[교통 정책]] 수립 시 리스크를 최소화하고 공공 투자의 효율성을 극대화하는 실무적 기반이 된다.
  
교통_수요_예측.1776060660.txt.gz · 마지막으로 수정됨: 저자 flyingtext