문서의 이전 판입니다!
교통공학(Transportation Engineering)과 도시계획(Urban Planning)의 영역에서 기종점(Origin-Destination, O-D)은 특정 교통 체계 내에서 발생하는 모든 통행(Trip)의 시작과 끝을 의미하는 핵심적인 분석 단위이다. 기종점 개념은 단순히 지리적인 두 지점을 연결하는 물리적 궤적을 넘어, 도시 내 사회경제적 활동의 결과로 발생하는 교통 수요(Transportation Demand)의 발생원과 흡수원을 규정하는 학술적 토대를 제공한다.
기점(Origin)은 통행이 시작되는 지점으로, 가구의 주거지나 직장 등 통행을 유발하는 활동이 개시되는 장소를 의미한다. 반면 종점(Destination)은 통행의 목적이 달성되는 지점으로, 통행자가 도달하고자 하는 최종 목적지를 뜻한다. 이 두 지점 사이의 관계를 규명하는 것은 교통 수요 예측(Transportation Demand Forecasting)의 출발점이며, 이를 통해 도시 내 인구 이동의 패턴과 교통량의 분포를 파악할 수 있다.
통행은 기종점을 연결하는 기본 이동 단위로서, 보통 한 가지 이상의 목적을 가지고 한 지점에서 다른 지점으로 이동하는 행위로 정의된다. 교통 분석에서 통행은 단순히 위치의 변화만을 의미하지 않으며, 토지 이용(Land Use) 체계와 밀접하게 연관된 활동의 산물로 간주된다. 예를 들어, 주거 지역인 기점에서 상업 지역인 종점으로의 이동은 출근이나 쇼핑이라는 구체적인 사회적 목적을 내포한다. 이러한 통행의 특성은 기종점 간의 거리, 소요 시간, 이용 가능한 교통 수단 등에 의해 결정된다.
현실 세계의 무수한 기종점을 개별적으로 분석하는 것은 계산적으로 불가능하므로, 교통 계획가들은 지리적 공간을 일정한 단위로 구획한 교통 분석 구역(Traffic Analysis Zone, TAZ)을 설정한다. 각 구역 내의 통행 특성은 구역의 중심점(Centroid)에 집약된 것으로 가정하며, 이를 통해 복잡한 도시의 이동을 체계적인 데이터로 변환한다. 구역 $ i $에서 구역 $ j $로 이동하는 통행량 $ T_{ij} $는 기종점 행렬(O-D Matrix)의 기본 원소가 되며, 이는 다음과 같은 수리적 구조를 갖는다.
$$ T = \begin{bmatrix} T_{11} & T_{12} & \cdots & T_{1n} \\ T_{21} & T_{22} & \cdots & T_{2n} \\ \vdots & \vdots & \ddots & \vdots \\ T_{n1} & T_{n2} & \cdots & T_{nn} \end{bmatrix} $$
여기서 $ T_{ij} $는 기점 구역 $ i $에서 종점 구역 $ j $로 향하는 통행의 총량을 나타낸다. 이러한 행렬 구조는 도시 전체의 통행 분포(Trip Distribution)를 한눈에 파악하게 해주며, 네트워크 분석과 노선 배정(Traffic Assignment) 모형의 필수적인 입력 자료로 활용된다.
기종점 개념의 정립은 교통 시설의 효율적 배치와 운영 정책 수립에 결정적인 기여를 한다. 특정 기종점 쌍(O-D Pair) 사이의 통행 수요가 도로의 용량을 초과할 경우 교통 혼잡이 발생하며, 이를 해결하기 위해 새로운 교통 인프라 구축이나 대중교통 노선 조정 등의 정책적 개입이 이루어진다. 따라서 기종점은 단순한 위치 정보가 아니라, 도시의 활동 체계(Activity System)와 교통 공급 간의 상호작용을 설명하는 가장 기본적인 지표라 할 수 있다.1)
교통 공학에서 통행(Trip)은 특정 목적을 달성하기 위해 한 지점에서 다른 지점으로 이동하는 물리적 행위로 정의된다. 이때 통행이 시작되는 지점을 기점(Origin)이라 하고, 통행이 종료되는 지점을 종점(Destination)이라 한다. 기점과 종점은 통행의 방향성을 나타내는 상대적인 개념이며, 이를 통틀어 기종점이라 일컫는다. 교통 수요 예측의 초기 단계인 통행 발생 단계에서는 각 교통 분석 구역별로 얼마나 많은 통행이 시작되고 끝나는지를 파악하는 것이 핵심이다.
통행 발생의 근본적인 동인은 인간의 경제적·사회적 활동이 공간적으로 분리되어 있다는 점에서 기인한다. 현대 도시 구조에서 주거, 업무, 상업, 교육 등 각 활동의 거점은 서로 다른 위치에 존재하며, 개인은 이러한 활동에 참여하기 위해 공간적 제약을 극복해야 한다. 따라서 통행은 그 자체로 목적이 되기보다는 특정 활동에 참여하기 위한 수단적 성격을 갖는 파생적 수요(Derived Demand)의 특성을 띤다. 토지 이용 계획에 따라 특정 구역의 용도가 결정되면, 해당 구역은 통행을 발생시키는 동인인 유발 요인(Generator) 혹은 흡수 요인(Attractor)으로서의 기능을 수행하게 된다.
이론적으로 기종점은 방향성에 기초한 구분이나, 보다 정밀한 분석을 위해 통행 생성(Production)과 통행 유인(Attraction)이라는 개념으로 세분화된다. 통행 생성은 통행을 유발하는 주체인 가구(Household)가 위치한 지역을 기준으로 정의되며, 통행 유인은 통행의 목적인 고용, 쇼핑, 교육 시설 등이 입지한 지역을 기준으로 정의된다. 예를 들어, 아침 출근 통행에서 주거지는 기점이자 생성지가 되고 직장은 종점이자 유인지가 된다. 반면 퇴근 통행의 경우 직장은 기점이 되지만 이론적 분석에서는 여전히 유인지로 분류되며, 주거지는 종점이 되지만 생성지로 간주된다. 이러한 구분은 가구 기반 통행(Home-based trip) 분석에서 통행의 안정적인 예측을 가능하게 하는 중요한 틀을 제공한다.
수리적 관점에서 특정 구역 $ i $에서 발생하여 구역 $ j $로 향하는 통행량을 $ T_{ij} $라고 할 때, 기점 $ i $에서 나가는 총 통행량 $ O_i $와 종점 $ j $로 들어오는 총 통행량 $ D_j $는 다음과 같은 합계식으로 표현된다.
$$ O_i = \sum_{j} T_{ij} $$ $$ D_j = \sum_{i} T_{ij} $$
여기서 $ O_i $는 구역 $ i $의 유출 통행량을 의미하며, $ D_j $는 구역 $ j $의 유입 통행량을 의미한다. 전체 교통 체계 내에서 발생하는 총 통행량은 모든 구역의 유출량 합계와 유입량 합계가 일치해야 한다는 보존 법칙을 만족해야 한다.
기점과 종점의 구분은 단순한 위치 정보 이상의 의미를 갖는다. 기점의 특성은 주로 인구수, 가구 소득, 자동차 보유 대수 등 사회경제적 지표에 의해 결정되는 반면, 종점의 특성은 고용자 수, 상업 시설 면적, 공공 서비스 접근성 등 토지 이용의 강도에 의해 결정된다. 이러한 이론적 토대는 기종점 행렬(OD Matrix)을 구축하고 장래의 교통 수요 변화를 예측하는 모든 수리 모델의 기초가 된다. 특히 개발 사업에 따른 추가 통행량을 산정할 때 기종점(OD) 패턴과 생성-유인(PA) 패턴 중 어느 것을 적용하느냐에 따라 분석 결과의 신뢰도가 달라질 수 있으므로, 각 개념의 이론적 차이를 명확히 인지하는 것이 필수적이다.2)
교통 분석 구역(Traffic Analysis Zone, TAZ)은 교통 수요 예측 및 분석을 수행하기 위해 지리적 공간을 세분화한 최소 작업 단위이다. 이는 복잡한 도시 및 지역 공간에서 발생하는 유동적인 통행 특성을 수치화하고 관리하기 위해 설정된 가상의 구획으로, 각 구역은 통행의 기점(Origin) 또는 종점(Destination)으로서의 기능을 수행한다. TAZ 설정의 적절성은 분석 결과의 신뢰도와 직결되므로, 지리적·사회경제적·기술적 측면을 종합적으로 고려한 엄격한 기준이 요구된다.
지리적 측면에서 가장 우선시되는 기준은 행정 구역(Administrative district)과의 정합성이다. 이는 인구 통계, 종사자 수, 자동차 등록 대수와 같은 인구 통계 자료가 주로 읍·면·동이나 집계구 단위를 기준으로 수집되기 때문이다. 자료의 수집 및 가공 과정에서 발생하는 오차를 최소화하기 위해 TAZ의 경계는 가급적 기존 행정 경계와 일치시키는 것이 원칙이다. 또한 하천, 산악 지형, 철도, 고속도로와 같은 물리적 지형지물은 통행의 흐름을 단절시키는 장벽 역할을 하므로 이를 구역 경계로 설정하여 구역 간 통행이 명확히 구분되도록 한다.
사회경제적 요인으로는 토지 이용의 균질성(Homogeneity)이 핵심적인 기준이 된다. 동일한 구역 내에서는 주거, 상업, 공업, 녹지 등 토지 이용의 성격이 가급적 단일하게 유지되어야 한다. 이는 구역 내 거주자나 활동 인구의 통행 발생(Trip generation) 특성을 통계적으로 대표하기 위함이다. 예를 들어, 주거 밀집 지역과 대규모 상업 지구가 하나의 구역으로 묶일 경우, 해당 구역의 통행 특성을 회귀 분석 등의 수리적 모델로 설명하는 데 한계가 발생한다. 따라서 유사한 활동 패턴을 공유하는 지역을 하나의 단위로 획정하여 모형의 설명력을 높여야 한다.
기술적 원칙에서는 구역의 크기와 개수의 최적화가 중요하다. 구역의 크기가 너무 크면 구역 내부 통행(Intrazonal trip) 비중이 과도하게 높아져 실제 네트워크상의 교통 부하를 과소평가하는 오류가 발생한다. 반대로 구역을 지나치게 세분화하면 데이터 처리 비용이 기하급수적으로 증가하고 중력 모형 등에서 구역 간 통행량이 0으로 나타나는 희소성 문제가 발생할 수 있다. 일반적으로 구역 내부 통행량이 전체 통행량에서 차지하는 비율인 $ R_{int} $를 일정 수준 이하로 유지하는 것을 목표로 한다. 구역 내 통행 비율은 다음과 같이 정의할 수 있다.
$$ R_{int} = \frac{\sum_{i} T_{ii}}{\sum_{i} \sum_{j} T_{ij}} $$
여기서 $ T_{ii} $는 구역 $ i $ 내부의 통행량을, $ T_{ij} $는 구역 $ i $에서 $ j $로의 통행량을 의미한다. 통상적으로 이 비율이 10~15%를 초과하지 않도록 구역의 크기를 조정하는 것이 권장된다.
최근에는 지리 정보 시스템(Geographic Information System, GIS)의 발전과 빅데이터 활용 능력이 향상됨에 따라, 과거의 고정된 행정 구역 중심에서 벗어나 실제 통행 패턴을 반영한 동적 구획 설정 방식이 도입되고 있다. 모바일 통신 데이터나 교통카드 이용 내역을 바탕으로 통행 밀도가 높은 지점을 중심으로 구역을 재편하거나, 스마트 시티 구현을 위해 보행권 단위의 초미세 구역(Micro-zone)을 설정하는 등 분석 목적에 따른 유연한 기준 적용이 강조되는 추세이다. 이러한 정교한 구역 설정은 교통 체계 운영의 효율성을 극대화하고 장래 수요 예측의 정밀도를 확보하는 기초가 된다.
교통 분석 구역을 설정함에 있어 가장 먼저 선행되어야 할 작업은 분석의 공간적 범위를 확정하는 것이다. 이를 위해 연구자는 분석 대상 지역의 경계를 설정하게 되는데, 이 경계선을 조사선(Cordon Line)이라 정의한다. 조사선에 의해 구획된 내부 공간은 다시 세부적인 내부 구역(Internal Zone)들로 분할되며, 조사선 외부의 영역은 외부 구역(External Zone)으로 간주하여 관리한다. 이러한 이분법적 구분은 분석 대상 내의 통행 행태를 정밀하게 파악하는 동시에, 외부로부터의 유입 및 유출이 전체 교통망에 미치는 영향을 통제하기 위한 필수적인 수리적 장치이다.
내부 구역은 분석의 핵심이 되는 공간 단위로, 해당 지역 내의 토지 이용(Land Use) 상태, 인구 통계(Demographics), 고용(Employment) 규모 등 사회경제적 지표를 상세히 반영한다. 내부 구역 간의 통행은 기점과 종점이 모두 분석 범위 내에 존재하므로, 구역별 발생 및 도착 통행량을 바탕으로 한 직접적인 수요 모델링이 가능하다. 반면 외부 구역은 분석 대상 지역 외부의 광범위한 지역을 대표하는 가상의 지점이나 구역으로 설정된다. 외부 구역을 설정하는 주된 목적은 분석 대상 지역의 경계를 통과하여 들어오거나 나가는 통행, 즉 외부 유출입 통행과 지역 내부를 단순히 통과하기만 하는 통과 통행(Through Traffic)을 체계적으로 포착하는 데 있다.
통행의 유형을 구분할 때, 내부 구역 간의 이동은 내부-내부(Internal-Internal, I-I) 통행으로 분류된다. 이와 달리 기점이 내부에 있고 종점이 외부에 있는 경우를 내부-외부(Internal-External, I-E) 통행, 그 반대를 외부-내부(External-Internal, E-I) 통행이라 하며, 기점과 종점이 모두 외부이면서 분석 대상 지역을 가로지르는 경우를 외부-외부(External-External, E-E) 통행이라 지칭한다. 만약 외부 구역을 적절히 설정하지 않는다면, 조사선 경계에서 발생하는 대규모의 교통 흐름을 모형 내에서 설명할 수 없게 되어 교통 배정(Traffic Assignment)의 정확도가 현저히 저하된다. 따라서 외부 구역은 통상 주요 간선도로나 고속도로가 조사선과 교차하는 지점을 중심으로 설정하며, 이를 통해 외부와의 교류량을 기종점 행렬에 효과적으로 통합한다.
결과적으로 내부 구역과 외부 구역의 구분은 분석 대상 지역을 하나의 독립된 교통 체계로 취급하면서도, 주변 지역과의 상호작용을 간과하지 않기 위한 전략적 선택이다. 내부 구역의 세분화가 지역 내 통행의 정밀한 묘사를 가능케 한다면, 외부 구역의 설정은 전체 교통 시스템의 수리적 완결성을 부여한다. 이는 분석 범위 내 도로망의 부하를 정확히 산출하고, 장래 교통 수요 변화에 따른 외부 유입량의 변동을 교통 시뮬레이션에 정교하게 반영할 수 있도록 돕는다. 이러한 구역의 이원적 관리는 도시 교통 계획의 신뢰성을 확보하는 기초가 된다.
데이터의 정밀도와 계산 효율성을 고려한 최적의 구역 크기 산정 방식을 설명한다.
기종점(Origin-Destination, O-D) 통행량 조사는 특정 지역 내에서 발생하는 사람과 화물의 이동 패턴을 정량화하여 교통 수요 예측 및 교통 시설 계획의 기초 자료를 확보하는 과정이다. 이 조사는 단순히 통행의 양적 규모를 파악하는 것을 넘어, 통행의 기점과 종점을 명확히 하고 어떤 경로와 수단을 이용하는지에 대한 공간적·시간적 정보를 체계적으로 수집하는 것을 목적으로 한다. 이를 위해 조사 권역을 세분화한 교통 분석 존(Traffic Analysis Zone, TAZ) 체계를 설정하며, 수집된 데이터는 통행 발생과 통행 분포를 결정짓는 핵심 변수로서 교통 수요 분석 4단계 모델의 기초 입력 자료가 된다.
전통적인 자료 수집 체계의 중심은 가구 통행 실태 조사(Home Interview Survey)이다. 이는 조사 대상 지역 내의 표본 추출 과정을 거쳐 선정된 가구를 대상으로 가구원 개개인의 하루 동안의 통행 행태를 상세히 기록하는 방식이다. 조사 항목에는 기종점뿐만 아니라 통행 목적, 출발 및 도착 시각, 이용 교통수단, 환승 횟수 등 정성적·정량적 정보가 모두 포함된다. 이러한 방식은 통행자의 사회경제적 특성과 통행 행태 간의 상관관계를 파악하는 데 매우 유리하지만, 막대한 예산과 조사 인력이 투입되어야 하며 응답자의 기억에 의존하기 때문에 기억 편향(Recall Bias)으로 인한 표본 오차가 발생할 가능성이 존재한다.
가구 통행 실태 조사의 공간적 누락을 보완하고 데이터의 정확도를 검증하기 위해 노상 면접 조사(Roadside Interview)와 관측 조사가 병행된다. 노상 면접 조사는 주요 도로의 경계선이나 교량, 터널 등 통행이 집중되는 지점에서 차량을 정지시키고 운전자에게 직접 기종점을 질문하는 방식이다. 또한, 조사 권역의 경계선인 코든 라인(Cordon Line)과 권역을 내부적으로 양분하는 스크린 라인(Screen Line)을 통과하는 교통량을 직접 계수하여, 설문 조사로 추정된 통행량이 실제 교통량과 일치하는지 검증하는 과정을 거친다. 이때 관측된 실제 교통량 $V$와 설문으로부터 추정된 교통량 $\hat{V}$ 사이의 오차를 최소화하기 위해 전수 조사 성격의 교통량 관측치를 기준으로 보정 계수를 산출한다.
최근에는 정보통신기술(ICT)의 발전으로 인해 빅데이터 기반의 비대면 조사 체계가 핵심적인 방법론으로 부상하였다. 교통카드 데이터는 대중교통 이용자의 승하차 지점과 시간을 전수 조사 수준으로 제공하여 대중교통 기종점 행렬을 정밀하게 구축할 수 있게 한다. 또한, 모바일 통신 신호 데이터는 기지국 접속 정보를 활용하여 특정 시각의 유동 인구와 광역적 이동 흐름을 파악하는 데 활용된다. 지능형 교통 체계(Intelligent Transport Systems, ITS)의 일환인 글로벌 위치 결정 시스템(Global Positioning System, GPS) 장착 차량의 주행 궤적 데이터(Probe Data)는 개별 차량의 정밀한 경로 선택 행태를 분석하는 데 기여하며, 이는 기존 설문 조사가 포착하기 어려웠던 동적 통행 특성을 분석하는 핵심 도구가 된다.
표본 조사를 통해 수집된 데이터는 전체 모집단의 통행량으로 확대 적용하기 위해 전수화(Expansion) 과정을 거친다. 전수화 계수(Expansion Factor) $W_i$는 특정 교통 분석 존 $i$의 전체 가구 수 $N_i$를 유효 조사 가구 수 $n_i$로 나눈 값으로 정의되며, 이를 개별 표본 데이터에 곱하여 전체 통행량을 추정한다.
$$W_i = \frac{N_i}{n_i}$$
이 과정에서 가구 규모, 차량 보유 여부 등 사회경제적 지표를 기준으로 가중치를 조정하여 데이터의 대표성을 확보한다. 현대의 기종점 조사 방법론은 이와 같은 전통적인 설문 조사의 심층성과 빅데이터의 광범위성을 결합한 하이브리드 형태로 진화하고 있으며, 이를 통해 더욱 정교한 교통 시뮬레이션과 실효성 있는 교통 정책 수립이 가능해지고 있다.
전통적 가구 통행 실태 조사(Household Travel Survey, HTS)는 특정 교통 분석 구역(Traffic Analysis Zone, TAZ) 내에 거주하는 가구를 표본으로 선정하여, 가구 구성원 개개인의 하루 동안의 이동 행태를 상세히 조사하는 방식이다. 이는 교통 수요 예측의 기초가 되는 기종점 통행량 데이터를 수집하는 가장 고전적이면서도 표준적인 방법론으로 간주된다. 관측 지점에서의 단순 통행량 산정과 달리, 가구 통행 실태 조사는 통행 주체의 사회경제적 특성과 통행의 목적을 결합하여 분석할 수 있다는 점에서 정책적 활용도가 매우 높다.
조사 절차는 엄격한 통계적 설계에 따라 진행된다. 우선 모집단인 전체 가구 중 지역적·인구통계적 대표성을 확보할 수 있도록 표본 추출(Sampling) 계획을 수립한다. 선정된 표본 가구에 대해서는 조사원이 직접 방문하는 면접 조사(Face-to-face Interview)를 원칙으로 하며, 부재 시에는 전화나 우편, 온라인 설문을 병행하기도 한다. 조사 대상자는 통상 24시간 동안 수행한 모든 이동 내역을 기록하는 통행 일지(Travel Diary)를 작성한다. 수집되는 데이터는 가구주 성향, 가구 소득, 차량 보유 대수와 같은 가구 특성과 연령, 직업, 통행 사슬(Trip Chain) 내의 기점과 종점, 통행 목적, 이용 교통수단, 출발 및 도착 시각 등 개별 통행 특성을 포괄한다.
수집된 표본 데이터는 해당 구역의 전체 통행량을 추정하기 위해 전수화(Expansion) 과정을 거친다. 이는 표본 가구의 통행 특성에 전수화 계수를 곱하여 모집단의 전체 통행 행렬을 복원하는 과정이다. 이 과정에서 조사된 교통량과 실제 가로망의 관측 교통량을 비교 검토하여 데이터의 신뢰성을 보정하며, 이를 통해 구축된 기종점 행렬은 장래 교통 시설 확충 및 노선 설계의 핵심 기초 자료로 활용된다.
그러나 이러한 전통적 조사 방식은 현대 도시의 복잡성을 반영하는 데 있어 몇 가지 근본적인 한계점을 지닌다. 첫째, 막대한 비용과 행정적 자원이 소요된다. 대규모 도시권의 경우 통계적 유의성을 확보하기 위해 수만 가구 이상의 표본이 필요하며, 조사원 교육과 현장 실사 등에 긴 시간이 소요된다. 둘째, 응답자의 기억에 의존하는 회상 편의(Recall Bias)로 인해 데이터의 부정확성이 발생할 수 있다. 특히 목적지가 여러 곳인 복합 통행이나 단거리 보행 이동은 응답 과정에서 누락되는 경우가 많아 전체 통행량이 과소 산정될 위험이 있다. 셋째, 개인정보 보호 의식의 강화와 맞벌이 및 1인 가구의 증가로 인해 방문 조사 거부율이 높아지면서 표본 오차와 비표본 오차를 통제하기가 점차 어려워지고 있다. 마지막으로, 조사 주기가 보통 5년 단위로 길어 급변하는 교통 패턴과 도시 공간 구조의 변화를 적시에 반영하지 못하는 시의성의 한계가 존재한다3).
관측 및 노상 면접 조사는 특정 지역의 경계선이나 주요 도로상의 거점을 통과하는 차량을 대상으로 직접적인 통행 정보를 수집하는 현장 중심의 기종점 조사 기법이다. 이 방법은 주로 교통 수요 분석에서 분석 대상 지역의 외부로부터 유입되거나 외부로 유출되는 통행, 그리고 지역을 단순히 통과하는 통행(Through Traffic)의 특성을 파악하기 위해 수행된다. 조사 주체는 대개 조사선(Cordon Line)이라 불리는 가상의 폐쇄 곡선을 설정하고, 이 선과 교차하는 모든 주요 도로상에 조사 지점을 배치하여 유입·유출 교통량을 통제한다.
노상 면접 조사(Roadside Interview Survey)는 조사원이 주행 중인 차량을 안전한 장소에 정지시키거나 서행하도록 유도한 뒤, 운전자에게 직접 질문을 던져 정보를 획득하는 방식이다. 주요 조사 항목으로는 통행의 출발지와 목적지, 통행 목적, 차량의 종류, 탑승 인원, 적재 화물의 종류 등이 포함된다. 이 기법은 표본 조사의 형태를 띠지만, 응답으로부터 얻는 정보의 상세도가 매우 높고 기종점을 명확히 특정할 수 있다는 점에서 데이터의 신뢰성이 우수하다. 그러나 교통 흐름을 직접적으로 방해하여 교통 혼잡을 유발할 위험이 있으며, 안전사고 예방을 위한 추가적인 인력과 장비 배치가 필수적이라는 단점이 있다.
면접 조사에 따른 교통 체증을 완화하기 위해 번호판 조사(License Plate Survey)가 병행되기도 한다. 이는 특정 지점을 통과하는 차량의 번호판을 기록하고, 일정 시간 내에 다른 조사 지점에서 동일한 번호판이 관측되는지를 대조하여 기종점을 추정하는 방법이다. 과거에는 조사원이 수기로 기록하거나 녹음기를 활용하였으나, 현대에는 지능형 교통 체계(ITS)의 발달로 자동 번호판 인식(Automated Number Plate Recognition, ANPR) 시스템과 영상 분석 기술을 활용하여 무인으로 대량의 데이터를 수집한다. 이 방식은 교통 흐름에 지장을 주지 않으면서 전수 조사에 가까운 데이터를 확보할 수 있게 하나, 차량의 이동 경로만을 알 수 있을 뿐 통행 목적이나 탑승 인원과 같은 세부적인 속성 정보를 파악하기 어렵다는 한계가 있다.
조사 과정에서 수집된 표본 데이터는 실제 해당 지점을 통과한 총 교통량을 기준으로 전수화(Expansion) 과정을 거쳐야 한다. 조사 지점에는 별도의 교통량 조사원이 배치되거나 검지기가 설치되어 전체 통과 차량 대수를 집계한다. 이때 전수화 계수 $ W $는 다음과 같은 수식을 통해 산출된다.
$$ W = \frac{N}{n} $$
여기서 $ N $은 조사 시간대 동안 해당 지점을 통과한 총 교통량이며, $ n $은 실제로 면접이나 관측을 통해 유효한 응답을 얻은 표본 교통량이다. 산출된 계수를 각 표본 데이터에 곱함으로써 해당 지점의 전체 기종점 행렬을 추정하게 된다. 이때 조사 시간외의 변동이나 요일별 특성을 반영하기 위해 시간 변동 계수 및 요일 계수를 추가로 적용하여 연평균 일교통량(Average Annual Daily Traffic, AADT) 수준으로 보정하는 과정이 수반된다.
또한, 조사 데이터의 정확성을 검증하기 위해 차단선(Screen Line) 조사를 실시한다. 차단선은 분석 지역을 지형지물에 따라 양분하는 선으로, 이 선을 통과하는 실제 관측 교통량과 기종점 조사 결과로부터 도출된 추정 통행량을 비교함으로써 모델의 적합성을 판단한다. 만약 두 수치 사이에 유의미한 차이가 발생할 경우, 표본 오차나 조사 누락을 검토하여 행렬을 재조정한다. 최근에는 모바일 빅데이터나 하이패스 데이터 등 비대면 수집 체계가 발달함에 따라, 노상 조사는 이러한 신규 데이터의 정확도를 검증하는 지면 진실(Ground Truth) 자료로서 그 역할이 재정립되고 있다.
전통적인 가구 통행 실태 조사는 조사원이 직접 가구를 방문하거나 응답자가 자신의 통행 기록을 기억에 의존하여 작성하는 방식으로 이루어져 왔다. 이러한 방식은 통행의 목적과 이용 수단을 상세히 파악할 수 있다는 학술적 장점이 있으나, 막대한 예산과 인력이 소요되며 조사 주기가 길어 급변하는 도시 교통 상황을 실시간으로 반영하기 어렵다는 한계가 있다. 또한, 응답자가 단거리 통행을 누락하거나 시간을 부정확하게 기입하는 회상 편향(recall bias)에 의한 오차가 발생하기 쉽다. 이에 따라 현대 교통 공학 및 도시 계획 분야에서는 빅데이터 기술을 활용하여 비대면으로 기종점 정보를 수집하고 분석하는 체계가 핵심적인 방법론으로 부상하였다.
빅데이터 기반의 비대면 조사 체계는 크게 모바일 통신 데이터, 교통카드 이용 내역, 그리고 글로벌 위치 결정 시스템(Global Positioning System, GPS) 기반의 내비게이션 데이터로 구분된다. 이동통신 데이터는 단말기가 기지국과 교신할 때 생성되는 호 상세 기록(Call Detail Record, CDR)이나 시그널링 데이터를 분석 자료로 활용한다. 이는 특정 지역 내 모든 통신 가입자를 잠재적 표본으로 포함하기 때문에 공간적 커버리지가 매우 넓으며, 유동인구의 거시적인 이동 패턴을 파악하는 데 탁월한 성능을 보인다. 특히 기지국 위치 정보를 시간 순서대로 연결하여 통행의 시작과 끝을 추정함으로써 광역 교통 수요를 산정하는 데 중추적인 역할을 수행한다4).
대중교통 체계 분석에서는 스마트카드(Smart Card) 데이터가 정밀한 기종점 분석의 근간이 된다. 승객이 버스나 지하철을 이용할 때 단말기에 태그하는 정보에는 승하차 지점의 좌표, 정확한 시간, 환승 횟수 및 경로 등이 포함되어 있다. 이를 통해 개별 통행자의 이동 궤적을 초 단위로 재구성할 수 있으며, 이는 대중교통 노선 최적화나 역량 배분, 혼잡도 분석에 직접적인 기초 자료가 된다. 다만, 스마트카드 데이터는 승용차 이용자나 보행자의 통행을 포착하지 못하므로, 도시 전체의 교통량을 파악하기 위해서는 타 데이터 소스와의 데이터 융합(Data Fusion)이 필수적이다.
내비게이션 및 GPS 데이터는 차량의 연속적인 주행 궤적 정보를 제공함으로써 도로망에서의 노선 배정 및 구간별 통행 속도 분석에 강점을 가진다. 차량용 단말기나 스마트폰 애플리케이션을 통해 수집된 고정밀 좌표 정보는 실제 도로의 기하 구조와 결합하여 특정 구간의 교통 혼잡 상태를 실시간으로 진단하게 한다. 이러한 다양한 비대면 데이터들을 통합하여 하나의 완성된 기종점 행렬(Origin-Destination Matrix)을 구축하기 위해서는 수리적인 전수화(expansion) 과정이 수반된다. 특정 구역 $ i $에서 $ j $로 이동하는 추정 통행량 $ T_{ij} $는 수집된 표본 데이터 $ s_{ij} $에 모집단 대비 표본 비율을 반영한 전수화 계수 $ w $를 곱하여 다음과 같이 산출할 수 있다.
$ T_{ij} = %%//%%{k S} w_k s%%//%%{ij, k} $
여기서 $ S $는 분석에 활용된 데이터 소스의 집합을 의미하며, 각 데이터의 특성에 따라 가중치가 조정된다. 이러한 빅데이터 기반 조사 체계는 실시간성에 기반한 동적 교통 할당 모형의 구현을 가능하게 하며, 도시 인프라 구축을 위한 의사결정 속도를 획기적으로 향상시킨다. 그러나 개인의 상세한 이동 경로가 노출될 수 있다는 점에서 개인정보 보호법에 따른 엄격한 비식별화 기술 적용이 요구되며, 데이터 수집 주체별로 상이한 데이터 표준을 통합하는 기술적 거버넌스 구축이 향후 주요 과제로 남아 있다5).
수집된 원시 데이터를 바탕으로 기종점 간의 통행량을 수치화하여 기종점 행렬(Origin-Destination Matrix, 이하 OD 행렬)을 구축하는 과정은 교통 계획의 핵심적인 수리적 토대를 형성한다. OD 행렬은 분석 대상 지역을 분할한 교통 분석 구역(Traffic Analysis Zone, TAZ) 사이의 통행 흐름을 정방 행렬의 형태로 표현한 것이다. 임의의 출발 구역 $ i $에서 도착 구역 $ j $로 이동하는 통행량을 $ T_{ij} $라고 정의할 때, 전체 행렬은 다음과 같은 구조를 갖는다.
$$ \mathbf{T} = \begin{bmatrix} T_{11} & T_{12} & \cdots & T_{1n} \\ T_{21} & T_{22} & \cdots & T_{2n} \\ \vdots & \vdots & \ddots & \vdots \\ T_{n1} & T_{n2} & \cdots & T_{nn} \end{bmatrix} $$
여기서 각 행의 합은 해당 구역에서 발생하는 총 유출 통행량($ O_i $)이 되며, 각 열의 합은 해당 구역으로 유입되는 총 유입 통행량($ D_j $)이 된다. 즉, $ %%//%%{j} T%%//%%{ij} = O_i $와 $ %%//%%{i} T%%//%%{ij} = D_j $라는 기본적인 제약 조건을 만족해야 한다.
기초적인 OD 행렬 구축은 가구 통행 실태 조사와 같은 표본 조사 데이터를 바탕으로 수행된다. 그러나 조사된 데이터는 전체 모집단의 일부에 불과하므로, 이를 전체 인구 및 가구 수에 맞게 확대하는 전수화(Expansion) 과정이 필수적이다. 전수화 계수는 특정 구역의 전체 가구 수를 유효 응답 가구 수로 나눈 값을 기본으로 하며, 노상 면접 조사나 스크린라인(Screen Line) 조사를 통해 관측된 실제 교통량과 비교하여 오차를 보정한다.
구축된 기초 행렬이 현재의 교통 상황을 정확히 반영하지 못하거나 장래의 수요를 예측해야 할 경우, 수리적 보정 기법이 적용된다. 대표적인 기법으로는 성장인자법(Growth Factor Methods)이 있으며, 그 중에서도 프라타법(Fratar Method)이나 반복 비례 적합법(Iterative Proportional Fitting, IPF)이 널리 사용된다. 이러한 기법들은 각 구역의 유출입 합계가 목표 연도의 예측치와 일치할 때까지 행렬의 각 원소를 반복적으로 수정하는 알고리즘을 따른다.
현대 교통 공학에서는 관측된 도로의 교통량 데이터를 역으로 이용하여 OD 행렬을 추정하는 엔트로피 극대화 모형(Entropy Maximization Model)이 정교하게 발전하였다. 이는 주어진 관측 정보 하에서 가장 발생 확률이 높은 행렬을 찾는 통계적 접근법이다. 엔트로피 극대화 방법은 정보 이론을 기반으로 하며, 다음과 같은 목적 함수를 극대화하는 방향으로 최적화를 수행한다6).
$$ \text{Maximize } S = -\sum_{i} \sum_{j} (T_{ij} \ln T_{ij} - T_{ij}) $$
이 과정에서 가변스텝상수 등을 도입하여 수렴 속도와 정확도를 향상시키는 연구가 지속적으로 이루어지고 있다7). 또한, 기종점 행렬의 보정 기법은 단순히 총량을 맞추는 것을 넘어, 중력 모형(Gravity Model)의 한계를 극복하기 위해 구역 간 교차 통행 특성을 반영하는 보정 계수를 추정하는 방향으로도 전개된다8).
주요 기종점 행렬 보정 및 추정 기법의 특성을 비교하면 다음과 같다.
| 구분 | 주요 원리 | 장점 | 단점 |
|---|---|---|---|
| 성장인자법 | 현재의 통행 패턴이 미래에도 유지된다고 가정하고 성장률을 곱함 | 계산이 간편하고 직관적임 | 신규 개발 구역 등의 패턴 변화를 반영하지 못함 |
| 반복 비례 적합법 | 행과 열의 합계 제약 조건을 만족할 때까지 반복 계산 | 수학적 수렴성이 보장됨 | 기종점 쌍별 상세 특성 반영에 한계가 있음 |
| 엔트로피 극대화 | 통계적 확률이 가장 높은 행렬 구조를 탐색 | 관측 교통량과의 정합성이 높음 | 계산 복잡도가 높고 목적 함수 설정이 까다로움 |
분석가는 구축된 행렬의 신뢰성을 검증하기 위해 평균 제곱근 오차(Root Mean Square Error, RMSE)나 결정계수($ R^2 $) 등의 통계 지표를 활용한다. 최종적으로 보정된 OD 행렬은 교통 수요 예측의 다음 단계인 수단 분담 및 노선 배정 모형의 입력 자료로 활용되어, 도시 인프라 공급의 적정성을 판단하는 근거가 된다.
기종점 행렬(Origin-Destination Matrix, O-D Matrix)은 특정 지역 내에서 발생하는 교통 흐름의 공간적 분포를 수치화하여 나타낸 정방 행렬(Square Matrix)이다. 이 행렬은 교통 분석 구역(Traffic Analysis Zone, TAZ) 간의 통행 체계를 체계적으로 구조화한 것으로, 교통 수요 예측의 두 번째 단계인 통행 분포 분석에서 핵심적인 데이터로 활용된다.
기종점 행렬의 수학적 구조에서 각 행(Row)과 열(Column)은 분석 대상 지역을 분할한 개별 교통 분석 구역을 의미한다. 전체 구역의 수가 $n$개일 때, 행렬 $T$는 $n \times n$의 크기를 가지며, 임의의 성분 $T_{ij}$는 기점(Origin) $i$구역에서 출발하여 종점(Destination) $j$구역에 도착하는 통행량을 나타낸다. 여기서 행의 인덱스 $i$는 통행의 시작점을, 열의 인덱스 $j$는 통행의 끝점을 상징하므로, 행렬의 각 행은 특정 구역에서 외부로 유출되는 통행의 분포를, 각 열은 특정 구역으로 유입되는 통행의 집중도를 보여준다.
행렬의 각 성분이 지니는 수리적 특성 중 가장 중요한 것은 비음수성(Non-negativity)이다. 통행량은 물리적인 이동 횟수를 의미하므로 모든 성분 $T_{ij}$는 0 이상의 실수를 가져야 한다. 또한, 일반적인 기종점 행렬은 비대칭 행렬(Asymmetric Matrix)의 특성을 띤다. 이는 특정 시간대나 목적에 따라 $i$에서 $j$로 이동하는 수요와 $j$에서 $i$로 돌아오는 수요가 일치하지 않기 때문이다. 예를 들어, 오전 첨두시(Peak hour)에는 주거 지역에서 업무 지구로 향하는 통행량이 반대 방향보다 압도적으로 많아 $T_{ij} \gg T_{ji}$의 형태를 보이게 된다.9)
행렬의 대각 성분(Diagonal Elements)인 $T_{ii}$는 기점과 종점이 동일한 구역 내에서 완결되는 내부 통행(Intra-zonal travel)을 의미한다. 대각 성분의 크기는 해당 분석 구역의 지리적 면적과 토지 이용 밀도에 결정적인 영향을 받는다. 구역의 크기가 클수록 내부에서 발생하는 단거리 통행이 외부에 노출되지 않고 $T_{ii}$에 포함될 확률이 높으며, 구역을 세분화할수록 대각 성분의 비중은 줄어드는 경향이 있다. 교통 모델링 과정에서는 구역 간 이동만을 분석 대상으로 삼는 경우가 많아, 필요에 따라 대각 성분을 0으로 처리하거나 별도의 보정 과정을 거치기도 한다.
기종점 행렬의 주변합(Marginal Sum)은 각 구역의 총 통행 특성을 요약한다. 특정 행 $i$의 모든 성분을 합산한 값은 해당 구역에서 발생하는 총 발생 통행량(Trip Production)이 되며, 특정 열 $j$의 모든 성분을 합산한 값은 해당 구역으로 유입되는 총 도착 통행량(Trip Attraction)이 된다. 이를 수식으로 나타내면 다음과 같다.
$$P_i = \sum_{j=1}^{n} T_{ij}$$ $$A_j = \sum_{i=1}^{n} T_{ij}$$
여기서 $P_i$는 구역 $i$의 발생 통행량, $A_j$는 구역 $j$의 도착 통행량이다. 행렬 전체 성분의 총합은 해당 교통 체계 내의 총 통행량(Total Trips)과 일치해야 하며, 이는 시스템의 보존 법칙을 만족하는 기초적인 데이터 검증 지표가 된다.
현대 도시 교통 분석에서 기종점 행렬은 희소 행렬(Sparse Matrix)의 특성을 강하게 나타낸다. 교통 분석 구역이 수천 개 이상으로 세분화됨에 따라 실제 통행이 거의 발생하지 않는 구역 쌍이 기하급수적으로 증가하기 때문이다. 이러한 희소성은 데이터 수집 과정에서의 표본 오차를 증폭시킬 수 있으며, 이를 해결하기 위해 비음수 행렬 분해(Non-negative Matrix Factorization)나 엔트로피 극대화 모형과 같은 고도화된 데이터 보정 기법이 적용된다.10)
교통 조사, 특히 가구 통행 실태 조사는 예산과 시간의 제약으로 인해 전체 가구를 대상으로 하는 전수 조사가 아닌 표본 조사(Sampling Survey) 형태로 수행된다. 따라서 수집된 표본 데이터를 바탕으로 분석 대상 지역 전체의 통행 특성을 파악하기 위해서는 표본을 모집단(Population)으로 확대하는 전수화(Expansion) 과정이 필수적이다. 전수화는 표본의 대표성을 확보하고 실제 교통 현상을 수치적으로 재현하기 위한 수리적 절차를 의미한다.
전수화 과정의 핵심은 전수화 계수(Expansion Factor)를 산출하는 것이다. 전수화 계수는 표본 하나가 대표하는 모집단의 개체 수를 의미하며, 가장 단순한 형태인 단순 무작위 추출법에서는 전체 가구 수를 유효 표본 가구 수로 나눈 값을 사용한다. 그러나 실제 조사에서는 지역적 특성이나 가구 규모, 소득 수준 등을 고려하여 층화 추출법(Stratified Sampling)을 적용하므로, 각 층(Strata)별로 상이한 계수를 산출하여 적용한다. 전수화 계수 $ W_{i} $는 일반적으로 다음과 같은 산식을 통해 결정된다.
$$ W_{i} = \frac{N_{i}}{n_{i}} \times \frac{1}{1 - r_{i}} $$
여기서 $ N_{i} $는 $ i $구역의 모집단 수, $ n_{i} $는 해당 구역의 응답 표본 수, $ r_{i} $는 무응답 또는 불량 표본으로 인한 탈락률을 의미한다. 조사 대상지가 다수의 교통 분석 구역(Traffic Analysis Zone, TAZ)으로 나뉘어 있을 경우, 각 구역의 인구 통계학적 특성을 반영하여 계수를 세분화함으로써 전수화의 정밀도를 높인다.
전수화된 기종점 행렬은 실제 도로상의 교통량과 완벽히 일치하기 어렵다. 이는 조사 과정에서의 응답 누락, 기억 오류, 혹은 전수화 계수 산정 시 사용된 기초 통계의 시차 등에 기인한다. 이러한 오차를 교정하기 위해 스크린라인 조사(Screenline Survey)를 통한 데이터 보정이 수행된다. 스크린라인은 하천이나 철도, 산악 지형 등 통행로가 한정된 지형적 경계선을 설정하고, 해당 선을 통과하는 실제 교통량을 관측하여 전수화된 통행량과 비교하는 기법이다. 관측 교통량과 전수화 통행량 사이에 유의미한 차이가 발생할 경우, 전체 행렬의 원소들에 보정 계수를 곱하여 실제 관측치에 근사시킨다.
행렬의 균형을 맞추기 위한 수리적 기법으로는 반복 비례 보정법(Iterative Proportional Fitting, IPF)이 널리 활용된다. 이는 행렬의 행 합계(기점 발생량)와 열 합계(종점 도착량)가 사전에 정의된 주변 합계(Marginal Totals)와 일치할 때까지 각 원소를 반복적으로 조정하는 알고리즘이다. 또한 최소제곱법(Least Squares Method)이나 최대우도법(Maximum Likelihood Estimation)을 활용하여 관측치와 추정치 사이의 잔차를 최소화하는 최적화 과정을 거치기도 한다.
보정 과정의 마지막 단계에서는 통계적 검증을 통해 데이터의 신뢰성을 평가한다. 결정계수($ R^{2} $)나 평균 제곱근 오차(Root Mean Square Error, RMSE)를 산출하여 관측 교통량과 보정된 기종점 통행량 간의 상관관계를 분석한다. 특히 상대 평균 제곱근 오차(Percent Root Mean Square Error, %RMSE)는 통행량이 적은 구간과 많은 구간의 오차를 상대적으로 비교할 수 있게 하여 전체적인 모델의 적합도를 판단하는 지표로 사용된다. 이러한 체계적인 전수화 및 보정 과정을 거친 후에야 기종점 데이터는 교통 수요 예측 모델의 신뢰할 수 있는 기초 자료로서의 가치를 지니게 된다.
기종점 행렬 추정(Origin-Destination Matrix Estimation, ODME)은 직접적인 설문 조사나 전수 조사를 시행하지 않고, 도로망의 특정 지점에서 관측된 교통량(Traffic counts) 데이터를 활용하여 미지의 통행 수요를 수리적으로 역산하는 기법이다. 전통적인 기종점 조사는 막대한 비용과 시간이 소요될 뿐만 아니라 데이터의 현행성을 유지하기 어렵다는 한계가 있다. 이에 따라 상대적으로 수집이 용이하고 실시간 확보가 가능한 링크(Link) 교통량을 기반으로 기종점 간의 통행 흐름을 추정하는 모형이 교통 공학의 핵심 연구 분야로 발전하였다.
기종점 행렬 추정의 수리적 기초는 관측된 링크 교통량과 기종점 통행량 사이의 선형 관계식에 근거한다. 분석 대상 네트워크의 특정 링크 $ a $에서 관측된 교통량을 $ v_a $, 기점 $ i $에서 종점 $ j $로 이동하는 통행량을 $ T_{ij} $라고 할 때, 이들의 관계는 다음과 같이 정의된다.
$$ v_a = \sum_{i} \sum_{j} T_{ij} p_{ij}^a $$
여기서 $ p_{ij}^a $는 기종점 쌍 $ (i, j) $ 사이를 이동하는 통행자 중 링크 $ a $를 통과하는 통행자의 비율을 의미하며, 이는 통행 배정(Trip Assignment) 모델을 통해 결정된다. 일반적으로 관측 가능한 링크의 수보다 추정해야 할 기종점 쌍의 수가 훨씬 많기 때문에, 이 문제는 해가 유일하지 않은 부정 정식(Underdetermined problem)의 특성을 갖는다. 이러한 불완전한 정보 하에서 가장 정합성 있는 해를 찾기 위해 정보 이론(Information theory)에 근거한 엔트로피 극대화 모형이 주로 사용된다.
엔트로피 극대화(Entropy Maximization) 모형은 주어진 제약 조건을 만족하면서 통행 분포의 불확실성 혹은 무작위성을 나타내는 엔트로피를 최대화하는 행렬을 찾는 방식이다. 이는 관측된 교통량 데이터와 일치하면서도, 추가적인 편견(Bias)을 배제한 가장 확률 높은 통행 패턴을 선택한다는 논리적 근거를 가진다. 윌슨(A. G. Wilson)과 윌럼슨(L. G. Willumsen) 등에 의해 체계화된 이 모형의 목적함수는 다음과 같은 형태를 취한다. 11)
$$ \text{maximize } Z = -\sum_{i} \sum_{j} (T_{ij} \ln T_{ij} - T_{ij}) $$
상기 목적함수를 관측 교통량 제약 조건 하에서 라그랑주 승수법을 통해 최적화하면, 기종점 통행량은 각 링크의 관측 오차와 통행 경로 특성이 반영된 지수 함수 형태로 도출된다. 만약 과거의 기종점 행렬이나 별도의 사전 정보(Prior information)가 존재하는 경우에는, 기존 행렬과의 차이를 최소화하면서 관측 교통량을 만족시키는 최소 정보 편차(Minimum Information Deviation) 모형으로 확장하여 적용할 수 있다.
엔트로피 기반 접근법 외에도 통계학적 관점에서의 추정 모형들이 존재한다. 최소자승법(Least Squares Method)은 관측 교통량과 추정된 통행량에 의한 산출 교통량 간의 차이의 제곱합을 최소화하는 방식이다. 또한 최대우도법(Maximum Likelihood Method)은 관측된 교통량이 나타날 확률이 최대가 되도록 행렬 성분을 추정하며, 베이지안 통계학을 응용한 모형은 사전 확률 분포와 관측 데이터를 결합하여 사후 기종점 행렬을 도출한다. 12)
최근의 기종점 행렬 추정 모형은 고정된 교통량을 가정하는 정적 모델을 넘어, 시간의 흐름에 따른 교통 상태의 변화를 반영하는 동적 기종점 행렬 추정(Dynamic OD Estimation, DODE)으로 고도화되고 있다. 이는 지능형 교통 체계(Intelligent Transport Systems, ITS)에서 수집되는 실시간 데이터를 활용하여 단기 교통 수요 예측 및 돌발 상황 관리에 기여한다. 다만, 추정된 행렬의 신뢰도는 링크 교통량 관측 지점의 위치 선정과 통행 배정 모델의 정확도에 크게 의존하므로, 수리적 최적화와 더불어 네트워크의 구조적 특성을 고려한 분석이 병행되어야 한다.
교통 수요 예측은 장래의 교통 시설 확충이나 정책 결정의 근거를 마련하기 위한 핵심적인 과정으로, 이 과정에서 기종점 데이터는 모델의 신뢰도를 결정짓는 가장 기초적인 입력 자료이자 분석의 단위가 된다. 교통 수요 모델링의 표준적 체계인 4단계 추정법(Four-Step Model)은 통행 발생, 통행 분포, 수단 분담, 노선 배정의 순차적 단계를 거치며, 각 단계는 기종점 데이터를 생성, 가공, 또는 할당하는 과정으로 정의될 수 있다. 따라서 기종점 데이터는 단순한 통계치를 넘어 도시 공간 구조 내에서의 인간 활동과 이동 패턴을 수리적으로 연결하는 매개체 역할을 수행한다.
첫 번째 단계인 통행 발생(Trip Generation) 단계에서는 각 교통 분석 구역(Traffic Analysis Zone, TAZ)의 인구, 고용 위상, 토지 이용 특성 등 사회경제적 지표를 바탕으로 해당 구역에서 발생하는 총 통행 유출량과 유입량을 산정한다. 이 단계에서 확정된 구역별 총량은 이후 기종점 행렬(Origin-Destination Matrix)의 행의 합(기점 합계)과 열의 합(종점 합계)을 규정하는 제약 조건이 된다. 즉, 통행 발생 단계는 기종점 데이터의 외곽 합계를 결정함으로써 전체적인 수요의 규모를 확정하는 기초 작업이다.
두 번째 단계인 통행 분포(Trip Distribution) 단계는 통행 발생 단계에서 산출된 유출·유입 총량을 각 구역 간의 구체적인 통행 쌍으로 연결하는 과정이다. 이 단계에서 비로소 완전한 형태의 기종점 행렬이 구축된다. 가장 널리 활용되는 수리 모델은 중력 모형(Gravity Model)으로, 두 구역 간의 통행량은 각 구역의 통행 강도에 비례하고 구역 간의 통행 저항(Travel Impedance)에 반비례한다는 원리를 따른다. 이를 수식으로 표현하면 다음과 같다.
$$ T_{ij} = K \cdot \frac{P_i^\alpha \cdot A_j^\beta}{d_{ij}^\gamma} $$
여기서 $ T_{ij} $는 기점 $ i $에서 종점 $ j $로의 통행량이며, $ P_i $와 $ A_j $는 각각 기점의 발생량과 종점의 흡수량을 의미한다. $ d_{ij} $는 거리나 비용과 같은 통행 저항이며, $ K, , , $는 지역적 특성을 반영하는 매개변수이다. 이 과정을 통해 정교화된 기종점 행렬은 장래 도시 내 이동의 방향성과 강도를 구체적으로 명시하게 된다.
세 번째 단계인 수단 분담(Modal Split) 단계에서는 기종점 간의 통행 수요가 승용차, 버스, 지하철 등 구체적인 교통 수단별로 분리된다. 통행자는 기종점 사이의 통행 시간, 비용, 편리성 등을 고려하여 효용이 극대화되는 수단을 선택하게 되며, 이는 주로 로짓 모형(Logit Model)과 같은 확률적 선택 모델을 통해 분석된다. 수단 분담 결과에 따라 하나의 통합된 기종점 행렬은 수단별 기종점 행렬로 세분화되며, 이는 특정 교통 인프라의 수요를 예측하는 직접적인 근거가 된다.
마지막 단계인 노선 배정(Traffic Assignment) 단계는 수단별로 분담된 기종점 통행량을 실제 가로망이나 철도망에 할당하는 과정이다. 통행자는 기점에서 종점까지 이동할 때 최적의 경로를 선택한다는 사용자 평형(User Equilibrium) 원리에 기초하여, 기종점 수요는 각 구간(Link)의 교통량으로 전이된다. 이 단계가 완료되면 특정 도로 구간의 장래 교통량과 V/C 비율(Volume-to-Capacity Ratio)을 산출할 수 있으며, 이를 통해 병목 구간을 예측하거나 신규 도로 건설의 타당성을 검토할 수 있다. 결과적으로 기종점 데이터는 미시적인 출발지와 목적지의 관계에서 시작하여 거시적인 네트워크 부하 분석에 이르기까지 교통 수요 모델링 전반의 논리적 일관성을 유지하는 핵심 변수이다.13) 14)
교통 수요 예측의 표준적 방법론인 4단계 추정법(Four-Step Model)에서 통행 발생과 통행 분포는 분석 대상 지역의 전체적인 교통 수요 규모와 공간적 흐름을 결정짓는 초기이자 핵심적인 과정이다. 이 단계들은 각 교통 분석 구역(Traffic Analysis Zone, TAZ) 단위로 집계된 사회경제적 지표를 바탕으로, 물리적인 이동의 총량과 그 이동이 향하는 목적지를 수리적으로 규명하는 데 목적을 둔다.
통행 발생(Trip Generation) 단계는 특정 구역에서 발생하는 통행의 총합을 산정하는 과정으로, 크게 ’발생량(Trip Production)’과 ’유입량(Trip Attraction)’으로 구분하여 분석한다. 발생량은 해당 구역 내 거주자의 특성에 기인하며, 인구수, 가구당 자동차 보유 대수, 가구 소득 등 사회경제적 지표와 밀접한 상관관계를 가진다. 반면 유입량은 해당 구역이 가진 토지 이용의 매력도, 즉 고용자 수, 상업 시설의 연면적, 교육 시설의 규모 등에 의해 결정된다. 통행 발생량을 추정하기 위해 주로 사용되는 수리적 모형으로는 회귀 분석(Regression Analysis) 모형과 카테고리 분석(Category Analysis) 모형이 있다. 회귀 분석 모형은 구역별 특성 변수를 독립 변수로, 발생 통행량을 종속 변수로 설정하여 다음과 같은 선형 함수식을 도출한다.
$ P_i = _0 + %%//%%1 X%%//%%{i1} + %%//%%2 X%%//%%{i2} + + %%//%%k X%%//%%{ik} + _i $
여기서 $ P_i $는 구역 $ i $의 통행 발생량이며, $ X_{ik} $는 해당 구역의 $ k $번째 설명 변수, $ $는 각 변수의 영향력을 나타내는 회귀 계수이다. 이 단계를 통해 산출된 결과물은 각 구역이 기점(Origin) 또는 종점(Destination)으로서 가지는 잠재적 통행 능력을 의미하며, 아직 구체적인 목적지와의 연결 관계는 형성되지 않은 상태이다.
통행 분포(Trip Distribution) 단계는 앞서 산출된 각 구역의 발생량과 유입량을 서로 연결하여 구체적인 기종점 쌍(O-D Pair) 사이의 통행량을 배분하는 과정이다. 즉, 구역 $ i $에서 시작된 통행이 어느 구역 $ j $로 얼마만큼 배분되는지를 결정하여 기종점 행렬의 각 셀(Cell) 값을 채우는 작업이다. 통행 분포를 설명하는 가장 대표적인 이론적 틀은 중력 모형(Gravity Model)이다. 이는 뉴턴의 만유인력 법칙을 응용한 것으로, 두 구역 사이의 통행량은 각 구역의 규모(매력도)에 비례하고 두 구역 사이의 거리, 시간, 비용 등 통행 저항(Travel Impedance)에는 반비례한다는 가설에 기반한다. 전형적인 중력 모형의 수식은 다음과 같이 표현된다.
$$ T_{ij} = P_i \frac{A_j F_{ij} K_{ij}}{\sum_{k} A_k F_{ik} K_{ik}} $$
이 식에서 $ T_{ij} $는 구역 $ i $에서 $ j $로 향하는 추정 통행량이며, $ P_i $는 기점 $ i $의 총 발생량, $ A_j $는 종점 $ j $의 유입 매력도이다. $ F_{ij} $는 통행 저항에 따른 마찰 함수(Friction Function)를 의미하며, $ K_{ij} $는 특정 구역 쌍 사이의 특수한 관계를 반영하는 사회경제적 보정 계수이다.
통행 분포 모델링에서 중요한 기술적 쟁점은 기점에서의 유출 합계와 종점에서의 유입 합계가 각각 통행 발생 단계에서 산정된 총량과 일치해야 한다는 점이다. 이를 위해 프라타 모형(Fratar Method)이나 디트로이트 모형(Detroit Method)과 같은 성장률 모형을 활용하여 반복 계산을 수행하거나, 기점과 종점의 제약 조건을 동시에 만족시키는 이중 제약 중력 모형(Doubly Constrained Gravity Model)을 적용한다. 이러한 과정을 거쳐 확정된 통행 분포 결과는 도시 공간 구조 내에서의 통행 패턴을 정량적으로 보여주며, 이후의 수단 분담 및 노선 배정 단계에서 구체적인 교통망 부하를 분석하기 위한 기초 자료로 활용된다. 결국 통행 발생과 분포 단계는 파편화된 구역별 데이터를 유기적인 이동의 흐름으로 전환하는 핵심적인 가교 역할을 수행한다.
확정된 기종점 통행량이 특정 교통 수단에 배분되고 실제 도로망에 할당되는 메커니즘을 다룬다.
분석된 기종점 데이터는 현대 사회의 효율적인 자원 배분과 지속 가능한 도시 발전을 위한 핵심적 의사결정 도구로 활용된다. 기종점 정보는 단순한 이동의 기록을 넘어, 도시 내 인적·물적 자원의 흐름을 규명함으로써 교통 수요 예측의 정밀도를 높이고 공공 및 민간 부문의 전략적 투자를 유도하는 근거가 된다. 특히 빅데이터 분석 기술의 발달로 인해 실시간에 가까운 기종점 파악이 가능해짐에 따라, 과거의 정적 분석 체계는 보다 역동적이고 예측 가능한 정책 수립 체계로 전환되고 있다.15)
도시 및 교통 행정 분야에서 기종점 데이터는 인프라 구축의 우선순위를 결정하는 결정적 지표이다. 정부와 지자체는 기종점 행렬(Origin-Destination Matrix)을 분석하여 통행량이 집중되는 주요 축을 식별하고, 이를 바탕으로 도로의 신설·확장이나 철도망 확충과 같은 광역 교통 개선 대책을 수립한다. 이는 한정된 예산을 투입하여 최대의 교통 혼잡 완화 효과를 거두기 위한 비용 편익 분석의 기초 자료가 된다. 또한, 대중교통 노선의 최적화 과정에서도 기종점 데이터는 필수적이다. 승객의 실제 출발지와 목적지를 분석함으로써 굴곡 노선을 직선화하거나, 수요가 적은 구간을 통폐합하고 수요가 밀집된 구간에 급행 버스나 맞춤형 노선을 도입하는 등 운영 효율성을 극대화할 수 있다.
산업적 측면에서 기종점 데이터의 활용은 물류 네트워크 최적화에서 가장 두드러지게 나타난다. 화물의 발생지와 도착지 정보를 분석하는 화물 기종점(Freight OD) 데이터는 물류 거점인 허브 앤 스포크(Hub-and-Spoke) 시스템의 위치 선정과 배송 경로 설계에 직접적으로 기여한다.16) 물류 기업은 화물 기종점 간의 이동 패턴을 분석하여 최적의 물류 창고 입지를 결정하고, 차량 경로 문제(Vehicle Routing Problem, VRP)를 해결함으로써 유류비와 운송 시간을 절감한다. 특히 택배 산업과 같은 소화물 운송 분야에서는 기종점 데이터에 기반한 네트워크 최적화를 통해 분류 효율을 높이고 배송 서비스의 정시성을 확보하는 연구가 활발히 진행되고 있다.17)
스마트 시티 구현과 첨단 교통 체계 운영에 있어서도 기종점 데이터는 중추적인 역할을 수행한다. 실시간 기종점 정보는 수요 응답형 교통(Demand Responsive Transport, DRT) 서비스의 핵심 알고리즘으로 작용하여, 고정된 노선 없이 승객의 호출에 따라 실시간으로 경로를 생성하고 배차하는 유연한 운송 체계를 가능하게 한다. 또한, 도시 전체의 교통 흐름을 제어하는 동적 교통 제어 시스템에서는 기종점 간의 통행 시간 변화를 모니터링하여 신호 주기를 조정하거나 우회 경로를 안내함으로써 도시 전체의 교통 용량을 효율적으로 관리한다.
정책적으로는 사회적 형평성과 환경적 지속 가능성을 평가하는 지표로도 활용된다. 특정 지역의 기종점 데이터를 분석하여 교통 소외 지역을 파악하고, 보편적 이동권 보장을 위한 정책적 개입을 결정할 수 있다. 아울러 기종점 간 통행 거리와 수단 분담률 데이터를 결합하면 교통 부문의 탄소 배출량을 정밀하게 산정할 수 있어, 탄소 중립 실현을 위한 저탄소 교통 체계로의 전환 정책을 뒷받침하는 정량적 근거를 제공한다.
기종점 간 이동 수요가 높은 구간에 도로를 신설하거나 대중교통 노선을 최적화하는 정책 결정 과정을 서술한다.
화물의 기종점 분석을 통해 물류 거점을 배치하고 운송 경로의 효율성을 극대화하는 산업적 응용 방안을 논한다.
현대 스마트 시티(Smart City)의 교통 관리 체계는 과거의 정적인 통계 분석에서 벗어나, 실시간으로 변화하는 도시 유동성을 즉각적으로 반영하는 동적 교통 제어(Dynamic Traffic Control) 체계로 진화하고 있다. 이러한 변화의 중심에는 지능형 교통 체계(Intelligent Transport Systems, ITS)를 통해 수집되는 방대한 데이터를 기반으로 한 동적 기종점 추정(Dynamic Origin-Destination Estimation, DODE) 기술이 자리 잡고 있다. 기존의 기종점 분석이 장기적인 도로 계획이나 대중교통 망 설계를 위해 수년 단위로 갱신되는 정적 데이터에 의존했다면, 스마트 시티 환경에서는 분 단위, 혹은 초 단위로 갱신되는 실시간 기종점 데이터를 활용하여 도시 운영의 효율성을 극대화한다.
실시간 기종점 데이터는 주로 도로변 검지기(Vehicle Detection System, VDS)에서 얻어지는 지점 교통량 데이터와 프로브 차량(Probe Vehicle)의 GPS 궤적 정보, 그리고 모바일 기기의 통신 신호를 융합하여 생성된다. 이렇게 생성된 데이터는 동적 교통 배정(Dynamic Traffic Assignment, DTA) 모델의 핵심 입력 자료가 된다. 수리적 관점에서 동적 기종점 추정은 관측된 교통량 $ y_t $와 미지의 기종점 통행량 $ x_t $ 사이의 관계를 시변(Time-varying) 행렬인 $ A_t $를 통해 다음과 같이 정식화할 수 있다.
$$ y_t = A_t x_t + \epsilon_t $$
여기서 $ _t $는 관측 오차를 의미하며, 분석가는 칼만 필터(Kalman Filter)나 최적화 알고리즘을 사용하여 매 시점 가장 가능성이 높은 기종점 행렬을 추정한다. 최근에는 딥러닝(Deep Learning) 기반의 순환 신경망(Recurrent Neural Network, RNN)이나 그래프 신경망(Graph Neural Network, GNN)을 도입하여 도시 전체의 복잡한 시공간적 패턴을 학습함으로써 추정의 정밀도를 높이는 연구가 활발히 진행되고 있다.
이렇게 확보된 실시간 기종점 정보는 교통 신호 제어 시스템의 지능화를 가능하게 한다. 전통적인 신호 제어가 특정 교차로의 점유율에 기반하여 신호 주기를 조정했다면, 스마트 시티의 동적 신호 제어는 도시의 기종점 수요 흐름을 예측하여 혼잡이 예상되는 구간의 유입량을 선제적으로 조절하는 거시적 제어 전략을 구사한다. 예를 들어, 특정 지역으로 향하는 통행량이 급증할 것으로 예측되면 배후 도로의 신호 길이를 조정하여 병목 현상을 사전에 분산시키는 방식이다. 이는 도시 전체의 통행 시간을 단축하고 탄소 배출량을 저감하는 등 지속 가능한 교통 체계 구축에 기여한다.
또한, 실시간 기종점 데이터는 수요 응답형 교통(Demand Responsive Transport, DRT)의 운영 최적화에 필수적이다. 고정된 노선과 배차 간격에 따라 운행되는 기존 대중교통과 달리, 수요 응답형 교통은 이용자가 스마트폰 앱 등을 통해 입력한 기점과 종점 정보를 실시간으로 수집하여 차량의 경로를 유연하게 생성한다. 이때 다수의 이용자로부터 발생하는 개별 기종점 쌍을 실시간으로 군집화(Clustering)하고, 차량의 현재 위치와 잔여 좌석을 고려하여 최적의 합승 경로를 계산하는 알고리즘이 작동한다. 이러한 체계는 모빌리티 서비스(Mobility as a Service, MaaS) 플랫폼 내에서 개인형 이동 수단(Personal Mobility) 및 기존 대중교통과 유기적으로 결합하여, 도시 내 ’퍼스트 마일’과 ’라스트 마일’의 이동 효율을 획기적으로 개선한다.
결과적으로 스마트 시티에서의 기종점 개념은 단순한 물리적 이동의 기록을 넘어, 도시의 수요와 공급을 실시간으로 일치시키는 능동적인 매개체로 기능한다. 실시간 기종점 분석을 통해 구현되는 동적 교통 제어와 수요 응답형 서비스는 도시 거주자의 이동 편의성을 증진시킬 뿐만 아니라, 교통 혼잡으로 인한 사회적 비용을 최소화하는 스마트 시티 운영의 기술적 토대가 된다.