가구통행실태조사(Household Travel Survey)는 특정 지역에 거주하는 가구와 그 가구원을 분석 단위로 설정하여, 이들이 일정 기간(통상 하루) 동안 수행하는 모든 이동 행태를 체계적으로 수집하고 분석하는 통계 조사이다. 이 조사는 단순한 인구 통계나 교통량 관측을 넘어, 이동의 주체인 인간의 사회경제적 속성과 그에 따른 통행의 목적, 수단, 경로 등을 결합하여 파악한다는 점에서 교통공학 및 도시계획의 가장 기초적인 토대를 형성한다. 가구통행실태조사를 통해 확보된 데이터는 개별 가구원이 ‘어디서(출발지)’, ‘어디로(목적지)’, ‘어떤 목적으로’, ‘무엇을 타고’ 이동했는지를 나타내는 기종점(Origin-Destination, O-D) 자료로 가공되어, 국가 및 지방자치단체의 교통 정책 수립을 위한 핵심 지표로 활용된다.
현대적 의미의 교통 계획 수립 과정에서 가구통행실태조사가 차지하는 위상은 절대적이다. 과거의 교통 조사가 특정 지점을 통과하는 차량의 수를 세는 단면적 관측에 의존했다면, 가구통행실태조사는 통행 유발의 근원지인 가구로부터 발생하는 수요의 구조를 파악하는 행태론적 접근을 취한다. 이는 교통수요예측의 정통적 방법론인 4단계 수요예측 모형(Four-Step Model)인 통행 발생, 통행 분포, 수단 선택, 노선 배정 단계를 수행하기 위한 필수적인 입력 자료를 제공한다. 특히 가구원의 소득 수준, 차량 보유 대수, 직업군 등 사회경제적 변수와 통행 행태 간의 상관관계를 분석함으로써, 미래의 도시 구조 변화나 인구 구조 변화에 따른 교통 수요의 변화를 과학적으로 예측할 수 있게 한다.
대한민국에서 가구통행실태조사는 국가통합교통체계효율화법 제12조에 근거하여 실시되는 국가교통조사의 핵심 사업 중 하나로 명시되어 있다1). 법령에 따라 국토교통부 장관은 효율적인 교통체계 구축을 위해 정기적으로 가구통행실태를 조사하여야 하며, 이를 위해 한국교통연구원 내 국가교통DB센터(KTDB)가 조사의 기획과 데이터 검증 및 배포를 주관한다2). 가구통행실태조사는 통계법에 따른 국가 승인통계로서 엄격한 품질 관리를 받으며, 통상 5년 주기의 정기 전국 조사와 그 사이의 보완 조사를 통해 데이터의 시의성을 확보한다. 이러한 법적·제도적 장치는 조사의 신뢰성을 보장하며, 조사 결과가 예비타당성조사나 국가 기간 교통망 계획 등 대규모 재정이 투입되는 국책 사업의 객관적 근거로 기능하게 한다.
결과적으로 가구통행실태조사는 도시의 혈맥인 교통 흐름을 정교하게 이해하고 설계하기 위한 지적 설계도와 같다. 이는 단순히 현재의 혼잡도를 측정하는 것에 그치지 않고, 시민들의 삶의 양식과 이동의 가치를 데이터화하여 보다 효율적이고 지속 가능한 모빌리티 환경을 조성하는 데 목적이 있다. 최근에는 빅데이터 기술의 발전과 더불어 모바일 데이터나 교통카드 이력 등 디지털 기록과의 융합이 시도되고 있으나, 통행의 구체적 목적과 가구 특성을 심층적으로 파악할 수 있는 가구통행실태조사의 고유한 역할은 여전히 교통 학술 및 실무 분야에서 대체 불가능한 위치를 점하고 있다.
가구통행실태조사(Household Travel Survey)는 특정 지역 내에 거주하는 가구를 분석 단위로 설정하여, 가구 구성원들이 하루 동안 수행하는 모든 이동 행태를 체계적으로 파악하는 통계적 조사이다. 이는 교통계획 및 정책 수립을 위한 가장 기초적인 자료를 제공하는 기종점 조사(Origin-Destination Survey)의 일종으로, 단순한 인구 통계를 넘어 개별 경제 주체의 이동 목적과 수단 선택 과정을 심층적으로 분석하는 역할을 수행한다. 해당 조사는 특정 시점의 모집단 전체를 조사하는 전수 조사 방식을 지향하나, 현실적인 비용과 행정적 효율성을 고려하여 대규모 표본 추출을 통한 표본 조사 방식으로 주로 수행된다.
본 조사에서 정의하는 통행(Trip)이란, 특정 목적을 달성하기 위해 출발지에서 목적지까지 이동하는 행위를 의미한다. 학술적으로 통행은 단순히 공간적 위치의 변화만을 뜻하지 않으며, 출발 시각과 도착 시각, 이동 수단, 통행 목적 등의 속성이 결합된 정보의 집합체로 정의된다. 예를 들어, 거주지에서 직장으로 이동하는 행위는 ’출근’이라는 목적을 가진 하나의 통행이 되며, 퇴근 후 귀가하는 과정에서 상점에 들르는 경우 이는 각각 ’쇼핑’과 ’귀가’라는 두 개의 독립된 통행으로 구분된다. 이러한 세분화된 통행 데이터는 도시 내 교통 수요의 발생 원인을 물리적, 기능적으로 이해하는 핵심 지표가 된다.
조사의 분석 단위인 가구(Household)와 가구원은 사회경제적 특성을 공유하는 최소의 의사결정 집단이다. 가구통행실태조사는 가구의 소득 수준, 자동차 보유 대수, 가구원 수와 같은 가구 특성과 가구원 개개인의 연령, 성별, 직업, 소득 등 사회경제적 지표를 함께 수집한다. 이는 특정 인구 집단이 왜 특정 시간에 특정 교통수단을 선택하는지에 대한 상관관계를 분석하기 위함이다. 특히 가구 내에서의 수단 공유나 통행 사슬(Trip Chain) 구조를 파악함으로써, 개별 경제 주체의 행태적 변화가 전체 교통망에 미치는 영향을 예측할 수 있게 한다.
실무적으로 가구통행실태조사는 국가교통DB(National Transport Database, KTDB) 구축의 핵심 구성 요소로 기능하며, 국가교통체계 효율화법 등에 근거하여 주기적으로 시행된다3). 조사된 표본 데이터는 통계적 보정 및 전수화 과정을 거쳐 해당 지역 전체의 통행량으로 확장된다. 이렇게 도출된 기종점 통행량(OD Table)은 교통 수요 예측의 전통적 4단계 모델인 통행 발생, 통행 분포, 수단 선택, 노선 배정의 기초 입력 자료로 활용된다. 따라서 이 조사는 단순한 현황 파악을 넘어 도로, 철도 등 대규모 사회기반시설 투자 우선순위 결정과 대중교통 체계 개편의 타당성을 검토하는 데 결정적인 근거를 제공한다.
가구통행실태조사는 현대적 교통 계획 및 정책 수립의 과학적 토대를 마련하는 데 필수적인 기초 자료를 제공하는 것을 목적으로 한다. 이 조사의 가장 핵심적인 목적은 특정 지역 내 거주하는 가구 구성원들의 일상적인 이동 행태를 파악하여 기종점 통행량(Origin-Destination, O/D) 자료를 구축하는 데 있다. 기종점 통행량은 통행 주체, 시간, 목적, 수단, 기종점 등을 정량적으로 나타내는 지표이며, 이는 교통 수요 예측(Travel Demand Forecasting) 모델링의 가장 중요한 입력 변수가 된다. 특히 전통적인 4단계 수요 예측 모델인 통행 발생, 통행 분포, 수단 선택, 노선 배정의 각 단계를 수행하기 위해서는 개별 가구의 사회경제적 특성과 연계된 정밀한 통행 데이터를 확보해야 한다.
효율적인 교통 인프라 투자와 자원 배분을 위해서도 가구통행실태조사의 필요성은 매우 높다. 대규모 도로 건설이나 철도망 확충과 같은 교통 시설 사업은 막대한 예산이 소요되므로, 사업의 타당성을 객관적으로 검증하는 예비타당성조사 과정에서 신뢰도 높은 기초 데이터가 요구된다. 가구통행실태조사를 통해 확보된 데이터는 현재의 교통 혼잡 지점을 정확히 진단하고, 미래의 통행 수요 변화를 시뮬레이션함으로써 과잉 투자를 방지하고 교통망의 효율성을 극대화하는 근거가 된다. 또한, 대중교통 노선 개편이나 환승 체계 구축 등 이용자 편의와 직결되는 미시적인 정책 수립에서도 개별 통행자의 수단 선택 행태 분석은 정책의 실효성을 높이는 핵심 요소로 작용한다.
사회구조의 변화와 기술 발전에 따른 통행 패턴의 변동을 추적하고 이를 교통 정책에 반영해야 할 필요성 또한 증대되고 있다. 저출산 및 고령화로 인한 인구 구조의 변화, 1인 가구의 증가, 재택근무 및 원격 교육의 확산 등은 과거와는 상이한 통행 행태(Travel Behavior)를 유발한다. 가구통행실태조사는 이러한 사회경제적 지표의 변화가 실제 이동 수요에 어떠한 영향을 미치는지 시계열적으로 분석할 수 있게 한다. 이를 통해 교통 취약 계층을 위한 맞춤형 모빌리티 서비스를 설계하거나, 탄소 중립 실현을 위한 지속 가능한 교통 체계로의 전환을 유도하는 등 복합적인 사회적 요구에 부응하는 정책적 대안을 마련할 수 있다.
마지막으로, 가구통행실태조사는 공공 데이터의 개방과 활용 측면에서도 중요한 의의를 지닌다. 조사 결과는 국가교통조사의 일환으로 체계적으로 관리되어 학계의 연구 자료나 민간 부문의 신규 모빌리티 서비스 개발을 위한 기초 정보로 활용된다. 이는 데이터 기반의 행정을 실현하고 교통 산업 전반의 경쟁력을 강화하는 기반을 형성한다. 결국 가구통행실태조사는 단순한 통계 수집을 넘어, 국민의 이동권을 보장하고 사회적 비용을 최소화하며 미래 지향적인 도시 환경을 조성하기 위한 전략적 도구로서의 가치를 지닌다.4)
가구통행실태조사는 대한민국의 교통 정책 수립과 사회경제적 변화 진단을 위한 기초 자료를 확보하기 위해 시행되는 국가승인통계이다. 본 조사는 통계법 제18조에 의거하여 엄격한 품질 관리와 법적 보호를 받으며, 통계청의 승인을 거쳐 공신력을 확보한다. 구체적인 시행의 법적 근거는 국가통합교통체계효율화법 제12조(교통조사의 실시 등) 및 동법 시행령 제11조에 명시되어 있다. 해당 법령은 국토교통부 장관이 효율적인 교통 체계 구축을 위해 전국적인 교통 현황 및 통행 실태를 정기적으로 조사하도록 규정하고 있으며, 가구통행실태조사는 이 중 가장 핵심적인 항목으로 다루어진다.
조사의 주관 기관은 국토교통부이며, 실질적인 조사 기획과 데이터 분석 및 관리는 정부출연연구기관인 한국교통연구원(The Korea Transport Institute, KOTI) 내 국가교통데이터베이스(National Transport Database, KTDB) 센터에서 수행한다. 국가 차원의 전국 가구통행실태조사는 5년 주기로 시행되는 것을 원칙으로 하며, 이는 국가기간교통망계획이나 중기 교통시설 투자계획 등 국가 주요 법정 계획의 수립 주기와 연동된다. 다만 급격한 도시화나 교통 환경의 변화가 발생하는 경우, 보완 조사를 통해 데이터의 현행성을 유지하기도 한다.
수행 체계는 중앙정부와 지방자치단체 간의 긴밀한 협력 구조를 기반으로 한다. 국토교통부는 조사의 전체적인 기본 계획을 수립하고 예산을 확보하며, 한국교통연구원은 표준화된 조사 지침을 마련하고 기술적 지원을 담당한다. 각 지방자치단체는 관할 구역 내에서의 원활한 조사를 위해 행정적 지원을 제공하며, 특히 광역 단위의 교통 문제를 해결하기 위해 대도시권 광역교통위원회나 인접 지자체 간 공동 조사를 시행하는 경우도 빈번하다. 이러한 협력 체계는 조사 결과의 일관성을 확보하고, 지역 간 연계 통행을 정밀하게 분석하기 위한 필수적인 요건이다.
가구통행실태조사를 통해 수집된 데이터는 교통수요예측의 기초가 되는 O-D 구축(Origin-Destination Matrix)의 핵심 입력 자료로 활용된다. 법적 근거에 따라 수집된 개인정보는 통계법 제33조(비밀의 보호)에 의해 철저히 보호되며, 통계 작성 목적 이외의 용도로 사용될 수 없도록 엄격히 제한된다. 이러한 제도적 장치는 조사에 참여하는 가구원들의 응답 신뢰도를 높이는 동시에, 국가 교통 자산의 효율적 배분을 위한 과학적 근거를 마련하는 기반이 된다.
표 1. 가구통행실태조사의 법적 및 행정적 수행 체계 요약 ^ 구분 ^ 내용 ^
| 법적 근거 | 국가통합교통체계효율화법 제12조, 통계법 제18조 |
| 주관 기관 | 국토교통부 (종합 기획 및 예산 편성) |
| 수행 기관 | 한국교통연구원 (국가교통DB센터, 조사 설계 및 분석) |
| 조사 주기 | 5년 (정기 전국 조사 기준) |
| 협력 기관 | 지방자치단체, 관련 통계 전문 조사 기관 |
이와 같은 법적 근거와 체계적인 수행 방식은 가구통행실태조사가 단순한 현황 파악을 넘어, 사회간접자본(SOC) 투자 우선순위 결정이나 탄소중립 실현을 위한 교통 수단 전환 정책 등 고도의 정책적 의사결정을 뒷받침하는 국가적 전략 자산으로서 기능하게 한다. 5)
가구통행실태조사의 설계는 조사 결과가 전체 지역 사회의 통행 행태를 얼마나 정확하게 대변할 수 있는지를 결정하는 핵심적인 단계이다. 조사의 신뢰성을 확보하기 위해서는 통계학적 원리에 기반한 엄밀한 모집단(Population) 정의와 표본 추출(Sampling) 설계가 선행되어야 한다. 가구통행실태조사는 특정 행정 구역 내에 거주하는 모든 가구와 가구원을 모집단으로 설정하며, 이를 구체화하기 위해 인구주택총조사 자료나 주민등록 인구 통계 등을 표집틀(Sampling Frame)로 활용한다. 표집틀의 최신성과 정확성은 조사 결과의 편향(Bias)을 최소화하는 결정적 요인이 된다.
조사의 정밀도를 결정하는 표본 크기(Sample Size)는 설정된 신뢰 수준(Confidence Level)과 허용 오차(Margin of Error)에 따라 수리적으로 산출된다. 일반적으로 가구 통행 특성의 변동성을 고려하여 적정 표본 규모를 결정하며, 모집단의 크기가 충분히 클 경우 다음과 같은 표본 크기 결정 수식을 활용할 수 있다.
$$ n = \frac{Z^2 \cdot P(1-P)}{e^2} $$
위 식에서 $ n $은 필요한 최소 표본 크기, $ Z $는 신뢰 수준에 따른 표준정규분포의 임계값, $ P $는 특정 통행 특성의 추정 비율, $ e $는 허용 오차를 의미한다. 실제 조사 설계에서는 지역별·가구별 특성에 따른 분산을 고려하여 설계 효과(Design Effect)를 추가로 반영함으로써 표본의 효율성을 높인다.
표본 추출 방법론에 있어서는 단순무작위추출법(Simple Random Sampling)의 한계를 극복하고 표본의 대표성을 강화하기 위해 층화추출법(Stratified Sampling)이 주로 채택된다. 이는 모집단을 지리적 위치, 가구원 수, 주거 형태 등 통행 행태에 유의미한 영향을 미치는 변수를 기준으로 동질적인 여러 개의 층(Strata)으로 나누고, 각 층 내에서 독립적으로 표본을 추출하는 방식이다. 이를 통해 소수 집단의 특성이 누락되는 것을 방지하고 추정치의 정밀도를 향상시킨다. 또한, 조사 효율성을 극대화하기 위해 특정 구역을 추출 단위로 설정하는 집락추출법(Cluster Sampling)이나 여러 단계에 걸쳐 추출을 진행하는 다단계 층화집락추출법이 병용되기도 한다.
추출된 표본 데이터를 바탕으로 모집단의 전체 통행량을 추정하기 위해서는 가중치(Weighting) 산정 및 전수화(Expansion) 과정이 필수적이다. 가중치는 표본이 모집단에서 차지하는 비중의 역수로 정의되는 설계 가중치(Design Weight)를 기본으로 하며, 조사 과정에서 발생하는 무응답을 보정하기 위한 무응답 조정 가중치와 사후적으로 모집단의 분포와 일치시키는 사후 층화 가중치를 결합하여 최종 결정된다. 이러한 통계적 보정 과정을 거친 데이터는 교통 수요 예측 모형의 기초 자료로 활용되어 정책적 의사결정의 객관성을 보장한다.6)
가구통행실태조사의 표본 설계와 모집단 확정은 조사의 신뢰도와 타당성을 결정짓는 가장 기초적이면서도 핵심적인 단계이다. 이 과정은 조사 대상이 되는 전체 집단을 정의하는 모집단 확정, 지리적 경계를 설정하는 공간적 범위 획정, 그리고 통행의 특성을 반영할 수 있는 시간적 범위 설정으로 구분된다.
모집단(Population)은 조사의 결과가 적용되는 대상 전체를 의미하며, 가구통행실태조사에서는 특정 지역 내에 거주하며 독립적인 가계 경제를 영위하는 모든 가구와 그 가구원을 지칭한다. 이때 상주인구(De jure population)를 기준으로 모집단을 정의하는 것이 일반적이나, 목적에 따라 유동인구나 주간인구를 보조적으로 고려하기도 한다. 모집단을 명확히 하기 위해서는 표본틀(Sampling frame)의 확보가 필수적인데, 대한민국에서는 주로 통계청의 인구주택총조사 자료나 행정안전부의 주민등록망을 활용하여 표본 추출의 근거가 되는 목록을 작성한다.
공간적 범위(Spatial scope)는 교통 행정의 영향력과 통행의 완결성을 고려하여 설정한다. 일반적으로 시·군·구와 같은 행정구역 단위를 기본으로 하되, 실제 통행이 빈번하게 발생하는 도시권이나 수도권 전체를 하나의 조사 권역으로 묶어 설정하기도 한다. 이는 통행의 시점과 종점이 조사 범위 내에 포함되어야 정확한 통행분포(Trip distribution) 분석이 가능하기 때문이다. 공간적 범위가 결정되면 이를 다시 세부적인 교통분석존(Traffic Analysis Zone, TAZ)으로 분할하여 데이터의 공간적 해상도를 높이며, 이는 향후 교통 수요 예측 모델의 기초 단위가 된다.
시간적 범위(Temporal scope)는 통행의 일상성과 규칙성을 포착하기 위해 설정된다. 가구통행실태조사는 주로 평일의 일반적인 통행 행태를 파악하는 것을 목적으로 하므로, 월요일과 금요일, 그리고 주말과 공휴일을 제외한 화요일, 수요일, 목요일 중 하루를 조사 기준일로 정하는 경우가 많다. 이는 월요일과 금요일의 경우 주말과 인접하여 비일상적인 통행이 섞일 가능성이 크기 때문이다. 또한, 계절적 변동을 최소화하기 위해 기상 조건이 안정적이고 방학이나 휴가철을 피한 시기에 조사를 수행하는 것이 원칙이다.
표본 설계의 핵심은 모집단의 특성을 최소한의 비용으로 최대한 정확하게 추정하는 데 있다. 이를 위해 층화추출법(Stratified sampling)이 널리 사용된다. 층화추출법은 모집단을 가구 규모, 소득 수준, 거주 형태 등 통행 특성에 영향을 미치는 변수에 따라 몇 개의 층(Strata)으로 나누고, 각 층에서 독립적으로 표본을 추출하는 방식이다. 표본 크기 $ n $은 허용 오차 $ d $, 신뢰 수준에 따른 임계값 $ z $, 그리고 모집단의 분산 $ ^2 $을 고려하여 다음과 같은 기본 수식을 통해 산출할 수 있다.7)
$$n = \frac{z^2 \sigma^2}{d^2}$$
실제 조사에서는 응답 거절이나 부재 가구를 고려하여 산출된 표본 수보다 일정 비율(Over-sampling)만큼 더 많은 표본을 추출하며, 최종적으로 수집된 데이터에는 모집단의 구조와 일치시키기 위한 가중치(Weighting) 부여 과정이 뒤따른다. 특히 가구통행실태조사에서는 가구원 수나 자동차 보유 여부와 같은 사회경제적 특성이 표본에 치우침 없이 반영되었는지 검토하여 전수화(Expansion) 과정을 거친다.8) 이러한 정교한 표본 설계와 모집단 확정 과정은 조사 결과가 실제 교통 수요를 정확히 대변할 수 있게 하는 통계적 담보가 된다.
가구통행실태조사의 신뢰성을 확보하기 위한 표본 추출(Sampling) 과정은 전체 모집단(Population)의 통행 특성을 최소한의 비용과 노력으로 정확하게 추정하는 것을 목적으로 한다. 가구통행실태조사는 조사 지역 내의 모든 가구를 전수 조사하는 것이 현실적으로 불가능하므로, 통계학적 원리에 입각하여 대표성을 갖는 표본을 선정하는 설계 과정이 필수적이다. 이를 위해 일반적으로 사용되는 방법론은 확률 추출법(Probability sampling)에 기반한 층화 다단계 집락 추출법(Stratified Multi-stage Cluster Sampling)이다.
표본 설계의 첫 단계는 모집단을 서로 겹치지 않는 여러 개의 집단으로 나누는 층화추출법(Stratified Sampling)이다. 가구통행실태조사에서 층화는 주로 지리적 경계인 행정 구역(시·군·구)을 1차 기준으로 삼으며, 필요에 따라 주택 유형(아파트, 단독주택 등)이나 가구원 수와 같은 사회경제적 변수를 추가적인 층화 지표로 활용한다. 층화를 통해 각 집단 내의 동질성을 높이고 집단 간의 이질성을 반영함으로써, 단순 무작위 추출보다 낮은 표본 오차(Sampling error)로 모집단의 특성을 정밀하게 추정할 수 있다.
지리적으로 분산된 가구를 효율적으로 조사하기 위해 집락추출법(Cluster Sampling)이 병행된다. 이는 통계청의 인구주택총조사에서 정의된 조사구(Enumeration District)를 기초 단위(Primary Sampling Unit, PSU)로 설정하여, 선정된 조사구 내의 모든 가구 또는 일부 가구를 조사하는 방식이다. 조사원이 특정 지역에 집중하여 조사를 수행할 수 있으므로 시간과 비용을 크게 절감할 수 있는 장점이 있다. 다만, 집락 내 가구 간의 유사성으로 인해 발생하는 설계 효과(Design effect)를 고려하여 적절한 표본 크기를 조정해야 한다.
표본 크기 $ n $의 결정은 조사의 정밀도와 직결된다. 일반적으로 허용 오차(Margin of error)와 신뢰 수준(Confidence level)을 바탕으로 다음의 수식을 활용하여 산출한다.
$$ n = \frac{Z^2 \cdot p(1-p)}{d^2} $$
여기서 $ Z $는 신뢰 수준에 따른 표준 정규 분포 값, $ p $는 예상되는 응답 비율, $ d $는 허용 오차를 의미한다. 실제 조사에서는 유한 모집단 수정 계수를 적용하거나, 조사 거절 및 부재로 인한 누락을 대비하여 산출된 표본 수보다 일정 비율(Over-sampling)을 추가하여 표본 프레임을 구성한다.
최종적으로 추출된 표본 데이터는 모집단의 구조와 일치시키기 위한 가중치(Weighting) 산정 과정을 거친다. 조사 과정에서 발생하는 무응답 편향을 보정하고, 특정 계층이 과소 또는 과다 대표되는 문제를 해결하기 위해 사후 층화(Post-stratification) 기법을 적용한다. 이러한 체계적인 표본 추출 방법론은 가구통행실태조사 결과가 도시 및 지역 교통 모델링의 기초 자료로서 공신력을 갖게 하는 핵심적 토대가 된다. 9)
가구통행실태조사(Household Travel Survey)의 항목 구성은 교통 수요 예측 모델의 정립과 교통 정책 수립에 필요한 기초 자료를 확보하기 위해 체계적으로 설계된다. 조사 내용은 크게 가구의 일반 현황을 파악하는 가구 특성 항목, 가구원 개개인의 인적 속성을 다루는 개인 특성 항목, 그리고 특정 조사 일의 이동 궤적을 기록하는 통행 특성 항목으로 구분된다. 이러한 데이터의 유기적 결합을 통해 사회경제적 지표와 통행 행태 간의 상관관계를 분석하며, 이는 최종적으로 수요 분석의 가중치 산정과 전수화 과정의 기초가 된다.
가구 특성 항목은 통행 발생의 근원이 되는 가구 단위의 환경적 요인을 조사한다. 주요 항목으로는 가구원 수, 가구 소득 수준, 자동차 보유대수, 거주 형태 등이 포함된다. 가구 소득은 통행의 빈도와 교통수단 선택에 결정적인 영향을 미치는 변수이며, 자동차 보유 여부는 승용차 이용 확률을 결정짓는 핵심 지표로 작용한다. 특히 최근에는 가구 내 전동 킥보드나 전기 자전거와 같은 퍼스널 모빌리티(Personal Mobility) 보유 현황을 추가하여 변화하는 교통 환경을 반영하기도 한다. 이러한 가구 단위의 데이터는 통행 발생(Trip Generation) 단계에서 가구 유형별 발생 원단위를 산출하는 데 필수적이다.
개인 특성 항목은 가구에 속한 개별 구성원의 인구통계학적 속성과 사회적 지위를 파악하는 데 중점을 둔다. 성별, 연령, 직업, 직장 또는 학교의 소재지, 운전면허 소지 여부 등이 이에 해당한다. 연령과 직업은 통행의 목적과 시공간적 분포를 결정하는 주요 인자로, 예를 들어 경제활동인구는 주로 출퇴근 통행을 유발하며 고령층은 의료나 여가 목적의 통행 비중이 높게 나타나는 경향이 있다. 또한 개개인의 주 활동지와 거주지 간의 관계는 통행 분포(Trip Distribution) 모델에서 기종점 통행량(Origin-Destination Matrix)을 추정하는 근거가 된다.
통행 특성 항목은 조사 대상자가 하루 동안 수행한 모든 이동을 시간적 순서에 따라 상세히 기록하는 분절적 과정이다. 하나의 통행은 출발지에서 목적지까지 특정한 목적을 달성하기 위한 이동 단위로 정의되며, 각 통행에 대해 출발 및 도착 시각, 출발지와 목적지의 구체적 지명, 통행 목적, 이용 교통수단 등을 조사한다. 통행 목적은 일반적으로 출근, 등교, 업무, 쇼핑, 귀가 등으로 분류하며, 이는 도시 공간 구조 내에서 발생하는 통행 유인과 발생의 동기를 설명한다.
교통수단 선택에 관한 항목에서는 주된 수단뿐만 아니라 환승 과정에서 이용한 모든 보조 수단을 포함하여 조사한다. 여기에는 도보, 자전거, 승용차, 버스, 도시철도 등이 포함되며, 각 수단별 이용 시간과 비용, 환승 횟수 등을 상세히 수집한다. 이러한 자료는 교통수단 선택(Modal Split) 모델에서 수단별 효용 함수(Utility Function)를 추정하는 데 활용된다. 특히 최근의 조사 체계에서는 단순한 수단 분류를 넘어 공유 교통 서비스나 수요응답형 교통(Demand Responsive Transport, DRT)의 이용 여부를 포함함으로써 보다 정밀한 모빌리티 분석을 지향하고 있다.
데이터의 신뢰성을 확보하기 위해 조사 항목의 설계 시 무응답이나 오기입을 방지하기 위한 논리적 검토 과정이 수반된다. 예를 들어, 개별 통행의 도착 시각은 다음 통행의 출발 시각보다 앞설 수 없으며, 모든 통행의 최종 목적지는 대개 귀가로 수렴해야 한다는 통행 연쇄(Trip Chain)의 원리를 적용한다. 이러한 항목 구성과 논리적 체계는 가구통행실태조사가 단순한 통계 조사를 넘어 교통공학 및 도시계획의 과학적 토대를 제공하는 핵심적 수단임을 보여준다.10)
가구통행실태조사에서 가구 및 개인의 사회경제적 특성을 파악하는 것은 통행이 인간의 욕구 충족을 위한 활동에서 비롯되는 파생 수요(Derived Demand)라는 점에 근거한다. 교통 수요는 단순히 공간적 이동만을 의미하는 것이 아니라, 특정 사회경제적 속성을 지닌 주체가 목적을 달성하기 위해 선택한 결과물이다. 따라서 가구 및 개인 특성 항목은 교통 수요 예측 모델의 독립변수로서 통행의 발생 빈도, 목적, 수단 선택 및 시간대별 분포를 결정짓는 핵심적인 지표로 활용된다.
가구 특성 항목은 가구라는 공동체가 공유하는 자원과 제약 조건을 정의한다. 대표적인 항목인 가구 소득은 가구의 경제적 가용 자원을 나타내며, 이는 통행 발생량과 정(+)의 상관관계를 갖는 경우가 많다. 소득 수준이 높을수록 여가 및 쇼핑 통행의 빈도가 증가하며, 시간 가치가 높게 책정되어 상대적으로 고비용인 승용차나 고속 교통수단을 선호하는 경향이 뚜렷하게 나타난다. 자동차 보유 대수는 가구원의 이동성(Mobility)을 직접적으로 규정하는 변수로, 특히 수단 선택 모형에서 승용차 이용 가능성(Car Availability)을 판단하는 결정적 요인이 된다. 이 외에도 가구원 수, 주거 형태, 주택 소유 여부 등은 가구의 생애 주기(Life Cycle)를 반영하며, 이는 해당 가구가 배출하는 전체 통행량의 구조적 특성을 결정한다.
개인 특성 항목은 가구 구성원 개개인의 인적 속성과 경제 활동 상태를 다룬다. 연령과 성별은 생애 주기 단계와 사회적 역할을 상징하며, 이는 통행 목적의 차이로 이어진다. 예를 들어, 청소년층은 등교 통행, 경제활동 연령층은 출근 및 업무 통행, 고령층은 의료 및 친지 방문 통행이 주를 이룬다. 직업과 고용 형태, 산업 분류 등은 통행의 정형성을 규정하는 요소이다. 정규직 근로자의 경우 특정 시간에 고정된 장소로 이동하는 교근 통행(Commuting Trip) 비중이 높으나, 비정형 근로자나 자영업자는 통행 시간과 목적지가 유동적인 특성을 보인다. 또한 운전면허 소지 여부는 개인의 수단 선택 범위를 제한하는 물리적 제약 조건으로 작용한다.
이러한 가구 및 개인의 사회경제적 변수는 통계적으로 통행 발생(Trip Generation) 모형에서 가구별·인별 통행 원단위를 산정하는 기초 자료가 된다. 전형적인 통행 발생 모형인 교차 분류 분석(Cross-classification Analysis)에서는 가구원 수와 가구 소득 등을 기준으로 범주화된 가구 유형별 평균 통행량을 도출한다. 수식으로 표현하면 특정 존(Zone) $ i $에서 발생하는 통행량 $ T_i $는 다음과 같이 가구 특성 $ H $와 개인 특성 $ P $의 함수로 정의될 수 있다.
$$ T_i = \sum_{h} \alpha_h H_{i,h} + \sum_{p} \beta_p P_{i,p} + \epsilon $$
여기서 $ H_{i,h} $는 존 $ i $ 내의 가구 특성 유형별 가구 수, $ P_{i,p} $는 개인 특성 유형별 인구 수이며, $ _h $와 $ _p $는 각 특성이 통행 발생에 미치는 영향력을 나타내는 계수이다. 이러한 분석 과정을 통해 구축된 데이터는 단순한 현황 파악을 넘어, 향후 인구 구조 변화나 소득 증대 등 미래 사회 변화에 따른 교통 수요의 변동을 예측하는 정밀한 기초 토대를 제공한다. 11)
통행 특성 및 행태 항목은 조사 대상자가 하루 동안 수행한 개별 통행(trip)의 물리적, 시간적, 목적적 속성을 상세히 기록하는 단계이다. 통행이란 특정 목적을 달성하기 위해 출발지에서 목적지까지 이동하는 행위의 기본 단위이며, 가구통행실태조사에서는 이를 기종점(origin-destination, OD) 단위로 세분화하여 파악한다. 이 과정에서 수집되는 데이터는 개별 경제 주체의 이동 패턴을 정량화하여 교통수요예측 모델의 정밀도를 결정짓는 핵심적인 입력 변수로 활용된다.
통행의 지리적 속성을 정의하는 출발지와 목적지 정보는 통행의 공간적 흐름을 파악하는 기초 자료이다. 단순히 행정구역 명칭을 기록하는 것에 그치지 않고, 구체적인 지번이나 주요 건물을 식별하여 교통분석존(traffic analysis zone, TAZ) 단위로 부호화한다. 또한 해당 지점의 시설 유형을 주거지, 직장, 학교, 상업시설 등으로 세분화하여 조사함으로써 통행이 발생하는 토지이용의 특성을 분석한다. 이러한 공간 정보는 통행분포(trip distribution) 단계에서 지역 간 통행량을 산정하는 중력 모형(gravity model) 등의 기초 자료가 된다.
시간적 속성은 출발 시각과 도착 시각을 통해 정의된다. 통행시간(travel time) $ T $는 도착 시각 $ t_a $와 출발 시각 $ t_d $의 차이로 산정된다. $$ T = t_a - t_d $$ 이러한 시간 정보는 교통망의 서비스 수준을 평가하는 지표가 된다. 특히 시간대별 통행 분포는 오전과 오후의 첨두시(peak hour)를 식별하게 하며, 이는 도로 및 철도의 용량 설계와 교통운영 전략 수립에 필수적이다. 또한 통행시간은 수단선택(mode choice) 모형에서 시간가치(value of time)를 산정하는 데 중요한 역할을 한다.
통행목적(trip purpose)은 인간 활동의 동기를 규명하는 항목으로, 통행의 유발 원인을 분석하는 데 사용된다. 일반적으로 출근, 등교, 업무, 쇼핑, 여가, 귀가 등으로 분류하며, 이를 통해 통행발생(trip generation)량을 예측한다. 특히 목적지에서의 활동 이후 발생하는 다음 통행과의 연계성을 분석하는 통행사슬(trip chain) 개념은 현대 교통 계획에서 매우 중시된다. 예를 들어 출근길에 자녀를 등교시키거나 쇼핑을 겸하는 다목적 통행 행태는 단순한 단일 통행 분석을 넘어 복잡한 활동기반모델(activity-based model)의 구축을 가능하게 한다.
이용 교통수단(mode of transport) 항목은 통행자가 선택한 이동 수단의 종류를 파악하며, 이는 수단분담률(modal split) 산정의 근거가 된다. 도보, 자전거, 승용차, 버스, 지하철 등 주수단뿐만 아니라 최종 목적지까지 도달하는 과정에서 이용하는 보조수단과 환승(transfer) 횟수, 환승 지점, 대기 시간 등을 상세히 기록한다. 교통수단 선택 행태는 통행 비용, 접근성, 쾌적성 등 다양한 변수에 의해 결정되므로, 이 항목은 대중교통 정책의 효과를 분석하거나 새로운 교통수단 도입의 타당성을 검토하는 데 중요한 기초 자료를 제공한다.
통행 특성 및 행태 항목에 대한 조사는 개별 통행의 시작부터 끝까지를 시공간적으로 재구성하는 과정이다. 이를 통해 구축된 데이터베이스는 기종점 통행량(origin-destination table, OD table)으로 요약되어, 도시 전체의 교통 흐름을 시뮬레이션하고 미래의 교통 수요 변화에 선제적으로 대응하기 위한 과학적 토대가 된다. 개별 행태의 정밀한 파악은 단순한 시설 확충을 넘어, 수요 관리와 이용자 맞춤형 모빌리티 서비스 제공을 위한 지능형 교통 체계(intelligent transport systems, ITS) 구축의 필수 전제 조건이다.
통행 목적의 분류는 가구통행실태조사에서 가장 핵심적인 분석 단위 중 하나로, 개별 통행자가 특정 공간적 이동을 수행하게 된 근본적인 동기를 체계화한 것이다. 교통공학 및 교통 계획의 관점에서 통행은 그 자체로 목적이 되는 것이 아니라, 직장 업무, 교육, 물화 구매 등 특정 활동을 수행하기 위해 발생하는 파생 수요(Derived Demand)로 정의된다. 따라서 통행 목적을 정밀하게 분류하는 것은 통행 발생의 원인을 규명하고, 향후 사회경제적 지표 변화에 따른 교통 수요의 변동을 예측하는 데 필수적인 기초 자료가 된다.
통행 목적은 크게 가정 기반 통행(Home-Based Trip, HB)과 비가정 기반 통행(Non-Home-Based Trip, NHB)으로 대별된다. 가정 기반 통행은 통행의 기점(Origin)이나 종점(Destination) 중 어느 한쪽이 통행자의 거주지인 경우를 의미하며, 비가정 기반 통행은 양단 모두 거주지가 아닌 경우를 말한다. 대한민국 국가교통조사 지침 및 가구통행실태조사에서는 이를 더욱 세분화하여 출근, 등교, 업무, 쇼핑, 여가/오락, 귀가, 기타 등으로 분류한다.
출근(Work) 통행은 경제활동을 목적으로 직장으로 이동하는 행위로, 통상적으로 오전 첨두 시간(Peak Hour)의 교통 수요를 결정짓는 가장 중요한 요인이다. 출근 통행은 발생 시간과 목적지가 고정되어 있어 수요의 가격 탄력성이 낮고, 대중교통 및 도로 용량 설계의 기준이 되는 반복적 통행 특성을 보인다. 등교(Schooling) 통행은 교육 기관으로의 이동을 의미하며, 출근 통행과 함께 오전 첨두 시간대의 교통 혼잡을 가중시키는 주요 원인이 된다. 등교 통행은 방학이나 학기 중 휴교 등의 일정에 따라 계절적 변동성이 크게 나타나는 특징이 있다.
업무(Business) 통행은 직장 이외의 장소에서 직무를 수행하기 위해 이동하는 통행을 의미한다. 이는 주로 일과 시간 중에 발생하며, 기업의 생산성 및 물류 효율성과 밀접한 관련이 있다. 쇼핑(Shopping) 통행과 여가/오락(Leisure/Social) 통행은 재화의 소비나 사회적 교류, 휴식을 목적으로 한다. 이러한 통행은 필수적 통행인 출근이나 등교에 비해 시간대와 장소 선택의 유연성이 높으며, 주말이나 공휴일에 통행량이 급증하는 비정형적 패턴을 보인다.
귀가(Return Home) 통행은 외부 활동을 마치고 거주지로 복귀하는 모든 이동을 포함하며, 전체 통행량 중 단일 목적으로는 가장 큰 비중을 차지한다. 오후 첨두 시간대의 교통 혼잡은 주로 퇴근 및 귀가 통행의 집중으로 인해 발생한다. 그 외에 배웅, 개인 용무, 종교 활동 등은 기타 통행으로 분류되어 관리된다.
이러한 통행 목적별 분류 체계는 교통 수요 예측의 4단계 모델 중 제1단계인 통행 발생(Trip Generation) 단계에서 결정적인 역할을 한다. 각 목적에 따라 통행 발생 유인과 패턴이 다르기 때문에, 분석가는 목적별로 서로 다른 회귀 모델이나 발생 원단위를 적용하여 장래 수요를 산정한다. 또한, 통행 목적은 제3단계인 수단 선택(Mode Choice) 과정에서도 중요한 변수로 작용한다. 예를 들어 출근 통행은 시간 가치가 높게 평가되어 정시성이 확보된 수단을 선호하는 반면, 쇼핑이나 여가 통행은 쾌적성이나 비용에 더 민감하게 반응하는 경향이 있다. 따라서 정밀한 목적 분류는 교통 정책의 효과를 검증하고 효율적인 인프라 투자 계획을 수립하는 데 중추적인 기능을 수행한다.12)
교통수단 선택의 범주는 통행자가 출발지에서 목적지까지 이동하기 위해 이용하는 물리적 매체의 종류를 의미하며, 이는 교통수요예측의 핵심 단계인 수단 분담(Mode Split)을 결정하는 기초 자료가 된다. 가구통행실태조사에서는 통행자가 선택할 수 있는 대안을 체계적으로 분류하여 기록하며, 이는 개별 통행자의 행태적 특성을 파악하고 장래의 교통 시설 공급 규모를 산정하는 데 필수적인 정보를 제공한다. 수단 선택은 단순히 이동 수단의 종류를 파악하는 것에 그치지 않고, 각 수단이 지닌 비용, 시간, 편의성 등의 속성이 통행자의 의사결정에 미치는 영향을 분석하는 근거가 된다.
가구통행실태조사에서 수단 분류는 크게 비동력 수단과 동력 수단으로 구분된다. 비동력 수단(Non-motorized modes)은 도보와 자전거를 포함하며, 이는 주로 단거리 통행이나 대중교통 이용을 위한 접근 및 탈출 통행에서 발생한다. 최근에는 전동 킥보드와 같은 개인형 이동장치(Personal Mobility, PM)가 새로운 교통수단으로 등장함에 따라 이를 별도의 범주로 세분화하여 조사하는 추세이다. 동력 수단은 다시 개인 교통과 대중교통으로 나뉜다. 개인 교통에는 승용차, 택시, 이륜차 등이 포함되며, 대중교통은 버스(시내, 시외, 고속 등)와 철도(지하철, 도시철도, 일반철도, 고속철도 등)를 포괄한다.
현대 도시 교통 체계에서는 기점에서 종점까지 단일 수단만으로 이동하기보다 여러 수단을 조합하는 복합 수단 통행(Multi-modal trip)이 빈번하게 발생한다. 이에 따라 가구통행실태조사에서는 통행의 전 과정을 세부 단계(Trip leg)로 나누어 각 단계에서 이용한 모든 수단과 환승 횟수를 기록한다. 환승은 서로 다른 노선이나 수단 간의 연결성을 의미하며, 대중교통의 경쟁력을 결정짓는 중요한 요소이다. 조사 데이터에는 환승 지점과 환승에 소요된 시간, 지불 비용 등이 포함되어 연계 교통(Feeder Transport) 체계의 효율성을 평가하는 지표로 활용된다.
복합 수단 통행의 경우, 분석의 일관성을 유지하기 위해 하나의 대표 수단을 결정하는 ’주수단(Primary Mode) 결정 원칙’을 적용한다. 일반적으로 주수단은 전체 통행 거리 중 가장 긴 구간을 이동한 수단으로 정의하거나, 수단 간의 위계 구조에 따라 결정한다. 통상적인 위계는 고속철도, 일반철도, 지하철, 버스, 승용차, 택시 순으로 설정되며, 상위 위계의 수단을 하나라도 이용했을 경우 해당 통행의 주수단은 그 상위 수단으로 간주한다. 이러한 원칙은 복잡한 이동 경로를 단순화하여 기종점 통행량(OD) 매트릭스를 구축하는 데 기여한다.
수단 선택의 행태는 수학적으로 확률적 효용 이론(Random Utility Theory)에 기반한 이산 선택 모형(Discrete Choice Model)으로 정식화된다. 통행자 $n$이 대안 수단 $i$를 선택할 확률은 해당 수단이 제공하는 효용(Utility) $U_{in}$에 비례하며, 이는 관측 가능한 결정론적 효용 $V_{in}$과 관측 불가능한 오차항 $\epsilon_{in}$의 합으로 표현된다.
$$U_{in} = V_{in} + \epsilon_{in}$$
여기서 결정론적 효용 $V_{in}$은 통행 시간, 통행 비용, 환승 횟수 등의 변수와 각 변수의 가중치를 나타내는 계수들의 선형 결합으로 구성된다. 가구통행실태조사를 통해 수집된 수단별 이용 실태 데이터는 이 모형의 계수를 추정하는 데 사용되며, 이를 통해 특정 교통 정책(예: 통행료 인상, 지하철 노선 신설)이 수단 분담률에 미치는 영향을 과학적으로 예측할 수 있다.13)
| 대분류 | 중분류 | 소분류 항목 예시 |
|---|---|---|
| 비동력/개인형 | 비동력 수단 | 도보, 자전거 |
| 개인형 이동장치 | 전동 킥보드, 전동 휠 | |
| 개인 교통 | 승용차 | 자가용 운전, 자가용 동승 |
| 기타 개인 교통 | 택시, 이륜차(오토바이) | |
| 대중교통 | 버스 | 시내/마을버스, 시외/고속버스, 전세버스 |
| 철도 | 지하철/도시철도, 일반철도, 고속철도(KTX/SRT) |
교통수단 선택 데이터의 정밀도는 교통 계획의 신뢰성을 좌우한다. 특히 최근에는 공유 경제의 확산으로 인한 카셰어링이나 수요응답형 교통(Demand Responsive Transport, DRT) 등 기존의 이분법적 분류로 정의하기 어려운 새로운 모빌리티 서비스가 등장하고 있다. 따라서 가구통행실태조사는 이러한 변화를 수용할 수 있도록 수단 선택의 범주를 지속적으로 고도화하고 있으며, 이는 단순한 통계 조사를 넘어 미래 모빌리티 전략 수립의 핵심 동력이 된다.14)
가구통행실태조사의 수행 방식은 기술적 진보와 사회적 환경의 변화에 따라 전통적인 대면 조사에서 정보통신기술(ICT)을 융합한 자동화 및 비대면 방식으로 진화해 왔다. 초기에는 조사원이 가구를 직접 방문하여 종이 설문지에 응답을 기록하는 종이 면접 조사(Paper and Pencil Interviewing, PAPI)가 주를 이루었다. 이 방식은 조사원이 응답자와 대면하여 설문의 의도를 상세히 설명할 수 있다는 장점이 있으나, 막대한 예산과 인력이 소요되고 조사원의 주관이 개입될 여지가 있으며 응답자의 기억에 의존하는 회상 오류(Recall Bias)가 발생하기 쉽다는 한계를 지닌다.
1990년대 이후 컴퓨터 보급의 확산과 통신 기술의 발달은 컴퓨터 보조 면접 조사(Computer Assisted Personal Interviewing, CAPI)와 컴퓨터 보조 전화 조사(Computer Assisted Telephone Interviewing, CATI)의 도입을 이끌었다. 이러한 방식은 조사 과정에서 데이터를 즉시 디지털화하여 입력 오류를 줄이고 데이터 정제(Data Cleaning) 시간을 단축하는 효과를 거두었다. 특히 전화 조사는 방문 조사에 비해 비용 효율성이 높고 광범위한 지역의 표본에 접근하기 용이하여 보조적인 조사 수단으로 널리 활용되었다.
2000년대 후반부터는 인터넷의 보편화와 함께 웹 기반 조사(Computer Assisted Web Interviewing, CAWI)가 본격적으로 도입되었다. 웹 기반 조사는 응답자가 편리한 시간에 자율적으로 참여할 수 있어 사생활 보호를 중시하는 현대 사회의 특성에 부합하며, 조사 비용을 획기적으로 절감할 수 있는 대안으로 주목받았다. 최근 한국의 국가교통조사에서는 응답률 저하 문제를 해결하기 위해 대면 조사와 웹 조사를 병행하는 다중 매체 조사(Mixed-mode Survey) 체계를 구축하여 조사의 효율성과 신뢰성을 동시에 확보하려는 노력을 기울이고 있다15).
최근의 가장 혁신적인 변화는 스마트폰과 지구 위치 결정 시스템(Global Positioning System, GPS) 기술을 활용한 모바일 어플리케이션 기반 조사이다. 이는 응답자가 통행 일지를 직접 작성하던 방식에서 벗어나, 스마트폰 센서를 통해 이동 경로, 시간, 수단 등을 자동으로 기록하는 수동적 데이터 수집(Passive Data Collection) 방식으로의 전환을 의미한다. 모바일 기반 조사는 통행의 시종점(Origin-Destination)을 미터(m) 단위로 정밀하게 파악할 수 있고, 짧은 거리의 도보 통행이나 복잡한 환승 행태까지 누락 없이 기록할 수 있다는 점에서 기존 방식의 한계를 극복할 대안으로 평가받는다.
나아가 가구통행실태조사는 빅데이터 기술과의 융합을 통해 실시간성 및 전수성을 강화하는 방향으로 나아가고 있다. 이동통신 기지국 신호 데이터를 기반으로 한 통신 데이터(Call Detail Record, CDR)와 교통카드 이용 내역, 내비게이션 주행 기록 등을 기존의 설문 데이터와 결합하는 방식이 연구되고 있다. 이러한 기술적 진화는 표본 조사가 갖는 통계적 불확실성을 보완하고, 급변하는 모빌리티 환경에 대응할 수 있는 고해상도 교통 정책 수립의 기초를 제공한다16).
가구통행실태조사의 초기 단계부터 표준적인 데이터 수집 체계로 자리 잡은 방식은 조사원이 표본 가구를 직접 방문하여 응답자를 대면하는 기법이다. 이를 가구방문 면접조사(Home Interview Survey, HIS)라고 하며, 교통 수요 예측을 위한 기종점 조사의 가장 원형적인 형태에 해당한다. 이 기법은 조사원이 가구 구성원과 대화하며 설문 문항에 대한 답변을 유도하고, 그 결과를 물리적인 기록 매체에 작성하는 종이 면접 조사(Paper and Pencil Interviewing, PAPI) 방식을 근간으로 발전하였다.
전통적 대면 조사의 수행 절차는 크게 사전 준비, 현장 면접, 사후 검수 단계로 구분된다. 조사원은 우선 선정된 표본 추출 틀에 따라 할당된 가구를 방문하여 조사의 목적과 취지를 설명하고 가구원의 협조를 구한다. 면접이 시작되면 가구주를 대상으로 가구 소득, 자동차 보유 대수, 주거 형태 등 가구 전체의 사회경제적 속성을 먼저 파악한다. 이후 개별 가구원을 대상으로 연령, 직업, 통근 여부 등 개인적 특성을 조사하며, 핵심 과정인 통행일기(Travel Diary) 작성을 안내한다. 통행일기는 조사 대상일 하루 동안 발생한 모든 이동의 기점과 종점, 출발 및 도착 시각, 이동 목적, 이용 교통수단 등을 시계열적으로 기록하는 도구이다.
대면 조사 기법이 지니는 가장 큰 학술적 강점은 데이터의 신뢰성과 정밀도에 있다. 조사원은 전문적인 교육을 받은 숙련자로서, 응답자가 ’통행’의 개념을 오해하여 단거리 도보 이동이나 환승 과정을 누락하지 않도록 현장에서 즉각적인 교정과 보충 설명을 제공할 수 있다. 이는 자기기입식 조사에서 빈번하게 발생하는 비표본 오차(Non-sampling error)를 효과적으로 제어하는 기제이다. 특히 복잡한 통행 사슬(Trip Chain)을 형성하는 현대인의 이동 행태를 파악함에 있어, 조사원의 개입은 데이터의 논리적 일관성을 확보하는 데 결정적인 역할을 한다.
그러나 전통적 대면 조사는 사회적 환경 변화에 따라 여러 구조적 한계에 직면해 있다. 우선 조사 인력의 대규모 투입에 따른 고비용·저효율 구조가 문제로 지적된다. 또한, 조사원의 질문 방식이나 태도에 따라 응답 결과가 왜곡될 수 있는 조사원 편향(Interviewer bias)의 위험이 상존한다. 통계학적으로는 조사의 정밀도를 높이기 위해 표본 크기를 확대해야 하지만, 이에 비례하여 기하급수적으로 증가하는 조사 비용은 국가교통데이터베이스(National Transport Database) 구축 과정에서 예산상의 제약 요인으로 작용한다.
최근에는 사생활 보호 의식의 강화와 1인 가구 및 맞벌이 가구의 증가로 인해 조사원의 가구 방문 자체가 어려워지는 추세이다. 이는 응답률의 급격한 저하와 무응답 오차(Non-response error)의 증대로 이어져, 조사 결과의 대표성을 위협하는 요인이 된다. 이러한 한계를 극복하기 위해 전통적 대면 조사는 점차 정보통신기술을 활용한 보조적 수단과 결합하거나, 응답자가 편리한 시간에 스스로 입력하는 방식으로 보완되고 있다. 그럼에도 불구하고 대면 조사는 여전히 다른 조사 기법들의 정확도를 검증하는 기준점(Ground Truth)으로서의 가치를 지니며, 심층적인 통행 동기 분석을 위한 필수적인 수단으로 간주된다.
정보통신기술(Information and Communication Technology, ICT)의 비약적인 발전과 사생활 보호에 대한 사회적 인식 변화는 가구통행실태조사의 수행 방식을 근본적으로 변화시켰다. 전통적인 가구 방문 면접 조사는 조사원이 가구를 직접 방문하여 응답자의 기억에 의존해 통행 내용을 기록하는 방식으로 진행되었으나, 이는 막대한 예산과 인력이 소요될 뿐만 아니라 응답 거부율의 상승으로 인해 표본의 대표성을 확보하는 데 어려움을 겪어 왔다. 이러한 한계를 극복하기 위해 현대의 조사는 컴퓨터와 모바일 기기를 활용한 디지털 및 비대면 조사 기법을 적극적으로 도입하고 있다.
디지털 조사의 가장 대표적인 형태는 컴퓨터 이용 웹 조사(Computer Assisted Web Interviewing, CAWI)이다. 이는 조사 대상자가 인터넷 브라우저를 통해 제공되는 설문 시스템에 직접 접속하여 자신의 통행 행태를 기입하는 방식이다. CAWI는 조사원과의 대면에서 발생할 수 있는 조사원 편향(Interviewer bias)을 원천적으로 차단하며, 응답자가 편리한 시간에 조사를 수행할 수 있어 응답의 자율성을 보장한다. 특히 지리 정보 시스템(Geographic Information System, GIS) 인터페이스를 웹 설문에 통합함으로써, 응답자가 지도상에서 출발지와 목적지를 직접 선택하게 하여 위치 데이터의 정밀도를 획기적으로 높였다.
컴퓨터 이용 전화 면접(Computer Assisted Telephone Interviewing, CATI) 또한 비대면 조사의 중요한 축을 담당한다. 전문 면접원이 전화를 통해 응답을 수집하고 이를 실시간으로 데이터베이스에 입력하는 이 방식은, 인터넷 기기 사용에 익숙하지 않은 고령층이나 특정 취약 계층의 참여를 유도하여 디지털 격차에 따른 표본 편향을 보완하는 역할을 한다. 또한, 웹 조사에 참여하기로 약속한 가구에 대한 독려나 누락된 응답에 대한 보완 조사를 수행할 때 높은 효율성을 발휘한다.
최근 가장 주목받는 기술적 진보는 스마트폰 및 모바일 애플리케이션을 활용한 조사 기법이다. 이 방식은 스마트폰에 내장된 전지구 위치 파악 시스템(Global Positioning System, GPS), 가속도계(Accelerometer), 와이파이(Wi-Fi) 신호 등을 활용하여 사용자의 이동 궤적을 자동으로 기록하는 수동적 데이터 수집(Passive data collection)을 지향한다. 응답자가 일일이 통행 시각과 장소를 기억해낼 필요가 없으므로, 전통적 방식에서 고질적으로 나타나던 기억 편향(Recall bias)과 단거리 통행 누락 문제를 효과적으로 해결할 수 있다. 수집된 원시 위치 데이터는 기계 학습(Machine Learning) 알고리즘을 통해 통행 수단(도보, 버스, 지하철, 승용차 등)과 통행 목적을 추정하는 과정을 거쳐 정교한 기종점 조사 자료로 변환된다.
디지털 및 비대면 조사의 확산은 데이터의 실시간 검증을 가능하게 하여 조사 품질을 향상시킨다. 응답자가 입력한 통행 시간과 이동 거리 사이의 논리적 모순을 시스템이 즉각적으로 감지하여 재확인을 요청하는 논리 검사(Logic check) 기능은 데이터 정제 과정의 비용을 대폭 절감한다. 다만, 이러한 디지털 기반 조사는 개인의 정밀한 위치 정보를 포함하므로 개인정보 보호법에 따른 엄격한 관리 체계가 요구된다. 이에 따라 수집된 데이터의 비식별화 처리와 데이터 보안 전용 서버의 운영은 현대 가구통행실태조사 설계에서 필수적인 요소로 자리 잡았다.
결과적으로 현대의 가구통행실태조사는 단일한 조사 기법에 의존하기보다, 응답자의 특성과 선호에 맞춰 웹, 전화, 모바일 앱을 혼용하는 하이브리드 조사 체계를 구축하는 방향으로 나아가고 있다. 이러한 다각적 접근은 조사의 효율성을 높이는 동시에, 급변하는 모빌리티 환경 속에서 국민의 이동 행태를 보다 입체적이고 정확하게 파악하는 데 기여하고 있다.17)
가구통행실태조사를 통해 수집된 원시 데이터(Raw Data)는 전수화(Expansion) 과정을 거쳐 모집단의 통행 특성을 대표하는 통계치로 변환된다. 이렇게 가공된 데이터는 교통수요예측의 핵심 입력 자료로 활용되며, 주로 전통적 4단계 모델(Four-step Model)을 통해 분석이 이루어진다. 분석의 첫 단계인 통행발생(Trip Generation) 단계에서는 가구원 수, 자동차 보유 대수, 가구 소득 등 사회경제적 지표와 발생 통행량 간의 관계를 규명한다. 주로 회귀분석(Regression Analysis)을 활용하여 특정 교통분석존(Traffic Analysis Zone, TAZ)에서 발생하는 통행량을 추정하며, 그 함수식은 다음과 같은 일반적인 형태를 띤다.
$$ T_i = \alpha + \beta_1 X_{i,1} + \beta_2 X_{i,2} + \dots + \beta_n X_{i,n} + \epsilon $$
여기서 $ T_i $는 구역 $ i $의 발생 통행량이며, $ X_{i,n} $은 해당 구역의 독립 변수, $ _n $은 회귀 계수를 의미한다. 이러한 분석을 통해 특정 지역의 인구 증가나 경제 성장이 미래의 교통 수요에 미치는 영향을 정량적으로 파악할 수 있다.
이어지는 통행분포(Trip Distribution) 단계에서는 발생한 통행이 어느 목적지로 향하는지를 결정하여 기종점(Origin-Destination, OD) 행렬을 구축한다. 가구통행실태조사에서 수집된 실제 통행 패턴은 중력 모형(Gravity Model)의 매개변수를 추정하는 기준(Ground Truth)이 된다. 중력 모형은 두 구역 간의 통행량이 각 구역의 활동 규모에 비례하고, 이동 거리나 비용과 같은 저항 값에 반비례한다는 가정에 기초한다.
$$ T_{ij} = K \cdot \frac{O_i^\alpha D_j^\beta}{f(c_{ij})} $$
$ T_{ij} $는 구역 $ i $에서 $ j $로의 통행량, $ O_i $와 $ D_j $는 각각 출발지와 목적지의 통행 강도, $ f(c_{ij}) $는 통행 비용에 따른 마찰 함수(Friction Function)를 나타낸다. 조사 데이터는 이 마찰 함수의 형태를 결정하고 지역 간 이동의 공간적 상호작용을 보정하는 데 필수적인 역할을 한다.
수단선택(Mode Choice) 단계에서는 조사 데이터에 포함된 개별 통행자의 선택 행태를 바탕으로 확률적 선택 모형을 구축한다. 특히 로짓 모형(Logit Model)이 널리 사용되는데, 이는 통행자가 여러 교통수단 중 자신의 효용(Utility)을 극대화하는 수단을 선택한다는 합리적 선택 이론에 기반한다. 가구통행실태조사를 통해 얻은 수단별 이용 비중과 소요 시간, 비용 데이터는 효용 함수의 계수를 산출하는 최우추정법(Maximum Likelihood Estimation)의 기초가 된다. 특정 수단 $ i $를 선택할 확률 $ P_i $는 다음과 같이 계산된다.
$$ P_i = \frac{e^{V_i}}{\sum_{j \in C} e^{V_j}} $$
여기서 $ V_i $는 수단 $ i $의 관측 가능한 효용이며, $ C $는 선택 가능한 모든 수단의 집합이다. 이를 통해 새로운 교통수단(예: 도시철도, 자율주행 셔틀) 도입 시 기존 수단으로부터의 전환 수요를 예측할 수 있다.
마지막 노선배정(Traffic Assignment) 단계에서는 선택된 수단별 통행량을 실제 교통망(Transportation Network)에 할당한다. 이 과정에서 가구통행실태조사는 시간대별 통행 집중률이나 목적별 통행 특성을 제공하여, 네트워크상의 혼잡도를 보다 정밀하게 예측할 수 있도록 돕는다. 최근에는 개인의 일과(Activity)를 중심으로 통행을 분석하는 활동기반 모델(Activity-based Model)이 도입되면서, 가구통행실태조사의 개별 가구 및 개인 속성 데이터는 더욱 미시적인 시뮬레이션의 기초 단위로 활용되고 있다. 이러한 모델링 기법은 단순한 시설 확충을 넘어 교통수요관리(Transportation Demand Management, TDM)나 맞춤형 모빌리티 서비스 정책 수립에 유연한 분석 환경을 제공한다.
가구통행실태조사를 통해 수집된 원시 데이터(Raw Data)는 조사 과정에서의 기입 오류, 응답 누락, 표본 추출 틀과 실제 모집단 사이의 괴리 등을 포함하고 있으므로, 이를 직접 교통 모델링에 활용하기에는 한계가 있다. 따라서 수집된 데이터를 체계적으로 정제하고, 표본의 특성을 모집단의 규모로 확대하는 전수화(Expansion) 과정이 필수적으로 요구된다. 이 과정은 데이터의 신뢰성을 확보하고 통계적 유의성을 부여하는 핵심적인 단계이다.
데이터 전처리의 첫 단계는 논리적 오류 검수(Logical Consistency Check)이다. 이는 응답자가 기록한 통행 시간, 거리, 수단, 목적 간의 상관관계를 분석하여 물리적으로 불가능하거나 상식적으로 납득하기 어려운 데이터를 선별하는 작업이다. 예를 들어, 출발 시각이 도착 시각보다 늦게 기록되었거나, 도보 통행의 이동 속도가 시속 20km를 초과하는 경우, 혹은 가구원의 연령이 운전면허 취득 가능 연령 미만임에도 불구하고 승용차 운전자로 기록된 경우 등이 주요 검수 대상이다. 이러한 오류 데이터는 가급적 재확인을 통해 수정하며, 수정이 불가능할 정도로 결측치가 많거나 논리적 모순이 심각한 표본은 분석 대상에서 제외하는 정제(Cleaning) 과정을 거친다.
오류 검수가 완료되면 표본의 대표성을 확보하기 위한 가중치(Weight) 산정 단계에 진입한다. 가구통행실태조사는 대개 층화추출법(Stratified Sampling)을 사용하므로, 각 층(Strata)별로 모집단과 표본의 비율이 상이하게 나타난다. 이를 보정하기 위해 산출되는 전수화 계수(Expansion Factor)는 기본적으로 특정 속성을 공유하는 집단의 모집단 수를 해당 집단의 유효 표본 수로 나눈 값으로 정의된다. 가구별 전수화 계수 $ W_i $는 다음과 같은 기본적인 수식으로 표현될 수 있다.
$$ W_i = \frac{N_h}{n_h} \times \alpha $$
여기서 $ N_h $는 해당 분석 구역(Zone) 또는 층 $ h $의 모집단 가구 수이며, $ n_h $는 조사에 응답한 유효 표본 가구 수이다. $ $는 무응답이나 조사 거절에 따른 편향을 보정하기 위한 조정 계수이다. 단순한 인구 비례뿐만 아니라 가구원 수, 차량 보유 여부, 주거 형태 등 다차원적인 사회경제적 특성을 동시에 고려하기 위해 반복 비례 가중법(Iterative Proportional Fitting, IPF)이 널리 활용된다. 이 기법은 각 변수별 주변 분포(Marginal Distribution)를 모집단의 통계치와 일치할 때까지 반복적으로 계산하여 최적의 가중치를 도출하는 알고리즘이다.
최종적으로 산정된 전수화 데이터는 외부 자료와의 비교를 통해 그 타당성을 검증받는다. 가장 대표적인 방법은 주요 도로 지점에서 실시된 교통량 관측 조사 결과와 가구통행실태조사를 통해 추정된 기종점 통행량(Origin-Destination, O/D)을 비교하는 스크린라인(Screen Line) 검증이다. 조사된 통행량을 네트워크에 배정한 결과가 실제 관측된 교통량과 일정 오차 범위 내에서 일치하는지를 확인하며, 만약 큰 차이가 발생할 경우 전수화 계수를 재조정하거나 통행 발생 및 분포 모형을 수정하는 환류(Feedback) 과정을 수행한다. 최근에는 교통카드 빅데이터나 모바일 신호 데이터를 활용하여 전수화된 데이터의 시공간적 정밀도를 보완하고 검증의 객관성을 높이는 연구가 활발히 진행되고 있다. 18)
가구통행실태조사를 통해 수집된 데이터는 교통 수요 예측(Transportation Demand Forecasting)의 핵심적인 기초 자료로 활용된다. 교통 수요 예측은 장래의 사회경제적 변화에 따른 교통량의 변화를 과학적으로 추정하는 과정이며, 이를 위해 가장 널리 사용되는 방법론은 전통적 4단계 모델(Four-step Model)이다. 이 모델은 통행 발생, 통행 분포, 수단 선택, 노선 배정의 순차적인 단계를 거치며, 각 단계에서 가구통행실태조사로부터 추출된 가구 및 개인의 특성, 통행 행태 변수들이 모형의 매개변수를 추정하는 데 결정적인 역할을 한다.
첫 번째 단계인 통행 발생(Trip Generation)은 특정 분석 대상 지역인 교통 분석 존(Traffic Analysis Zone, TAZ)에서 발생하는 총 통행 유입량과 유출량을 결정하는 과정이다. 가구통행실태조사에서 얻어진 가구원 수, 자동차 보유 대수, 가구 소득, 직업 등의 사회경제적 지표는 통행 발생량을 결정하는 독립변수로 활용된다. 주로 회귀 분석(Regression Analysis)이나 카테고리 분석(Category Analysis) 기법이 적용되며, 특정 존 $i$에서 발생하는 통행량 $P_i$는 다음과 같은 선형 회귀식의 형태로 정립될 수 있다.
$$ P_i = \alpha + \beta_1 X_{1,i} + \beta_2 X_{2,i} + \dots + \beta_n X_{n,i} + \epsilon $$
여기서 $X$는 해당 존의 인구 또는 고용주 수와 같은 변수이며, $\beta$는 가구통행실태조사 데이터를 통해 추정된 계수이다.
두 번째 단계인 통행 분포(Trip Distribution)는 발생한 통행이 어느 존에서 어느 존으로 이동하는지를 결정하여 기종점 통행량(Origin-Destination, O/D) 행렬을 구축하는 과정이다. 이 단계에서는 주로 중력 모형(Gravity Model)이 사용되는데, 이는 두 존 사이의 통행량이 각 존의 규모에 비례하고 거리나 비용과 같은 저항 요소에 반비례한다는 원리를 바탕으로 한다. 가구통행실태조사의 목적지 및 출발지 정보는 실제 통행 패턴을 반영하여 저항 함수(Friction Function)의 매개변수를 보정(Calibration)하는 데 필수적이다.
세 번째 단계인 수단 선택(Modal Split)은 기종점 간의 통행이 어떤 교통수단을 통해 이루어지는지를 예측한다. 이 과정에서는 개별 통행자가 자신의 효용(Utility)을 극대화하는 수단을 선택한다는 개별 행태 모형(Disaggregate Behavioral Model)이 주로 적용된다. 특히 로짓 모형(Logit Model)이 표준적으로 사용되며, 수단 $m$을 선택할 확률 $P_m$은 다음과 같이 정의된다.
$$ P_m = \frac{e^{V_m}}{\sum_{k \in M} e^{V_k}} $$
여기서 $V_m$은 수단 $m$의 효용 함수를 의미하며, 가구통행실태조사에서 조사된 통행 시간, 통행 비용, 환승 횟수 등의 자료가 이 함수를 구성하는 변수로 사용된다. 조사 데이터를 통해 추정된 수단별 선택 특성은 정책 변화에 따른 대중교통 분담률 변화 등을 예측하는 근거가 된다.
마지막 단계인 노선 배정(Traffic Assignment)은 선택된 수단별 통행량을 실제 도로망이나 철도망의 개별 노선에 할당하는 과정이다. 이 단계에서는 통행자들이 자신의 통행 시간을 최소화하려 한다는 워드롭의 원리(Wardrop’s Principle)에 기반한 사용자 평형(User Equilibrium) 개념이 적용된다. 가구통행실태조사의 경로 선택 정보와 실제 관측된 교통량 데이터는 배정 결과의 신뢰도를 검증하고, 도로 용량 증설이나 신설 노선 투입의 효과를 분석하는 데 활용된다.
| 단계 | 주요 분석 내용 | 가구통행실태조사 활용 항목 |
|---|---|---|
| 통행 발생 | 존별 통행 유출·유입량 산정 | 가구원 수, 소득, 차량 보유, 직업 등 |
| 통행 분포 | 기종점(O-D) 간 통행 연결 | 출발지, 목적지, 통행 목적, 저항 계수 |
| 수단 선택 | 교통수단별 분담률 결정 | 이용 수단, 통행 시간, 비용, 환승 정보 |
| 노선 배정 | 네트워크상 최적 경로 할당 | 실제 이동 경로, 통행 시간, 선호 경로 |
이와 같은 4단계 수요 예측 과정은 가구통행실태조사라는 정밀한 표본 자료가 뒷받침될 때 비로소 현실 설명력을 갖는다. 조사 데이터로부터 도출된 통행 특성치는 도시 교통 기본계획 수립, 예비 타당성 조사, 교통 영향 평가 등 국가 및 지자체의 주요 의사결정 과정에서 정량적 판단의 준거가 된다. 19) 20)
전통적인 가구통행실태조사는 가구원의 직접적인 응답에 의존하는 특성상 여러 구조적 한계에 직면해 있다. 가장 대표적인 문제는 응답 편향(response bias)과 회상 편향(recall bias)이다. 조사 대상자가 과거의 통행 기록을 기억해내는 과정에서 단거리 통행이나 비정형적인 목적의 통행을 누락하는 경우가 빈번하며, 이는 전체 통행량의 과소추정으로 이어진다. 또한, 개인정보 보호 의식이 강화됨에 따라 조사 거부율이 상승하고 있으며, 이는 표본의 대표성을 확보하는 데 막대한 비용과 행정적 노력을 요구하게 만든다. 특히 5년 주기로 시행되는 대규모 전수조사 방식은 급격한 도시화나 모빌리티 환경의 변화를 적시에 반영하지 못하는 시의성 부족 문제를 안고 있다.
사회구조의 변화 역시 기존 조사의 한계를 심화시킨다. 1인 가구의 급증과 고령화 사회로의 진입은 과거의 표준적인 가구 통행 행태와는 이질적인 양상을 보이며, 공유 경제의 확산에 따른 개인형 이동수단(Personal Mobility, PM) 및 수요응답형 교통(Demand Responsive Transport, DRT)의 등장은 기존의 설문 항목만으로는 포착하기 어려운 비정형적 통행을 양산하고 있다. 이러한 한계를 극복하기 위해 최근 교통계획 분야에서는 빅데이터 기술과의 융합을 통한 조사 체계의 혁신을 도모하고 있다.
미래의 가구통행실태조사는 디지털 발자국(digital footprint)을 활용한 데이터 보정 및 상시 조사 체계로 진화할 전망이다. 모바일 빅데이터를 활용하면 통신 기기의 기지국 신호를 통해 유동인구의 시공간적 분포를 실시간으로 파악할 수 있으며, 교통카드 데이터와 내비게이션 주행 기록은 수단 선택 및 경로 배정 단계에서 전수 데이터에 가까운 정밀도를 제공한다. 이러한 빅데이터는 전통적인 설문 조사를 완전히 대체하기보다는, 설문의 심층적인 사회경제적 변수와 빅데이터의 광범위한 표본성을 결합하는 하이브리드(hybrid) 방식으로 운영될 가능성이 높다.
분석 방법론 측면에서는 4단계 수요 예측 모형의 한계를 넘어 활동 기반 모형(Activity-Based Model, ABM)으로의 패러다임 전환이 가속화되고 있다. 활동 기반 모형은 통행을 단순한 지점 간 이동이 아닌, 인간의 일일 활동 스케줄을 충족하기 위한 파생 수요로 간주한다. 이는 에이전트 기반 모형(Agent-Based Model)과 결합하여 개별 가구원의 미시적인 통행 행태를 시뮬레이션함으로써, 특정 교통 정책이 개별 계층에 미치는 영향을 보다 정교하게 예측할 수 있게 한다. 결국 미래의 가구통행실태조사는 고정된 통계 산출물을 넘어, 실시간 데이터를 기반으로 교통 정책의 효과를 환류(feedback)하는 동적인 교통 수요 관리 시스템의 핵심 엔진 역할을 수행하게 될 것이다.21)
전통적인 가구통행실태조사는 수십 년간 교통계획의 핵심적인 기초 자료로 활용되어 왔으나, 최근 사회구조의 변화와 기술적 환경의 진보에 따라 여러 구조적 한계점을 드러내고 있다. 이러한 한계는 크게 조사 과정의 경제적 효율성, 통계적 신뢰성, 그리고 데이터의 시의성 측면에서 고찰할 수 있다.
가장 먼저 지적되는 문제는 조사 수행에 소요되는 막대한 예산과 행정적 비용이다. 가구통행실태조사는 모집단의 특성을 정밀하게 반영하기 위해 대규모 표본(sample)을 추출하여 대면 면접이나 자기기입식 설문을 진행한다. 이 과정에서 조사원 교육, 현장 방문, 응답자 섭외 및 사례비 지급 등에 천문학적인 비용이 투입된다. 특히 도시화가 심화되고 생활 양식이 복잡해짐에 따라 표본 가구를 방문하여 응답을 받아내는 데 드는 단위 비용은 지속적으로 상승하는 추세이다. 이는 예산 제약이 있는 지방자치단체가 독자적으로 조사를 수행하는 데 큰 진입장벽으로 작용하며, 결과적으로 국가 차원의 대규모 조사에만 의존하게 만드는 원인이 된다.
통계적 측면에서는 응답률(response rate)의 급격한 저하와 그에 따른 표본 편향(sampling bias)이 심각한 문제로 대두되고 있다. 개인정보 보호 의식의 강화와 1인 가구 및 맞벌이 가구의 증가로 인해 조사원이 가구를 방문하여 응답자를 대면하기가 매우 어려워졌다. 부재 가구가 늘어남에 따라 특정 시간대에 집에 머무는 고령층이나 주부의 응답 비중이 상대적으로 높아지는 반면, 활동량이 많은 청년층이나 직장인의 통행 행태는 과소 표집될 위험이 크다. 이러한 비표본 오차(non-sampling error)는 가중치 보정 과정을 거치더라도 실제 모집단의 통행 특성을 왜곡할 가능성을 내포하고 있다.
데이터의 정확성 측면에서 발생하는 회상 편향(recall bias) 또한 무시할 수 없는 한계점이다. 설문 조사 방식은 응답자의 기억에 의존하여 특정 날짜의 이동 경로를 재구성한다. 이 과정에서 응답자는 목적지 사이의 짧은 도보 이동, 편의점 방문과 같은 부수적 통행, 혹은 복잡한 환승 과정을 생략하거나 단순화하여 기록하는 경향이 있다. 이러한 누락 통행은 전체 통행량의 과소 추정으로 이어지며, 정밀한 교통 수요 예측 모델의 구축을 저해하는 요소가 된다.
마지막으로 조사 주기의 장기화로 인한 데이터의 시의성(timeliness) 부족 문제가 존재한다. 대규모 가구통행실태조사는 통상 5년 주기로 시행되는데, 급변하는 현대 사회의 모빌리티 환경을 반영하기에는 그 간격이 너무 길다. 신도시 개발, 새로운 광역철도망 개통, 공유 모빌리티의 확산과 같은 급격한 교통 환경 변화가 발생하더라도 차기 조사 결과가 도출되기 전까지는 과거의 데이터를 바탕으로 정책을 수립할 수밖에 없다. 이는 실제 교통 현황과 분석 데이터 사이의 시차를 발생시켜 정책의 유효성을 떨어뜨리는 결과로 이어진다. 결과적으로 이러한 전통적 방식의 한계는 빅데이터와 ICT 기술을 융합한 차세대 조사 체계로의 전환을 촉구하는 배경이 되고 있다.
전통적인 가구통행실태조사는 표본의 직접적인 응답에 의존하기 때문에 데이터의 수집 주기와 비용 측면의 비효율성이 존재하며, 응답자의 기억에 의존하는 과정에서 발생하는 회상 편향(recall bias)으로 인해 단거리 통행이나 비정형적 이동이 누락되는 한계를 지닌다. 이러한 문제를 해결하기 위해 최근 교통 계획 분야에서는 모빌리티 빅데이터(Mobility Big Data)를 전통적 조사 자료와 결합하여 데이터의 시공간적 해상도(resolution)를 높이고 조사의 정밀도를 극대화하는 방안이 핵심적인 연구 과제로 다루어지고 있다.
모빌리티 빅데이터와의 융합은 주로 통신 데이터, 교통카드 자료, 내비게이션 주행 기록 등을 활용하여 수행된다. 휴대전화 기지국 신호를 기반으로 하는 통신 데이터는 표본의 크기가 압도적으로 커서 유동인구의 동적 변화와 장거리 통행 패턴을 파악하는 데 유리하다. 교통카드 데이터는 대중교통 이용자의 승하차 지점과 환승 시간을 초 단위로 기록하므로, 개별 이용자의 통행 사슬(trip chain)을 정밀하게 복원할 수 있는 장점이 있다. 또한 내비게이션 데이터는 실제 차량의 주행 궤적을 제공하여 노선 배정(route assignment) 모델의 검증과 실시간 교통 상황 분석에 기여한다.
빅데이터와의 융합에서 가장 중요한 기술적 절차는 데이터 융합(data fusion)이다. 빅데이터는 모집단을 대변하는 양적 정보는 풍부하지만, 통행의 목적(출근, 쇼핑, 여가 등)이나 응답자의 사회경제적 속성(가구 소득, 직업 등)과 같은 질적 정보가 결여되어 있다. 이를 보완하기 위해 가구통행실태조사에서 얻어진 가구원 속성을 기계 학습(machine learning) 알고리즘에 학습시켜, 빅데이터상의 익명화된 이동 궤적에 통행 목적과 속성을 부여하는 추정 모형(estimation model)이 활용된다. 이러한 과정을 통해 구축된 데이터셋은 기존의 정적인 기종점 통행량(origin-destination, O-D) 자료를 시계열적으로 분절된 동적 기종점 통행량으로 진화시킨다.
이러한 융합 체계는 국가교통데이터베이스(KTDB)의 신뢰도를 높일 뿐만 아니라, 수요응답형 교통(demand responsive transport, DRT)이나 통합 모빌리티 서비스(mobility as a service, MaaS)와 같은 신산업 정책 수립에 필수적인 기초 자료를 제공한다.22) 특히 재난 상황이나 대규모 행사 시 발생하는 급격한 통행 수요 변화를 실시간에 가깝게 진단할 수 있게 함으로써, 과거 5년 주기로 시행되던 조사의 시간적 공백을 효과적으로 메우는 역할을 수행한다. 결과적으로 모빌리티 빅데이터와의 융합은 가구통행실태조사를 단순한 통계 조사를 넘어, 디지털 트윈(digital twin) 기반의 과학적 도시 관리를 가능케 하는 동적 데이터 플랫폼으로 변모시키고 있다.