문서의 선택한 두 판 사이의 차이를 보여줍니다.
| 양쪽 이전 판이전 판다음 판 | 이전 판 | ||
| 오차의_전파 [2026/04/13 13:32] – 오차의 전파 sync flyingtext | 오차의_전파 [2026/04/13 13:33] (현재) – 오차의 전파 sync flyingtext | ||
|---|---|---|---|
| 줄 181: | 줄 181: | ||
| ==== 상관관계와 공분산의 영향 ==== | ==== 상관관계와 공분산의 영향 ==== | ||
| - | 오차 전파의 일반적인 논의에서는 대개 입력 변수들이 서로 통계적으로 독립임을 가정한다. 그러나 실제 측정 환경에서는 여러 변수가 동일한 측정 기기, 동일한 환경 조건, 혹은 공통된 교정 표준을 공유함으로써 서로 밀접한 관계를 맺는 경우가 빈번하다. 이처럼 변수 간의 [[독립성]]이 보장되지 않는 상황에서 오차 전파를 정확히 산출하기 위해서는 [[공분산]](Covariance) 항이 전체 불확실성에 미치는 기여도를 반드시 고려해야 한다. 공분산은 두 확률 변수가 함께 변화하는 양상을 정량화한 값으로, 이를 무시하고 독립성을 가정할 경우 최종 결과의 [[불확도]]를 과소평가하거나 | + | [[오차 전파]]의 일반적인 논의에서는 대개 입력 변수들이 서로 통계적으로 독립임을 가정한다. 그러나 실제 측정 환경에서는 여러 변수가 동일한 측정 기기, 동일한 환경 조건, 혹은 공통된 교정 표준을 공유함으로써 서로 밀접한 관계를 맺는 경우가 빈번하다. 이처럼 변수 간의 [[독립성]]이 보장되지 않는 상황에서 오차 전파를 정확히 산출하기 위해서는 [[공분산]](covariance) 항이 전체 |
| - | 수학적으로 출력량 $ y = f(x_1, x_2, , x_n) $의 분산을 도출할 때, [[테일러 급수]](Taylor series)의 1차 근사식을 기반으로 한 분산의 정의를 적용하면 다음과 같은 일반식을 얻을 수 있다. 각 입력 변수 $ x_i $에 대한 [[편미분]] 계수, 즉 [[감도 계수]](Sensitivity | + | 수학적으로 출력량 $ y = f(x_1, x_2, , x_n) $의 [[분산]]을 도출할 때, [[테일러 급수]](Taylor series)의 1차 근사식을 기반으로 한 분산의 정의를 적용하면 다음과 같은 일반식을 얻을 수 있다. 각 입력 변수 $ x_i $에 대한 [[편미분]] 계수, 즉 [[감도 계수]](sensitivity |
| $$ \sigma_y^2 \approx \sum_{i=1}^n c_i^2 \sigma_i^2 + 2 \sum_{i=1}^{n-1} \sum_{j=i+1}^n c_i c_j \sigma_{ij} $$ | $$ \sigma_y^2 \approx \sum_{i=1}^n c_i^2 \sigma_i^2 + 2 \sum_{i=1}^{n-1} \sum_{j=i+1}^n c_i c_j \sigma_{ij} $$ | ||
| - | 여기서 $ %%//%%i^2 $은 변수 $ x_i $의 분산이며, | + | 여기서 $ %%//%%i^2 $은 입력 |
| - | 공분산은 두 변수의 [[표준 편차]](Standard | + | 공분산은 두 변수의 [[표준 편차]](standard |
| $$ \sigma_y^2 = \mathbf{J} \boldsymbol{\Sigma} \mathbf{J}^T $$ | $$ \sigma_y^2 = \mathbf{J} \boldsymbol{\Sigma} \mathbf{J}^T $$ | ||
| - | 이러한 행렬 연산 방식은 입력 변수가 수십 개 이상인 복잡한 시스템이나, | + | 이러한 행렬 연산 방식은 입력 변수가 수십 개 이상인 복잡한 시스템이나, |
| === 독립 변수 간의 결합 오차 === | === 독립 변수 간의 결합 오차 === | ||
| 줄 266: | 줄 266: | ||
| === 합과 차의 절대 오차 === | === 합과 차의 절대 오차 === | ||
| - | 두 양의 합이나 차에서 | + | 두 개 이상의 독립적인 [[측정값]]을 |
| + | |||
| + | 합의 경우를 살펴보면, | ||
| + | |||
| + | $$ \sigma_z^2 = \left( \frac{\partial z}{\partial x} \right)^2 \sigma_x^2 + \left( \frac{\partial z}{\partial y} \right)^2 \sigma_y^2 $$ | ||
| + | |||
| + | 함수 $ z = x + y $에 대하여 각 변수에 대한 편미분 값은 $ = 1 $, $ = 1 $이다. 이를 분산 공식에 대입하면 합의 분산은 각 성분 분산의 산술 합인 $ _z^2 = _x^2 + _y^2 $이 된다. 따라서 합의 [[절대 오차]]를 나타내는 | ||
| + | |||
| + | 차의 연산 $ z = x - y $에서도 이와 동일한 논리가 적용된다. 이때 각 변수에 대한 편미분 값은 $ = 1 $, $ = -1 $이다. 오차 전파 공식에서는 편미분 | ||
| + | |||
| + | 이러한 원리는 $ n $개의 독립 변수로 확장될 수 있다. 여러 측정값의 [[선형 결합]] $ z = _{i=1}^{n} a_i x_i $가 주어졌을 때, 각 $ a_i $가 상수라면 결과값의 전체 분산은 $ %%//%%z^2 = %%// | ||
| + | |||
| + | 결론적으로 합과 차의 연산에서 발생하는 오차 전파는 각 성분의 절대 오차를 기하학적으로 결합함으로써 계산된다. 이러한 결합 방식은 [[피타고라스 정리]]와 유사한 성질을 지니며, 개별 오차 중 상대적으로 크기가 큰 성분이 전체 오차에 지배적인 영향을 미친다는 특성을 갖는다. 따라서 전체 측정 시스템의 [[정밀도]](precision)를 효과적으로 개선하기 위해서는 불확도가 가장 큰 특정 항목의 오차를 우선적으로 제어하는 것이 공학적으로 타당한 접근이다. | ||
| === 선형 결합의 일반식 === | === 선형 결합의 일반식 === | ||
| - | 여러 변수의 가중치 합으로 표현되는 선형 시스템에서의 오차 전파를 일반화한다. | + | 여러 변수의 [[선형 결합]](linear combination)으로 정의되는 물리량의 오차 전파는 통계학적 [[분산]](variance)의 성질을 통해 일반화할 수 있다. 측정하고자 하는 종속 변수 $ Y $가 $ n $개의 입력 변수 $ X_1, X_2, , X_n $의 가중치 합으로 표현되는 선형 시스템을 가정한다. 이때 각 입력 변수는 직접적인 계측을 통해 얻어지며, |
| + | |||
| + | $$ Y = \sum_{i=1}^{n} a_i X_i = a_1 X_1 + a_2 X_2 + \dots + a_n X_n $$ | ||
| + | |||
| + | 여기서 $ a_i $는 각 변수에 할당된 결정론적인 가중치 계수이다. 이 식에서 | ||
| + | |||
| + | $$ \sigma_Y^2 = \sum_{i=1}^{n} a_i^2 \sigma_i^2 = a_1^2 \sigma_1^2 + a_2^2 \sigma_2^2 + \dots + a_n^2 \sigma_n^2 $$ | ||
| + | |||
| + | 그러나 실제 측정 환경에서는 환경적 요인이나 장비의 특성으로 인해 변수 간의 [[상관관계]](correlation)가 존재하는 경우가 빈번하다. 변수들 사이에 상관관계가 존재할 때, 오차 전파의 일반식은 공분산 항을 포함하여 확장되어야 한다. 두 변수 $ X_i $와 $ X_j $ 사이의 공분산을 $ _{ij} $라고 할 때, 선형 결합에 대한 불확도 전파의 일반식은 다음과 같이 표현된다. | ||
| + | |||
| + | $$ \sigma_Y^2 = \sum_{i=1}^{n} a_i^2 \sigma_i^2 + 2 \sum_{i=1}^{n-1} \sum_{j=i+1}^{n} a_i a_j \sigma_{ij} $$ | ||
| + | |||
| + | 위 식에서 두 번째 항은 모든 가능한 변수 쌍에 대한 상관성을 반영한다. 공분산은 [[상관 계수]](correlation coefficient) $ %%//%%{ij} $를 이용하여 $ %%//%%{ij} = _{ij} _i _j $로 치환할 수 있으며, 이를 통해 상관성의 정도가 최종 결과의 불확도를 어떻게 증폭시키거나 상쇄시키는지 정량적으로 분석할 수 있다. 특히 가중치 $ a_i $와 $ a_j $의 부호가 다르고 양의 상관관계가 존재할 경우, 공분산 항은 전체 분산을 감소시키는 효과를 낳기도 한다. | ||
| + | |||
| + | 이러한 선형 결합의 오차 전파는 [[행렬 대수]](matrix algebra)를 이용하여 더욱 체계적으로 정식화될 수 있다. 가중치 계수들을 열벡터 $ = [a_1, a_2, , a_n]^T $로 정의하고, | ||
| + | |||
| + | $$ \sigma_Y^2 = \mathbf{a}^T \mathbf{\Sigma} \mathbf{a} $$ | ||
| + | |||
| + | 이 행렬 식은 다변수 시스템에서의 오차 전파를 다루는 [[최소제곱법]](least squares method)이나 [[칼만 필터]](Kalman filter)와 같은 현대적 제어 및 추정 이론의 핵심적인 기초가 된다. 공분산 행렬 $ $는 대칭 행렬이며, | ||
| + | |||
| + | 결론적으로 선형 결합에서의 오차 전파는 각 입력 변수의 개별적 불확도뿐만 아니라 이들 사이의 상호 의존성에 의해 결정된다. 가중치 계수 $ a_i $는 해당 변수의 오차가 최종 결과에 미치는 [[감도]](sensitivity)를 결정하며, | ||
| + | )) | ||
| ==== 지수 및 로그 연산에서의 전파 ==== | ==== 지수 및 로그 연산에서의 전파 ==== | ||
| 줄 296: | 줄 329: | ||
| === 곱셈과 나눗셈의 상대 오차 === | === 곱셈과 나눗셈의 상대 오차 === | ||
| - | 상대 오차의 | + | [[곱셈]](multiplication)과 [[나눗셈]](division) 연산에서 발생하는 오차의 전파는 [[덧셈]]이나 [[뺄셈]]과 달리 [[절대 오차]](absolute error)가 아닌 [[상대 오차]](relative error)를 기준으로 정의된다. 이는 물리량의 크기가 결과값의 불확실성에 직접적인 영향을 미치는 비선형적 특성 때문이다. 두 독립적인 [[측정값]] $ x $와 $ y $가 각각 [[표준 편차]](standard deviation) $ _x $, $ _y $를 가질 때, 이들의 곱으로 정의되는 함수 $ z = xy $에 대한 [[오차 전파 법칙]]을 적용하면 결과값 $ z $의 [[불확도]](uncertainty)를 산출할 수 있다. 오차 전파의 일반식에 따라 $ z $의 [[분산]](variance) $ _z^2 $은 각 변수에 대한 [[편미분]](partial derivative)과 각 변수의 분산의 곱들의 |
| + | |||
| + | 함수 $ z = xy $를 각 변수에 대해 편미분하면 $ = y $와 $ = x $를 얻는다. 이를 분산 공식에 대입하면 다음과 같은 관계식이 도출된다. | ||
| + | |||
| + | $$ \sigma_z^2 \approx \left( \frac{\partial z}{\partial x} \right)^2 \sigma_x^2 + \left( \frac{\partial z}{\partial y} \right)^2 \sigma_y^2 = y^2 \sigma_x^2 + x^2 \sigma_y^2 $$ | ||
| + | |||
| + | 위 식의 양변을 $ z^2 = (xy)^2 $으로 나누어 상대 분산의 형태로 변환하면, | ||
| + | |||
| + | $$ \frac{\sigma_z^2}{z^2} = \frac{y^2 \sigma_x^2}{x^2 y^2} + \frac{x^2 \sigma_y^2}{x^2 y^2} = \left( \frac{\sigma_x}{x} \right)^2 + \left( \frac{\sigma_y}{y} \right)^2 $$ | ||
| + | |||
| + | 나눗셈 연산인 $ z = $의 경우에도 동일한 논리가 적용된다. $ z $를 $ x $에 대해 편미분하면 $ $이며, $ y $에 대해 편미분하면 $ - $이 된다. 이를 분산 공식에 대입하여 정리하면 다음과 같다. | ||
| + | |||
| + | $$ \sigma_z^2 \approx \left( \frac{1}{y} \right)^2 \sigma_x^2 + \left( -\frac{x}{y^2} \right)^2 \sigma_y^2 $$ | ||
| + | |||
| + | 이 식을 다시 $ z^2 = ()^2 $으로 나누면 나눗셈에서의 상대 분산 식을 얻을 수 있다. | ||
| + | |||
| + | $$ \frac{\sigma_z^2}{z^2} = \frac{\sigma_x^2 / y^2}{x^2 / y^2} + \frac{x^2 \sigma_y^2 / y^4}{x^2 / y^2} = \left( \frac{\sigma_x}{x} \right)^2 + \left( \frac{\sigma_y}{y} \right)^2 $$ | ||
| + | |||
| + | 이러한 유도 과정을 통해 | ||
| + | |||
| + | 이 법칙은 과학적 데이터 분석에서 매우 중요한 함의를 갖는다. 예를 들어, [[밀도]](density)를 구하기 위해 [[질량]]과 [[부피]]를 측정할 때, 최종 밀도 값의 정밀도를 높이기 위해서는 질량과 부피 중 상대 오차가 더 큰 변수의 정밀도를 개선하는 것이 효율적임을 시사한다. 상대 오차의 제곱합 형식은 특정 변수의 불확도가 지배적일 때 그 변수가 전체 오차를 결정짓는 구조를 가지기 때문이다. 따라서 연구자는 복합적인 연산 과정에서 어떠한 물리량이 전체 [[신뢰 수준]](confidence level)을 저해하는지 정량적으로 파악할 수 있다. | ||
| === 거듭제곱 함수의 오차 증폭 === | === 거듭제곱 함수의 오차 증폭 === | ||
| - | 지수값이 오차 전파의 가중치로 작용하여 불확도를 | + | 거듭제곱(Power) 함수의 형태를 띠는 물리량 사이의 관계에서 오차 전파는 입력 변수의 [[상대 오차]](Relative error)가 |
| + | |||
| + | 함수 $ y = Ax^n $의 양변에 [[자연로그]]를 취하면 $ y = A + n x $가 되며, 이를 각 변수에 대해 미분하면 다음과 같은 관계식을 얻는다. | ||
| + | |||
| + | $$ \frac{dy}{y} = n \frac{dx}{x} $$ | ||
| + | |||
| + | 위 식에서 $ $와 $ $는 각각 변수 $ x $와 $ y $의 미소 변화율, 즉 상대 오차를 의미한다. 이를 통계적인 [[표준 편차]](Standard deviation)의 관점에서 재구성하면, | ||
| + | |||
| + | $$ \frac{\sigma_y}{y} = |n| \frac{\sigma_x}{x} $$ | ||
| + | |||
| + | 이 관계식은 거듭제곱 함수에서 지수 $ n $이 오차 전파의 | ||
| + | |||
| + | 반대로 지수의 절댓값이 1보다 | ||
| + | |||
| + | 결과적으로 거듭제곱 함수의 오차 전파 분석은 [[실험 설계]] 단계에서 어느 변수를 더 정밀하게 측정해야 하는지를 결정하는 지표가 된다. 지수가 큰 변수일수록 최종 결과의 [[신뢰성]]에 미치는 영향이 지배적이므로, | ||
| ===== 실무적 응용 및 분석 기법 ===== | ===== 실무적 응용 및 분석 기법 ===== | ||
| 줄 342: | 줄 409: | ||
| ==== 수치 해석적 오차 분석 ==== | ==== 수치 해석적 오차 분석 ==== | ||
| - | 전통적인 [[테일러 급수]] 기반의 오차 전파 분석은 함수가 해석적으로 미분 가능하며, | + | 전통적인 [[테일러 급수]] 기반의 |
| - | 수치 해석적 오차 분석의 핵심적인 방법론 중 하나는 [[몬테카를로 방법]](Monte Carlo Method)이다. 이 기법은 입력 변수의 [[확률 분포]]를 정의한 뒤, 해당 분포로부터 무작위 표본(random sample)을 대량으로 추출하여 함수에 대입함으로써 출력값의 통계적 특성을 직접 관찰하는 방식이다. 특정 지점에서의 국소적인 미분값에 의존하는 대신, 시스템 전체의 거동을 확률적으로 모사하기 때문에 함수의 연속성이나 미분 가능 여부에 구애받지 않는다. 특히 입력량의 불확실성이 크거나 출력 함수가 심한 굴곡을 가진 비선형 구조일 때, 몬테카를로 시뮬레이션은 전통적인 [[불확도 전파 법칙]]보다 훨씬 정확한 결과를 제공한다. | + | [[수치 해석]]적 오차 분석의 핵심적인 방법론 중 하나는 [[몬테카를로 방법]](Monte Carlo Method)이다. 이 기법은 입력 변수의 [[확률 분포]]를 정의한 뒤, 해당 분포로부터 |
| - | 몬테카를로 시뮬레이션에 의한 오차 분석 과정은 다음과 같이 정형화된다. 우선 각 입력 변수 $ x_i $에 대하여 기대값과 표준 편차를 포함하는 적절한 확률 밀도 함수(Probability Density Function, PDF)를 할당한다. 이후 컴퓨터를 이용하여 $ M $개의 독립적인 표본 벡터 $ ^{(k)} = [x_1^{(k)}, x_2^{(k)}, , x_n^{(k)}]^T $를 생성한다. 이를 모델 함수 $ y = f() $에 대입하여 얻은 출력값의 집합 $ {y^{(1)}, y^{(2)}, , y^{(M)}} $은 결과값의 이산적인 분포를 형성한다. 이때 출력값의 평균 $ {y} $와 표준 편차 $ u_y $는 다음과 같은 통계량으로 산출된다. | + | 몬테카를로 시뮬레이션에 의한 오차 분석 과정은 다음과 같이 정형화된다. 우선 각 입력 변수 $ x_i $에 대하여 |
| $$ \bar{y} = \frac{1}{M} \sum_{k=1}^{M} y^{(k)} $$ | $$ \bar{y} = \frac{1}{M} \sum_{k=1}^{M} y^{(k)} $$ | ||
| 줄 352: | 줄 419: | ||
| $$ u_y = \sqrt{\frac{1}{M-1} \sum_{k=1}^{M} (y^{(k)} - \bar{y})^2} $$ | $$ u_y = \sqrt{\frac{1}{M-1} \sum_{k=1}^{M} (y^{(k)} - \bar{y})^2} $$ | ||
| - | 이 과정에서 $ M $의 크기가 | + | 이 과정에서 |
| )). | )). | ||
| - | 또한, 계산 비용을 최적화하기 위해 [[라틴 하이퍼큐브 샘플링]](Latin Hypercube Sampling, LHS)과 같은 고도화된 샘플링 기법이 병행되기도 한다. 이는 입력 변수의 전체 영역을 균등하게 분할하여 샘플링함으로써 단순 무작위 추출보다 적은 횟수의 반복으로도 높은 수렴 속도를 확보하는 전략이다. 이와 더불어 모델의 입력 변수 중 어떤 요소가 결과의 불확실성에 가장 큰 기여를 하는지 파악하는 [[민감도 분석]](Sensitivity Analysis) 역시 수치 해석적 관점에서 수행된다. 이는 각 변수를 미세하게 변화시켰을 때의 출력 변동량을 수치적으로 계산하여 [[감도 계수]]를 도출하는 과정으로, | + | 또한, 계산 비용을 최적화하기 위해 [[라틴 하이퍼큐브 샘플링]](Latin Hypercube Sampling, LHS)과 같은 고도화된 샘플링 기법이 병행되기도 한다. 이는 입력 변수의 전체 영역을 균등하게 분할하여 샘플링함으로써 단순 무작위 추출보다 적은 횟수의 반복으로도 높은 |
| 이러한 수치적 접근법은 데이터의 분포가 [[정규 분포]]를 따르지 않거나 편향이 존재하는 비대칭 분포일 때 더욱 유용하다. 예를 들어, [[베이즈 통계학]]적 관점을 결합하여 사전 지식과 측정 데이터를 통합한 오차 분석을 수행할 때, 수치 해석적 기법은 복잡한 후험 분포(posterior distribution)를 정량화하는 유일한 수단이 되기도 한다. 결론적으로 수치 해석적 오차 분석은 현대 [[신뢰성 공학]]과 정밀 계측 분야에서 전통적 미분법의 한계를 보완하고, | 이러한 수치적 접근법은 데이터의 분포가 [[정규 분포]]를 따르지 않거나 편향이 존재하는 비대칭 분포일 때 더욱 유용하다. 예를 들어, [[베이즈 통계학]]적 관점을 결합하여 사전 지식과 측정 데이터를 통합한 오차 분석을 수행할 때, 수치 해석적 기법은 복잡한 후험 분포(posterior distribution)를 정량화하는 유일한 수단이 되기도 한다. 결론적으로 수치 해석적 오차 분석은 현대 [[신뢰성 공학]]과 정밀 계측 분야에서 전통적 미분법의 한계를 보완하고, | ||