머신러닝/딥러닝을 위한 매개변수 모델링(Parametric Models) 기초
본문 바로가기

머신러닝(Machine Learning)/기초수학

머신러닝/딥러닝을 위한 매개변수 모델링(Parametric Models) 기초

반응형

 안녕하십니까. 매개변수 모델링에 대해서 말씀드리겠습니다. 이 개념은 앞으로 딥러닝 또는 머신러닝을 하실 때 가장 중요한 핵심 개념이기 때문에 이해하고 가시면 많은 도움이 될 것 같습니다.

 

1.Parametric Models 개념설명

 말이 어려운데 실제로는 간단한 개념입니다. 아래 그림과 같이 철수와 영희의 수학과 영어 점수는 다르나 합은 동일하죠? 그러면 점수는 동점일 것입니다.

반응형

예제
예제

 여기에 Parametric Models 개념을 넣어 보겠습니다. 즉, 가중치를 넣겠다는 뜻입니다. 예를 들어 수학에는 곱하기 2를 하고 영어에는 곱하기 0.5를 해 보겠습니다.

예제
예제

 위의 가중치를 곱한 예제를 보시면 철수가 영희보다 75점 더 앞서는 것을 확인할 수 있습니다. 이렇게 특정 가중치를 곱하게 되면 출력이 정말 달라지는데 우리가 원하는 값을 도출하기 위해 가중치를 곱하는 행위 그 자체가 Parametric Models 개념이라 생각하시면 될 것 같습니다.

 

2.Parametric Models 이해와 사용법

 

(1) 다변수 함수(multivariate function) : 다중 입력 하나의 출력 

 다변수 함수는 Parametric Models을 이해하기 위한 기초 수학 개념입니다. 간단히 말하여 입력이 여러 개이고 출력이 하나인 것을 뜻합니다.

아래 그림처럼 함수 f에 x, y가 입력되면 z가 출력되는 구조를 multivariate function이라고 한다. 이때 X는 벡터입니다. 이때, x는 하나가 아니라 여러 개도 들어갈 수 있습니다.

다변수 함수(multivariate function)
다변수 함수(multivariate function)

(2) Parametric Models 이해

수식과 그래프를 가지고 설명해 보겠습니다.

Parametric Models 이해
Parametric Models  이해

 우선 수식에 대해 설명하겠습니다. f(x;θ)에서 x는 데이터이고 θ는 파라미터입니다 즉 f라는 함수는 데이터와 파라미터로 구성되어 있다는 뜻입니다. y=ax그래프에서 a의 값이 변할 때마다 1차 함수 기울기가 달라지는 것을 확인할 수 있습니다. 즉, 같은 1차 함수라도 파라미터에 따라 값이 달라지는 것입니다. 아까 앞서 말씀드린 가중치와 동일한 개념이라 생각하시면 됩니다.

 y=ax를 f(x;θ) 꼴로 나타내면, f(x ; a) = ax와 동일합니다. 이해하시겠죠?

 아래는 머신러닝/딥러닝의 핵심인 그림입니다. 빨간색 또는 파란색 데이터 셋을 가장 잘 나타내는 함수를 찾는 것이빈다. 이렇게 가장 잘나타내는 함수를 찾아내면 그다음 값을 예측할 수도 있고 또는 이 것이 고양이인지 강아지 인지도 파악할 수 있습니다.

Parametric Models 이해 2
Parametric Models 이해 2

위의 설명을 하나로 함축 아면 아래 그림과 같습니다.

Parametric Models 이해 3
Parametric Models 이해 3

특정 데이터 집합(Data Sets)이 있으면 그것을 가장 유사하게 표현할 수 있는 함수 f가 있습니다. 이때 함수 f를 실제 데이터 집합을 가장 유사하게 표현하기 위해 θ1부터 100까지의 값을 변경시킵니다. 계속 같은 개념과 이해 방법을 반복해서 설명하고 있습니다.

 

이때 parametric Models 표현방법을 알아보겠습니다.

(1) 가중치 합(Weighted Sum) : weighted가 변화하면 결과가 달라진다는 것이며, 앞서 설명드린 개념과 동일합니다. 가 가중치 값인 w를 얼마큼 잘 예측하는지 그리고 변수인 x를 무엇을 선정하는지에 따라 주식 자동매매의 승률 또는 알파고의 바둑 승률이 크게 바뀌게 됩니다.

가중치 합(Weighted Sum)
가중치 합(Weighted Sum)

(2) 아핀 함수(Affine Functions) : 단순한 구조가 아니라 특정 바이어스 값인 b를 추가하여, 계산량은 많아지지만 조금 더 현실에 맞도록 변수를 추가한 것입니다. 나머지는 가중치 합과 동일합니다.

 

아핀함수(Affine Functions)
아핀함수(Affine Functions)

아래는 인공 뉴런(Artificial Neurons)을 나타내는 그림인데 아핀 함수를 이용하여 z값을 출력시키고 z값을 다시 activation function에 입력시켜 a라는 최종 출력을 얻는 것입니다. 이과정이 머신러닝입니다.

 즉 우리는 X값을 선정하고 가중치 w를 추정한 후 b라는 바이어스를 건 출력을 얻고 이 출력 값을 activation function에 입력하여 출력을 해야 할지/말지를 판단 후 최종 a라는 출력을 계산하는 것입니다.

인공뉴런(Artificial Neurons)
인공뉴런(Artificial Neurons)

어려울 수도 있지만 간단히 개념만 잡고 넘어가시면 될 것 같습니다. 앞으로 상당히 많이 반복될 내용입니다. 파이팅 하십시오. 감사합니다.

반응형

.link_tit