공부공부 리뷰

[머신러닝] 머신러닝 모델: 회귀 모델 (Feat. 오렌지3)

2024. 6. 25.

머신러닝 회귀 모델 소개

 

머신러닝에서 회귀(Regression)는 연속적인 값을 예측하는 작업입니다. 예를 들어, 주택 가격 예측, 주식 시장 예측 등이 회귀 문제에 해당합니다. 회귀 모델은 데이터의 패턴을 학습하여 새로운 데이터에 대한 예측을 수행합니다. 이번 글에서는 오렌지3를 사용하여 간단한 회귀 모델을 구축하고 평가하는 과정을 살펴보겠습니다.

 

1. 데이터 로드

오렌지3를 실행한 후, ‘File’ 위젯을 캔버스로 드래그하여 데이터를 로드합니다. 예제 데이터로 ‘housing.tab’ 파일을 사용합니다. 이 데이터셋은 주택의 다양한 특성(면적, 방 개수 등)을 기반으로 주택 가격을 예측하는 데 사용됩니다. (housing.tab 파일은 기본 제공되는 파일로, File에서 폴더 아이콘을 누르면 기본 제공 폴더로 연결됩니다.)

 

2. 데이터 시각화

데이터를 이해하기 위해 ‘Scatter Plot’ 위젯을 사용하여 데이터를 시각화합니다. X축에 ‘RM’(방 개수), Y축에 ‘MEDV’(주택 가격)를 설정하여 두 변수 간의 관계를 시각화합니다. 이를 통해 변수들 간의 상관관계를 파악할 수 있습니다.

 

3. 회귀 모델 생성

다음으로, 회귀 모델을 생성합니다. 여기서는 선형 회귀(Linear Regression) 모델을 사용합니다. ‘Linear Regression’ 위젯을 드래그하여 추가하고, ‘File’ 위젯과 연결합니다. 모델 학습을 위해 ‘Linear Regression’ 위젯을 더블 클릭하여 설정을 완료합니다. 선형 회귀는 가장 기본적인 회귀 기법으로, 독립 변수와 종속 변수 간의 선형 관계를 가정합니다.

 

4. 모델 평가

모델의 성능을 평가하기 위해 ‘Test & Score’ 위젯을 사용합니다. ‘Linear Regression’ 위젯과 연결하고, ‘File’ 위젯과도 연결하여 데이터를 테스트합니다. ‘Test & Score’ 위젯에서는 평균 절대 오차(Mean Absolute Error, MAE), 평균 제곱 오차(Mean Squared Error, MSE) 등의 성능 지표를 확인할 수 있습니다. 이러한 평가 지표를 통해 모델이 얼마나 잘 동작하는지 파악할 수 있습니다.

평가 지표 설명

 

평균 절대 오차(MAE): 예측 값과 실제 값 간의 차이의 절대값 평균입니다. 값이 작을수록 모델의 예측이 실제 값에 가깝다는 것을 의미합니다.

평균 제곱 오차(MSE): 예측 값과 실제 값 간의 차이의 제곱 평균입니다. 값이 작을수록 모델의 예측이 실제 값에 가깝다는 것을 의미합니다. 제곱을 사용하기 때문에 큰 오차에 더 큰 패널티를 부여합니다.

 

 

5. 결과 시각화

모델의 예측 결과를 시각화하기 위해 ‘Predictions’ 위젯을 추가합니다. ‘Test & Score’ 위젯과 연결하여 실제 값과 예측 값을 비교할 수 있습니다. 이를 통해 모델의 예측이 실제 값과 얼마나 가까운지 확인할 수 있습니다.

 

결론

 

이번 글에서는 오렌지3를 사용하여 기본적인 회귀 모델을 구축하고 평가하는 과정을 살펴보았습니다. 회귀 모델은 데이터 분석에서 매우 중요한 역할을 하며, 이를 통해 다양한 연속형 값을 예측할 수 있습니다. 다음 글에서는 다른 회귀 알고리즘(예: 릿지 회귀, 라쏘 회귀)과 그 활용 방법에 대해 자세히 다루겠습니다. 



공유하기

페이스북 트위터 네이버 밴드