공부공부 리뷰

[머신러닝] 오렌지3(Orange3) - 나에겐 충격적인 GUI 기반의 머신러닝툴

2020. 8. 15.

얼마 전 포스팅했던 머신러닝야학을 요새 열심히 듣고 있다.

2020/08/11 - [공부공부 리뷰] - 공부공부 (프)리뷰! 머신러닝 야학 - 텐서플로우, 오랜지3

 

공부공부 (프)리뷰! 머신러닝 야학 - 텐서플로우, 오랜지3

사실 지금 나는 여름 휴가 중이다. 하지만 코로나+날씨+와이프 임신으로 인해 집에 콕 틀어박혀 소소한 일상의 행복을 누리고 있다 ㅎㅎ 나의 회사업무 중 큰 비중을 차지하는 것이 Digital Transform

kyook.tistory.com

덕분에 방콕 중인 휴가를 알차게 보낼 수 있어 매우 만족스럽다.

특히!! 오렌지3(머신러닝야학에서 오랜지라고 해서 그런가 보다 했는데, 영어를 보니 그냥 Orange다!)은 정말 너무 놀라운 툴인 것 같다.

 

사실 나는 업무에서 엑셀을 꽤 많이 쓰는 편이다. 연구를 하며 데이터를 분석하고 정리하는 용도로 많이 사용을 한다. 물론 많이 사용을 하다 보니 여러 가지 함수나 수식을 다루는데 꽤 익숙하고 최근에는 피벗테이블도 다루면서 나름 잘 쓴다고 생각해왔다.

 

그런데 오렌지3을 써보니..

 

'아니? 내가 그동안 왜 그렇게 귀찮게 함수 외우고 수식 짜는데 고민을 했지?' 

 

이런 생각이 들만큼 너무 충격적이고 놀라운 툴이라는 생각이 든다.

 

우선 메인화면을 보자.

오렌지3 메인화면

 

왼쪽의 블록을 드래그해서 오른쪽 캔버스에 드롭하면 적용이 된다.

오렌지3 블럭 추가

기본적인 표는 엑셀을 통해 구성해야겠지만, 그 표를 불러와서 많은 작업들을 진행할 수 있다.

예를 들어 다음의 표를 구성하고, 이 표를 이용하여 다양한 분석을 진행해보겠다.

날짜 요일 온도 판매량 오픈시간
2020-06-01 00:00:00 20 40 10:00
2020-06-02 00:00:00 21 42 10:01
2020-06-03 00:00:00 22 44 10:02
2020-06-04 00:00:00 23 46 10:01
2020-06-05 00:00:00 24 48 10:10

요런 표를 저 파일에 링크(PC파일 또는 구글 드라이브 경로)시켜주고, 오른쪽에 원호를 마우스 클릭-드래그하면...

띠용! 이런 선이 그려지면서 뭘 붙일 것인지 물어본다.

맨 위에 있는 데이터 테이블을 클릭해서 뭐가 나오는지 한번 보자.

오호! 입력한 테이블이 그대로 출력이 된다.

그러면 여기서 원하는 행만 출력하도록 조건을 걸어보자!

 

조건을 걸려면, 아까처럼 오른쪽 원호에 클릭-드래그하면 나오는 목록 중 Select rows를 선택한 후 해당 블록을 더블클릭해보자.

오 판매량 조건이 나왔네. 가운데 is below를 선택하면 다양한 조건을 선택해줄 수 있다. 판매량이 44 이상인 것을 보려면 is at least를 선택한 후 우측에 데이터 테이블을 생성해주면..

오! 판매량이 44 이상인 경우의 행이 출력된다.

 

아직 배운 게 여기까지라 ㅎㅎㅎㅎ 근데 이것저것 건드려보니 다양한 것들을 할 수 있을 것 같다. 예를 들어 피벗 테이블이라던지, 랜덤 함수 등등 엑셀에서 함수명을 알아야 가능했던 일들이 여기서는 직관적으로 GUI를 통해 할 수 있다 보니 많은 편리함을 줄 수 있을 것 같다.

게다가 무료!! 정말 무료 프로그램으로 이렇게 많은 것들을 할 수 있다니 정말 너무 신기하다.

 

다음엔 좀 더 많은 내용을 공부해서 올려놔야지!!

 

다음 글 이동

2020.08.24 - [공부공부 리뷰] - [Orange3] 오렌지3를 이용한 머신러닝 모델 생성 및 예측! - 새로운 눈을 뜨게 해 준 머신러닝 야학

 

아차 혹시나 모를 귀차니스트를 위해 업로드하려 했지만 안돼서 링크로 대신함!!(파일 업로드가 10MB 까지라니..............)

다운로드는 여기서

 

 

Data Mining

Ferenc Borondics, Ph.D. "The scientific community is in need of tools that allow easy construction of workflows and visualizations and are capable of analyzing large amounts of data. Orange is a powerful platform to perform data analysis and visualization,

orange.biolab.si

 



공유하기

페이스북 트위터 네이버 밴드