Orange software를 활용한 데이터 분석, 머신러닝
- 쇼셜이노베이션융합전공
- 조회수444
- 2021-05-25
이번 학습자료는 코딩이 필요없는 데이터 분석, 머신러닝이 가능한 프로그램인 Orange3를 소개합니다. Orange3 프로그램은 오픈소스 데이터 시각화, 머신러닝 및 데이터 마이닝 Tool Kits입니다.
머신러닝을 구현한 파이썬 코드가 잘 이해가 안되거나, 텍스트로 된 프로그래밍 언어를 배우기 힘들어하는 분들이 사용할만한 소프트웨어입니다.
출처: https://bigdata-madesimple.com/products/orange/
기존의 빅데이터 분석 Tool은 상용프로그램이라서 무료로 사용이 어렵고, 사용법 자체도 익숙해지는 데 오랜 시간이 필요했지만, Orange는 컴포넌트 기반의 데이터 마이닝 프레임 워크로서 클릭 몇 번으로 간편한 빅데이터 분석이 가능하다는 장점이 있습니다.
출처: https://orangedatamining.com/
Orange에서는 대표적인 빅데이터 분석 방법론들을 포함하고 있으며, SVM, Decision Tree, KNN 등의 방법의 비교분석도 가능합니다. 아래 분석사례는 3가지 알고리즘을 적용하여 데이터 분석을 위해 Train data를 70%, Test data 를 30%로 설정하고 5-Folds Cross Validation을 사용하였습니다.
출처: 10분 안에 마치는 빅데이터 분석
출처: 10분 안에 마치는 빅데이터 분석
각 알고리즘에 대한 예측값이 결과로 표시됩니다. Precision이 예측정확도를 의미하며, 분석결과 SVM이 가장 높은 예측정확도를 보이는 것을 알 수 있습니다.
이 외에도 Orange는 선형/로지스틱회귀분석, 앙상블 모델링 등 여러 알고리즘을 적용하여 빅데이터 분석이 가능하며, 이미지/텍스트 데이터 처리도 가능합니다. Orange는 파이썬 기반으로 만들어진 프로그램이기 때문에, 파이썬 코딩이 가능한 분이라면 본인만의 위젯을 만들어 활용할 수 있는 장점이 있습니다.
파이썬과 R 프로그램을 이용하여 데이터 분석에 애를 먹는 다면, 사용자 친화적인 그래픽 인터페이스를 갖추고 있어 코딩을 잘 모르더라도 데이터 분석에 집중할 수 있는 python 기반의 데이터마이닝과 시각화 모두에 유용한 Orange Tool을 사용해보길 바랍니다.
빅데이터 분석 Tool인 Orange에 대한 자세한 내용은 아래 링크에서 확인할 수 있습니다.
* Orange란?
https://skku.libguides.com/datavisualization/orange
* 코딩이 필요 없는 데이터분석, 머신러닝 – Orange3 기초
https://www.inflearn.com/course/%EC%98%A4%EB%A0%8C%EC%A7%803-%EA%B8%B0%EC%B4%88#
* 출처: orangedataminining 10분 안에 마치는 빅데이터 분석 |