2019-06-04
데이터 시각화(Data Visualization)는 데이터 분석 결과를 쉽게 이해할 수 있도록 시각적으로 표현하고 전달하는 과정을 말한다. 데이터 시각화의 목적은 도표(graph)라는 수단을 통해 정보를 명확하고 효과적으로 전달하는 것이다. 기능적인 측면을 강조하거나 아름답게 표현하는 데만 매달려서는 안되고, 의미를 효과적으로 전달하기 위해서는 심미적인 형태와 기능적인 요소가 조화를 이루어야 한다. 단지 명확하게 의사를 전달하는 데 머무르기 보다는 보는 사람을 집중하게 하고 참여하게 만드는 것이 이상적인 데이터 시각화다.
데이터 시각화와 연관된 개념으로는 정보 시각화, 과학적 시각화, 시각 디자인, 정보 그래픽 등이 있다. 그 개념들을 자세하게 살펴보면, 정보 시각화(information visualization)는 일반적으로 소프트웨어 시스템의 파일이나 프로그램 코드, 도서관의 서지 데이터베이스, 인터넷의 관계 등과 같은 대규모 비수량 정보를 시각적으로 표현하는 것을 의미한다. 과학적 시각화(scientific visualization)는 주로 건축학, 기상학, 의학, 생물학 분야에서 시간의 흐름에 따른 변화를 입체적으로 표현하는 것을 말한다. 과학 분야의 연구결과를 일반인이 쉽게 이해하도록 그림으로 표현하는 사람을 시각화 과학자라고 한다. 아름답게 표현된 행성이나 은하계의 사진은 시각화 과학자들이 만든 작품이라고 할 수 있다. 정보 그래픽(information graphics)은 인포그래픽(infographic)이라고도 불리는데, 정보와 데이터, 지식을 시각적으로 표현하는 것을 말한다. 표지판이나 지도, 언론, 기술보고서, 교육 분야에서 발생하는 복잡한 정보를 빠르고 명확하게 표현하는 것이 핵심이다. 우리가 흔히 접하는 교통표지판과 복잡한 지하철 노선도가 대표적인 인포그래픽이다. 한 장에 수많은 데이터를 요약해 표현하는 인포그래픽은 특히 신문이나 방송과 같은 미디어에서 주목 받고 있다. 지역별 날씨를 그림으로 나타낸 일기예보 기상도나 기사 내용 중의 통계 수치를 그래프로 나타내는 것은 예전부터 사용하던 방법이다.
고려사항 2
데이터는 보이는 만큼 활용할 수 있다. 요즘 대부분의 데이터 시각화 도구는 기업용 보고 도구로 시작해 셀프 서비스 BI로 확장했다. 어떤 서비스는 셀프 서비스 데이터 시각화 도구로 출발한 뒤 고급 보고 기능을 추가하기도 했다. 일부는 데이터 호수(Data Lake)나 하둡(Hadoop)에서 대량의 데이터 세트를 읽어들이는 기능도 지원한다. 배포 방식은 클라우드 전용이거나 온프레미스 설치 등 다양하다. 데이터 시각화 BI 툴 몇 가지를 알아보자.