처음부터 데이터 분석 시작하기 - PowerBi 시작하기
이 글은 모든 사람이 BI 도구인 PowerBi의 사용법을 이해하는 데 도움이 됩니다. 이 글을 통해 지식 없이도 나만의 시각적 사이니지를 쉽게 구축할 수 있습니다! 일부 다른 주류 BI 도구는 향후 출시될 예정이지만 BI 도구의 전반적인 논리와 사용 방식은 유사합니다.
1. 테이블의 개념
powerbi를 정식으로 소개하기 전에 '테이블'의 개념에 대한 깊은 이해가 매우 필요합니다.
1. 테이블 카테고리: 차원 테이블 및 사실 테이블
(1) 사실 테이블: 주요 특징은 데이터의 각 행이 이벤트, 사실 또는 기록을 나타내는 경우가 많다는 것입니다. 추출됩니다. 측정 정보와 대량의 데이터를 포함하고 있으며, 데이터 테이블(예: 판매 데이터 테이블, 주문 데이터 테이블, 사용자 행동 데이터 테이블 등)이라고도 합니다.
(2) 차원 테이블: 날짜, 상점 이름, 제품 ID, 고객 ID 등 반복되지 않는 고유 필드를 포함하여 카테고리 속성 정보와 소량의 데이터가 포함되어 있다는 것이 주요 특징입니다. . Excel에서는 Vlookup 함수의 대상 쿼리 테이블(예: 달력 테이블, 매장 정보 테이블, 제품 테이블, 고객 정보 테이블 등)로 자주 사용하기 때문에 조회 테이블이라고도 합니다.
2. 차원 테이블 및 팩트 테이블의 예
모든 사람이 쉽게 이해할 수 있도록 예를 들어보세요.
이 테이블은 팩트 테이블입니다. 각 항목별로 팩트를 기록하는 것을 볼 수 있습니다:
위의 팩트 테이블과 비교하면 다음 표는 차원 테이블입니다.
2. PowerBi 기본 사항
1. PowerBi 소개: PowerBi는 관련 데이터 소스를 일관되고 시각적으로 사실적인 대화형 통찰력으로 변환하기 위해 함께 작동하는 소프트웨어 서비스, 애플리케이션 및 커넥터의 조합입니다.
2. 데이터 시각화의 정의: 데이터와 이미지의 결합을 통해 보다 직관적으로 정보를 얻는다.
3. Power Bi는 크게 파워 쿼리(데이터 분석 표현), 데이터 모델링, 시각적 대시보드의 세 부분으로 구성됩니다.
(1) 파워 쿼리: 편집 쿼리는 작업을 닫고 적용한 후 편집 가능한 쿼리에 저장되는 데 도움이 됩니다.
(2) 데이터 모델링: 특정 필드(1:1 또는 1:다)를 통해 차원 테이블과 팩트 테이블 간의 대응 관계를 구축하여 데이터를 연결합니다. 관계형 뷰라고도 합니다.
(3) 비주얼 간판 : 다양한 비주얼 컴포넌트, 슬라이서 등을 통해 비주얼 간판 구축을 완성합니다.
4. 측정값 및 DAX
(1) 측정값: 주요 지표를 표시하는 데 사용됩니다. Power Bi에는 측정 값이 수식 형태로 존재하며 데이터 테이블에 새 열이나 행이 생성되지 않는다는 점을 이해할 수 있습니다. 따라서 EXCEL에 컬럼을 직접 삽입하여 많은 양의 새로운 데이터가 생성되는 것에 비해 측정값은 메모리를 거의 차지하지 않습니다. 측정값을 구성하는 언어를 DAX(Data Analysis Expression)라고 합니다.
(2) DAX: EXCEL의 수식은 셀(예: 'A1', 'B3')을 참조한다는 점을 제외하면 EXCEL의 수식과 매우 유사합니다. DAX는 테이블의 열 이름을 나타냅니다.
예: [Sales]=sum('Sales data'[Quantity])
참고: DAX에서 작은따옴표 ''는 테이블 이름입니다. 대괄호 []는 열 이름입니다.
시각적 대시보드를 구축하려는 경우 일반적인 프로세스는 데이터 수집 → 데이터 정리 → 데이터 모델링 → 시각적 대시보드 구성으로 나눌 수 있습니다. 다음은 세부사항을 단계별로 소개하겠습니다.
3. 데이터 수집
PowerBi는 Excel, CSV, 폴더 등 다양한 로컬 파일과 같은 여러 데이터 소스를 지원합니다. Oracle, Mysql 등 다양한 데이터베이스를 지원합니다. 프런트 엔드가 테이블로 구성된 웹 등을 지원합니다.
엑셀을 예로 들어보겠습니다. 엑셀 파일에는 여러 개의 시트가 포함될 수 있으므로 왼쪽에서 확인하고 클릭하여 불러올 수 있습니다. "데이터 변환"이란 데이터를 PowerBi에 로드하기 전에 전처리할 수 있음을 의미합니다. 물론 로드한 후에도 처리할 수 있습니다. 단, 데이터의 양이 너무 크거나 데이터 소스에 쓸모없는 열이나 행이 많은 경우에는 데이터를 로드하기 전에 데이터를 전처리하는 것이 좋습니다. (전처리 방법은 데이터 정리 방법과 동일하며, 자세한 내용은 데이터 정리 장에서 설명하겠습니다.
4. 데이터 클리닝
데이터 클리닝이란? 한 문장으로 요약하면, 데이터를 원하는 대로 바꿔서 사용할 수 있다는 것입니다.
(1) 데이터 정리 방법 및 방법
방법은 정리를 수행하는 도구 또는 방법을 의미합니다. 예를 들어 Powerbi의 파워 쿼리를 통해 또는 로드하기 전에 정리할 수 있습니다. Powerbi에서는 SQL 프로그램을 통해 데이터 정리가 이루어집니다.
방법에는 Null 값 제거, 중복 값 제거, 열 병합, 열 분할, 데이터 유형 수정, 데이터 피벗 해제 등이 포함됩니다.
(2) 파워 쿼리를 예로 들면 파워 쿼리 도구 모음의 다양한 방법을 통해 데이터 정리를 구현할 수 있습니다.
파워 쿼리 인터페이스에서 Powerbi "데이터 변환"을 클릭합니다. "를 입력할 수 있습니다. 그림의 1부는 수행할 수 있는 데이터 정리 방법을 보여줍니다. 그림의 2부는 Powerbi에 로드된 데이터를 보여줍니다. 그림의 3부는 수행한 각 작업의 기록을 기록합니다(예: , 열을 삭제하면 열 삭제 작업이 오른쪽에 기록됩니다.
청소가 완료된 후 왼쪽 상단에서 닫기 및 적용을 클릭하면 모든 배경 데이터가 저장되고 캔버스 인터페이스로 돌아갑니다.
5. 데이터 시각화
데이터를 획득하고 정리한 후 정리된 데이터를 사용하여 대시보드를 구축할 수 있습니다.
1. 캔버스 기능 인터페이스 소개
그 중 일부는 기능 영역이며 일반적으로 사용되는 영역에는 데이터 가져오기, 데이터 변환, 새로 고침 등이 포함됩니다.
위에서 아래로 구성되는 부분은 캔버스 표시, 데이터 개요, 데이터 모델링입니다. 데이터 모델링은 다양한 데이터 소스의 데이터를 연결하는 것을 의미합니다.
시각적 구성 요소를 사용할 수 있습니다(클릭 및 드래그). 시각적 구성 요소 아래에는 시각적 구성 요소에 의해 표시되는 필드가 있습니다(가로 및 세로 좌표에 표시되는 데이터로 간단히 이해할 수 있음).
데이터의 각 테이블 정보와 각 테이블의 각 컬럼 정보, 삽입된 측정값 정보를 표시하는 부분입니다.
2. 시각적 구성 요소 소개
(1) 막대 차트와 선 차트를 예로 들어 보겠습니다.
먼저 클릭하여 캔버스 인터페이스로 들어가고 시각적 구성 요소 유형을 선택한 다음 데이터의 필드를 X축 또는 Y축으로 끌어서 간단한 시각적 차트를 만듭니다.
(2) 차트 형식 편집
위 그림에서 빨간색 원 안이 아이콘 색상, 제목, 데이터 라벨 등 아이콘 형식 편집이고, "시각적 개체" 옵션에 있는 경우 변경하려는 속성을 찾을 수 없는 경우 "일반" 옵션에서 편집할 수 있습니다.