(초보자용 TIL) 32일차. Tableau를 사용한 실습 교육(8) – ATTR, 결합된 필드, 집계, LOD



1. ATTR의 간단한 예

1.1 값이 하나뿐인 행 ​​찾기

→ 한 번만 판매된 상품 가져오기

– 판매되지 않는 제품은 일반적으로 제거됩니다.


– 단, 한번만 판매되는 상품은 별도의 리스팅을 생성하여 관리합니다.


– 한 번만 팔리는 상품은 절대 안팔리는 것과는 완전히 다릅니다!
(전자상거래에서 중요)

단 하나의 값으로 행 목록 만들기

① Order ID 필드를 속성에 드래그 앤 드롭합니다.

② Order ID를 필터에 드래그 앤 드롭

③ 필터에서 여러 값 제거


1.2 문자열 집계

→ 동일한 차원의 다른 집계(자주 사용되지 않음)

Region에서 Central은 합계를 나타내고 나머지 지역은 평균을 나타냅니다.

① 계산된 필드 만들기

// 잘못된 식
IF (Region) = 'Central' THEN SUM((Sales))
ELSE AVG((Sales))
END

// 수정한 식 → ATTR 추가
IF ATTR((Region)) = 'Central' THEN SUM((Sales))
ELSE AVG((Sales))
END

② 측정값으로 추가


1.3 단일가치/다가치부가가치 확인

→ 국가 필드를 툴팁의 속성으로 끌어다 놓습니다.

세부 수준이 깊은지 얕은지 식별할 수 있습니다.



2. 결합된 필드-차원 정렬 중첩 설정

기본 정렬을 하면 데이터의 모든 범주가 ​​범주별로 정렬되지 않고 전체적으로 정렬됩니다.

즉, 카테고리별 특정 값으로 정렬되지 않기 때문에 카테고리별 오름차순 순위를 확인하기 어렵습니다.

▼ 아래 이미지에서 상태별 정렬은 모든 카테고리에 적용됩니다.


그래서 이 경우 “복합 필드”를 만들어서 정렬할 수 있습니다.

① 카테고리 필드와 시/도 필드를 Ctrl + 클릭

② 우클릭 > 생성 > 조합 필드

③ 조합필드를 상세정보로 드래그 앤 드롭

④ 합친 필드 우클릭 > 정렬


태그 안의 디테일(콤보 필드)은 색상 위에 있어야 합니다!

그렇지 않으면 시/도별로 정렬합니다.


결합된 필드에서 텍스트가 생성됨 → 사용해 보기


3. 조립

3.1 컬렉션이란?

– 둘을 분리(IN 또는 OUT 결정)

– 필터의 기능은 비슷하지만 차이점은 무엇입니까?
– 필터: 내가 관심 있는 콘텐츠만 화면에 표시되고 나머지는 제외됩니다.


– 설정 : 관심있음, 상관없음, 제외하지 않음(그냥 기준을 설정하고 모두 표시)
→ 세트는 필터보다 상위 개념입니다(세트에는 필터가 포함되어 있기 때문).
→ 따라서 필터로 컬렉션이 있으면 필터에서도 사용할 수 있습니다.

– T/F 필터와 어떻게 다른가?
– 보기는 낮은 차원에서는 동일하지만 차원(예: 범주)이 심화되면 다릅니다.

– T/F 필터: 임계값 이상의 범주만 색상이 변경됩니다.

항목은 개별적으로 확인해야 합니다.

– 설정: 모든 카운트가 적용되면 해당 기준에 따라 모든 색상이 변경됩니다.

이익은 합계로 상위 n명의 고객을 나타냅니다.

① 파라미터 생성(Top Customers / 해당 데이터에서 생성)

② 컬렉션 생성(수익별 상위 고객/해당 데이터에서 생성)


③ 컬렉션을 행으로 끌어다 놓습니다.

수집 조건에 맞는 데이터는 IN으로, 조건에 맞지 않는 데이터는 OUT으로 표현


3.2 컬렉션 만들기

① 판매 기반 가치 매개변수(sales_thres) 생성

② 컬렉션 생성(판매고객-컬렉션)

→ 조건 > 수식 기준

// 매출액 총 액이 기준 값 이상인 데이터
SUM((Sales)) >= (sales thres)

③ 위 설정을 색상으로 드래그 앤 드롭

판매기준치 (sales_thres) 이상의 데이터만 빨간색으로 표시됩니다.


3.3 설정 및 T/F 필드(필터)

1) 세트와 T/F 도메인 비교(낮은 차원)

결과는 수집 및 T/F 필드와 동일합니다.

① T/F 필드 생성(동일한 계산식 세트)

// 집합 조건에 넣었던 식과 동일함
SUM((Sales)) >= (sales thres)

② T/F 필드를 색상으로 드래그


2) 세트와 T/F 도메인 비교(높은 차원)

설정 및

단순히 합계가 아닌 범주를 표현하여 확인해보자.

사용 설정

카테고리를 추가하더라도 합계가 기준치를 초과하면 색상이 IN으로 표시됩니다.

Set의 경우 Customer Name으로 생성되었으므로 sum으로 표현한다.

카테고리를 추가해도 변경되지 않습니다.


T/F 필드 사용

T/F 필드의 기준은 현재 표시되는 값인 VLOD의 값입니다.

따라서 각 카테고리의 판매량에서도 기준치를 초과하는 수치만 색상별로 IN으로 표기하게 됩니다.

3.4 집계 및 고정 LOD

설정 = 고정 LOD + 필터

그렇다면 세트 대신 고정된 LOD를 사용하는 것이 좋지 않을까요?

→ 성능 테스트에서는 고정된 LOD가 느리기 때문에 앙상블을 사용하는 것이 좋습니다.

① fixed LOD 함수를 사용하여 필드(fixed_sales thred)를 생성합니다.

// 식은 집합에서 사용한 식과 동일
{ FIXED (Customer Name) : SUM((Sales))>=(sales thres)}

② 필드를 Color로 드래그 앤 드롭


3.5 추가 예시

총 매출 10,000 이상 고객의 매출 합계

→ 주로 비율 확인에 사용

1) T/F 필드 사용

기준치 대비 카테고리별 합계


2) 컬렉션 사용

총 판매량이 10,000인 고객은 색상 코드 IN입니다.

+) IN에 해당하는 고객매출의 합계를 숫자로 표현



4.LOD

VLOD를 변경할 수 있는 것은 “차원”입니다.

→ 플래그를 변경하는 모든 기능으로 VLOD를 변경할 수 있습니다.

(열, 행 등)

포함

– VLOD에 보이지 않는 백엔드에 차원을 추가하려면 다음을 사용하십시오.

– 사이즈 확인 가능

제외

– VLOD에 보이지 않는 백엔드에서 차원을 제거하려면 다음을 사용하십시오.

– 비중 확인 가능

고정

– FIXED로 고정된 치수가 VLOD에 표시되는 경우
– FIXED로 고정된 치수가 VLOD에 표시되지 않는 경우

– 고정 치수 + 표준

4.1 포함

첫째, 데이터셋의 깊이는 상대적으로 깊어야 합니다.


2회 카운트가 필요한 경우(최대 평균, 평균 최소값 등)

데이터는 INCLUDE가 적용된 것보다 더 높은 깊이에서 비교할 수 있습니다.

1) 이론의 이해

① include(include_sub_avg_sales)를 사용하여 필드 생성

→ 하위 범주별 매출 평균 계산

{ INCLUDE (Sub-Category):AVG((Sales))}

② 비교는 2축 반사 x / 반사 o 다이어그램 포함

하위 범주 기반

→ 내포물이 있는 그래프와 없는 그래프가 같음


카테고리 기준

– 그래프는 포함되지 않음: 범주 내 모든 데이터의 평균

– 그래프 응용 프로그램에는 하위 범주 평균 데이터의 평균이 포함됩니다.

(예: 가구: (497+530+95+638)/4)


2) INCLUDE 사용 예

평균으로 보면 명확하지 않지만 실제로는 데이터 값 간에 큰 차이가 있는 경우가 있습니다.

INCLUDE를 사용하여 이를 확인할 수 있습니다.

신청 전 차트에는 다음이 포함됩니다.

뉴욕의 평균 매출이 높지 않은 것을 알 수 있습니다.


포함 적용 후 그래프(각 시/도 내에서 최대값과 최소값으로 도시를 나타냄)

① 이에 적용할 include 필드를 생성합니다.

// include_city_avg_sales

{include (City): AVG((Sales))}

② Include 필드의 최소값과 최대값을 이중 축으로 그래픽 표현

③ 최소값과 최대값의 차이로 정렬

→ 최소값과 최대값의 차이를 계산하는 필드 생성

// diff
max((include_city_avg_sales))-MIN((include_city_avg_sales))

→ 시/도 우클릭 > 정렬


뉴욕은 최대매출액과 최소매출액의 차이가 가장 큽니다.

이 데이터에서 뉴욕의 빈부 격차가 매우 크다는 것을 알 수 있습니다.


4.2 제외

① exclude(exclude_sub_avg_sales)를 사용하여 필드 생성

→ Sub-Category 기준 평균매출액 산정 제외

{ EXCLUDE (Sub-Category):AVG((Sales))}

② exclude reflect x / reflect o plot을 biaxial과 비교

카테고리 기준

→ 제외가 반영된 그래프와 제외가 반영되지 않은 그래프 동일


하위 카테고리 기준

– 차트를 제외하지 않음: 범주 내 모든 데이터의 평균

들어오지 못하게 하다응용 그래프: 모든 클래스 데이터의 평균


2) EXCLUDE 사용 예

제외는 특정 값을 기준으로 차이 또는 비율을 검사하는 데 사용됩니다.

하위 카테고리 봉투 매출 합계와 하위 카테고리 매출 합계의 차이 찾기

① 소분류 봉투 매출 합계 계산

→ Envelopes 데이터만 출력하는 필드 생성

// sales - Envelopes
IF (Sub-Category) = 'Envelopes' THEN (Sales)
ELSE NULL
END

② Exclude를 사용하여 모든 Sub-Category의 봉투 판매 합계를 표시합니다.

→ Sub-Category의 데이터를 SUM((sales – Envelopes))으로 표현

// Exclude - Envelopes
{ EXCLUDE (Sub-Category):SUM((sales - Envelopes))}

③ 각 Sub-Category의 총 매출액에서 봉투의 총 매출액을 뺀다.

// Exclude_Sales - Envelopes
SUM((Sales)) - ATTR((Exclude - Envelopes))



리뷰

혜택 및 교훈

ATTR, 복합 필드, 컬렉션 및 LOD에 대해 배웠습니다.

개념이라 쉬운게 아니라 어려워서 이해가 안가는데, 스스로 기능을 익혀서 이해하려고 노력중입니다.

특히 오늘은 이 기능을 직접 학습한 덕분에 공부하면서 실험해 볼 수 있었습니다.

아쉬운점과 개선점

LOD를 이해하는 것은 어렵습니다.

예문을 보면 볼수록 혼란스러웠고 머릿속 생각은 복잡해졌습니다.

“왜 이렇게 표현하지?”

이 기능을 적용하기 위해 다른 데이터를 사용할 계획입니다!
🙂