1. ATTR의 간단한 예
1.1 값이 하나뿐인 행 찾기
→ 한 번만 판매된 상품 가져오기
– 판매되지 않는 제품은 일반적으로 제거됩니다.
– 단, 한번만 판매되는 상품은 별도의 리스팅을 생성하여 관리합니다.
– 한 번만 팔리는 상품은 절대 안팔리는 것과는 완전히 다릅니다!
(전자상거래에서 중요)
단 하나의 값으로 행 목록 만들기
① Order ID 필드를 속성에 드래그 앤 드롭합니다.
② Order ID를 필터에 드래그 앤 드롭
③ 필터에서 여러 값 제거
1.2 문자열 집계
→ 동일한 차원의 다른 집계(자주 사용되지 않음)
Region에서 Central은 합계를 나타내고 나머지 지역은 평균을 나타냅니다.
① 계산된 필드 만들기
// 잘못된 식
IF (Region) = 'Central' THEN SUM((Sales))
ELSE AVG((Sales))
END
▼
// 수정한 식 → ATTR 추가
IF ATTR((Region)) = 'Central' THEN SUM((Sales))
ELSE AVG((Sales))
END
② 측정값으로 추가
1.3 단일가치/다가치부가가치 확인
→ 국가 필드를 툴팁의 속성으로 끌어다 놓습니다.
세부 수준이 깊은지 얕은지 식별할 수 있습니다.
2. 결합된 필드-차원 정렬 중첩 설정
기본 정렬을 하면 데이터의 모든 범주가 범주별로 정렬되지 않고 전체적으로 정렬됩니다.
즉, 카테고리별 특정 값으로 정렬되지 않기 때문에 카테고리별 오름차순 순위를 확인하기 어렵습니다.
▼ 아래 이미지에서 상태별 정렬은 모든 카테고리에 적용됩니다.
그래서 이 경우 “복합 필드”를 만들어서 정렬할 수 있습니다.
① 카테고리 필드와 시/도 필드를 Ctrl + 클릭
② 우클릭 > 생성 > 조합 필드
③ 조합필드를 상세정보로 드래그 앤 드롭
④ 합친 필드 우클릭 > 정렬
태그 안의 디테일(콤보 필드)은 색상 위에 있어야 합니다!
그렇지 않으면 시/도별로 정렬합니다.
결합된 필드에서 텍스트가 생성됨 → 사용해 보기
3. 조립
3.1 컬렉션이란?
– 둘을 분리(IN 또는 OUT 결정)
– 필터의 기능은 비슷하지만 차이점은 무엇입니까?
– 필터: 내가 관심 있는 콘텐츠만 화면에 표시되고 나머지는 제외됩니다.
– 설정 : 관심있음, 상관없음, 제외하지 않음(그냥 기준을 설정하고 모두 표시)
→ 세트는 필터보다 상위 개념입니다(세트에는 필터가 포함되어 있기 때문).
→ 따라서 필터로 컬렉션이 있으면 필터에서도 사용할 수 있습니다.
– T/F 필터와 어떻게 다른가?
– 보기는 낮은 차원에서는 동일하지만 차원(예: 범주)이 심화되면 다릅니다.
– T/F 필터: 임계값 이상의 범주만 색상이 변경됩니다.
항목은 개별적으로 확인해야 합니다.
– 설정: 모든 카운트가 적용되면 해당 기준에 따라 모든 색상이 변경됩니다.
이익은 합계로 상위 n명의 고객을 나타냅니다.
① 파라미터 생성(Top Customers / 해당 데이터에서 생성)
② 컬렉션 생성(수익별 상위 고객/해당 데이터에서 생성)
③ 컬렉션을 행으로 끌어다 놓습니다.
수집 조건에 맞는 데이터는 IN으로, 조건에 맞지 않는 데이터는 OUT으로 표현
3.2 컬렉션 만들기
① 판매 기반 가치 매개변수(sales_thres) 생성
② 컬렉션 생성(판매고객-컬렉션)
→ 조건 > 수식 기준
// 매출액 총 액이 기준 값 이상인 데이터
SUM((Sales)) >= (sales thres)
③ 위 설정을 색상으로 드래그 앤 드롭
판매기준치 (sales_thres) 이상의 데이터만 빨간색으로 표시됩니다.
3.3 설정 및 T/F 필드(필터)
1) 세트와 T/F 도메인 비교(낮은 차원)
결과는 수집 및 T/F 필드와 동일합니다.
① T/F 필드 생성(동일한 계산식 세트)
// 집합 조건에 넣었던 식과 동일함
SUM((Sales)) >= (sales thres)
② T/F 필드를 색상으로 드래그
2) 세트와 T/F 도메인 비교(높은 차원)
설정 및
단순히 합계가 아닌 범주를 표현하여 확인해보자.
사용 설정
카테고리를 추가하더라도 합계가 기준치를 초과하면 색상이 IN으로 표시됩니다.
Set의 경우 Customer Name으로 생성되었으므로 sum으로 표현한다.
카테고리를 추가해도 변경되지 않습니다.
T/F 필드 사용
T/F 필드의 기준은 현재 표시되는 값인 VLOD의 값입니다.
따라서 각 카테고리의 판매량에서도 기준치를 초과하는 수치만 색상별로 IN으로 표기하게 됩니다.
3.4 집계 및 고정 LOD
설정 = 고정 LOD + 필터
그렇다면 세트 대신 고정된 LOD를 사용하는 것이 좋지 않을까요?
→ 성능 테스트에서는 고정된 LOD가 느리기 때문에 앙상블을 사용하는 것이 좋습니다.
① fixed LOD 함수를 사용하여 필드(fixed_sales thred)를 생성합니다.
// 식은 집합에서 사용한 식과 동일
{ FIXED (Customer Name) : SUM((Sales))>=(sales thres)}
② 필드를 Color로 드래그 앤 드롭
3.5 추가 예시
총 매출 10,000 이상 고객의 매출 합계
→ 주로 비율 확인에 사용
1) T/F 필드 사용
기준치 대비 카테고리별 합계
2) 컬렉션 사용
총 판매량이 10,000인 고객은 색상 코드 IN입니다.
+) IN에 해당하는 고객매출의 합계를 숫자로 표현
4.LOD
VLOD를 변경할 수 있는 것은 “차원”입니다.
→ 플래그를 변경하는 모든 기능으로 VLOD를 변경할 수 있습니다.
(열, 행 등)
포함
– VLOD에 보이지 않는 백엔드에 차원을 추가하려면 다음을 사용하십시오.
– 사이즈 확인 가능
제외
– VLOD에 보이지 않는 백엔드에서 차원을 제거하려면 다음을 사용하십시오.
– 비중 확인 가능
고정
– FIXED로 고정된 치수가 VLOD에 표시되는 경우
– FIXED로 고정된 치수가 VLOD에 표시되지 않는 경우
– 고정 치수 + 표준
4.1 포함
첫째, 데이터셋의 깊이는 상대적으로 깊어야 합니다.
2회 카운트가 필요한 경우(최대 평균, 평균 최소값 등)
데이터는 INCLUDE가 적용된 것보다 더 높은 깊이에서 비교할 수 있습니다.
1) 이론의 이해
① include(include_sub_avg_sales)를 사용하여 필드 생성
→ 하위 범주별 매출 평균 계산
{ INCLUDE (Sub-Category):AVG((Sales))}
② 비교는 2축 반사 x / 반사 o 다이어그램 포함
하위 범주 기반
→ 내포물이 있는 그래프와 없는 그래프가 같음
카테고리 기준
– 그래프는 포함되지 않음: 범주 내 모든 데이터의 평균
– 그래프 응용 프로그램에는 하위 범주 평균 데이터의 평균이 포함됩니다.
(예: 가구: (497+530+95+638)/4)
2) INCLUDE 사용 예
평균으로 보면 명확하지 않지만 실제로는 데이터 값 간에 큰 차이가 있는 경우가 있습니다.
INCLUDE를 사용하여 이를 확인할 수 있습니다.
신청 전 차트에는 다음이 포함됩니다.
뉴욕의 평균 매출이 높지 않은 것을 알 수 있습니다.
포함 적용 후 그래프(각 시/도 내에서 최대값과 최소값으로 도시를 나타냄)
① 이에 적용할 include 필드를 생성합니다.
// include_city_avg_sales
{include (City): AVG((Sales))}
② Include 필드의 최소값과 최대값을 이중 축으로 그래픽 표현
③ 최소값과 최대값의 차이로 정렬
→ 최소값과 최대값의 차이를 계산하는 필드 생성
// diff
max((include_city_avg_sales))-MIN((include_city_avg_sales))
→ 시/도 우클릭 > 정렬
뉴욕은 최대매출액과 최소매출액의 차이가 가장 큽니다.
이 데이터에서 뉴욕의 빈부 격차가 매우 크다는 것을 알 수 있습니다.
4.2 제외
① exclude(exclude_sub_avg_sales)를 사용하여 필드 생성
→ Sub-Category 기준 평균매출액 산정 제외
{ EXCLUDE (Sub-Category):AVG((Sales))}
② exclude reflect x / reflect o plot을 biaxial과 비교
카테고리 기준
→ 제외가 반영된 그래프와 제외가 반영되지 않은 그래프 동일
하위 카테고리 기준
– 차트를 제외하지 않음: 범주 내 모든 데이터의 평균
– 들어오지 못하게 하다응용 그래프: 모든 클래스 데이터의 평균
2) EXCLUDE 사용 예
제외는 특정 값을 기준으로 차이 또는 비율을 검사하는 데 사용됩니다.
하위 카테고리 봉투 매출 합계와 하위 카테고리 매출 합계의 차이 찾기
① 소분류 봉투 매출 합계 계산
→ Envelopes 데이터만 출력하는 필드 생성
// sales - Envelopes
IF (Sub-Category) = 'Envelopes' THEN (Sales)
ELSE NULL
END
② Exclude를 사용하여 모든 Sub-Category의 봉투 판매 합계를 표시합니다.
→ Sub-Category의 데이터를 SUM((sales – Envelopes))으로 표현
// Exclude - Envelopes
{ EXCLUDE (Sub-Category):SUM((sales - Envelopes))}
③ 각 Sub-Category의 총 매출액에서 봉투의 총 매출액을 뺀다.
// Exclude_Sales - Envelopes
SUM((Sales)) - ATTR((Exclude - Envelopes))
리뷰
혜택 및 교훈
ATTR, 복합 필드, 컬렉션 및 LOD에 대해 배웠습니다.
개념이라 쉬운게 아니라 어려워서 이해가 안가는데, 스스로 기능을 익혀서 이해하려고 노력중입니다.
특히 오늘은 이 기능을 직접 학습한 덕분에 공부하면서 실험해 볼 수 있었습니다.
아쉬운점과 개선점
LOD를 이해하는 것은 어렵습니다.
예문을 보면 볼수록 혼란스러웠고 머릿속 생각은 복잡해졌습니다.
“왜 이렇게 표현하지?”
이 기능을 적용하기 위해 다른 데이터를 사용할 계획입니다!
🙂