Evaluations에서 동적 Leaderboards 만들기

Weave Evaluations를 사용할 때 실험 결과를 Leaderboards로 시각화하고 사용자 지정할 수 있습니다. 저장된 Leaderboard 뷰는 동적으로 유지됩니다.

새 evaluation run이 추가되거나
결과가 저장된 필터와 일치하면

수동으로 다시 설정하지 않아도 Leaderboard가 자동으로 업데이트되어 해당 항목을 포함합니다. 따라서 뷰를 실험과 함께 계속 변화하는 지속형 Leaderboard로 사용할 수 있습니다.

Leaderboard에서 Evaluation 결과 시각화

프로젝트에 Weave Evaluation 데이터가 포함되어 있으면 Evaluation 테이블을 사용해 필터링된 결과 하위 집합을 기반으로 Weave Leaderboard 뷰를 빠르게 만들 수 있습니다. Weave Leaderboard를 만들려면 다음 단계를 따르세요.

wandb.ai로 이동합니다.
Weave 사이드바 메뉴에서 Evaluations를 클릭합니다.
Evaluation 테이블에 필터를 적용해 비교하려는 모델, 데이터셋 또는 Runs로 데이터를 좁힙니다.
Evaluation 테이블 툴바에서 Visualize를 클릭합니다. Weave는 현재 테이블에서 필터링된 데이터만 사용해 Leaderboard 패널을 자동으로 생성합니다.
Leaderboard 패널 헤더에서 Configure를 클릭해 Edit Leaderboard 패널을 엽니다. Edit Leaderboard 패널에서는 모델, 데이터셋, scorers, 메트릭이 표시되는 방식을 세밀하게 제어할 수 있습니다.

다음은 필터링된 Evaluation 테이블이 Leaderboard로 시각화되는 방식과 생성된 Leaderboard를 어디에서 구성할 수 있는지 보여줍니다.

필터가 적용된 Evaluation 테이블, 테이블 툴바의 Visualize 버튼, 그리고 패널 헤더에 Configure 버튼이 있는 오른쪽의 결과 Leaderboard 패널을 보여주는 Evaluations 페이지.

표시 여부와 맞춤 이름으로 Leaderboard 요소 설정

다음은 Edit Leaderboard 패널과 네 개의 설정 탭(Models, Datasets, Scorers, Metrics)을 보여줍니다.

오른쪽에 Edit Leaderboard 패널이 열려 있고, Leaderboard를 설정하는 데 사용하는 Models, Datasets, Scorers, Metrics 탭이 표시된 Evaluations 페이지

Edit Leaderboard 패널에서는 다음 작업을 할 수 있습니다.

표시 켜기/끄기 체크하거나 체크 해제하여 Leaderboard에 표시할 모델, 데이터셋, Scorers, 메트릭을 선택합니다.
모델, 데이터셋, Scorers 이름 바꾸기 보기 쉬운 표시 이름을 지정합니다(예: 모델 run의 이름을 GPT-4로 바꾸거나 데이터셋 이름을 JokesV1로 바꾸기). 이름을 바꾼 항목은 다음과 같습니다.
- Leaderboard에 즉시 반영됩니다
- 계속 클릭할 수 있으므로 사이드 패널에서 원래 레퍼런스를 계속 열 수 있습니다
- Leaderboard 뷰가 사용되는 모든 곳에 자동으로 반영됩니다

이렇게 하면 기본 객체는 변경하지 않고도 의미 있고 사람이 읽기 쉬운 이름으로 실험을 더 쉽게 비교할 수 있습니다.

Leaderboard 메트릭 동작 및 색상 설정

Edit Leaderboard 패널에서 각 메트릭마다 다음 중 하나를 지정할 수 있습니다.

값이 높을수록 좋음, 또는
값이 낮을수록 좋음

이 설정은 Leaderboard의 색상 표시에 직접 영향을 줍니다.

녹색은 더 나은 값을 강조합니다.
빨간색은 더 나쁜 값을 강조합니다.
“값이 높을수록 좋음”과 “값이 낮을수록 좋음” 사이를 전환하면 색상이 자동으로 반대로 바뀝니다.

이렇게 하면 서로 다른 유형의 메트릭(예: 정확도, 지연 시간, 오류율)에서도 시각적 표시가 항상 정확하게 유지됩니다.

Leaderboard 뷰 저장 및 재사용

Edit Leaderboard 패널에서 Save를 클릭하면 사용자 지정한 Leaderboard를 재사용 가능한 뷰로 저장할 수 있습니다. 저장된 Leaderboard 뷰에는 다음이 포함됩니다.

선택한 모델, 데이터셋, scorers 및 메트릭
변경된 표시 라벨 이름
메트릭 방향 설정(값이 높을수록 좋은지, 낮을수록 좋은지)
적용된 필터

저장된 뷰 간 전환

저장된 뷰를 열려면 Evaluations 페이지 제목 옆의 메뉴() 버튼을 클릭합니다. 다음 작업을 할 수 있습니다.

기본 뷰로 돌아가 전체 데이터셋을 확인합니다.
저장된 뷰를 다시 열어 모든 맞춤 설정을 즉시 복원합니다.

저장된 뷰를 다시 열면 모든 이름 변경 사항과 메트릭 설정이 그대로 유지됩니다.

Get Started

Guides

Cookbooks

Reference

Details & Support

Leaderboard에서 Evaluation 결과 시각화

표시 여부와 맞춤 이름으로 Leaderboard 요소 설정

Leaderboard 메트릭 동작 및 색상 설정

Leaderboard 뷰 저장 및 재사용

저장된 뷰 간 전환

Get Started

Guides

Cookbooks

Reference

Details & Support

​Leaderboard에서 Evaluation 결과 시각화

​표시 여부와 맞춤 이름으로 Leaderboard 요소 설정

​Leaderboard 메트릭 동작 및 색상 설정

​Leaderboard 뷰 저장 및 재사용

​저장된 뷰 간 전환

Leaderboard에서 Evaluation 결과 시각화

표시 여부와 맞춤 이름으로 Leaderboard 요소 설정

Leaderboard 메트릭 동작 및 색상 설정

Leaderboard 뷰 저장 및 재사용

저장된 뷰 간 전환