Pipeline Dashboard

Overview

Pipeline

1Generate
2Rubric
3Run
4Score

Lab

Runs
Compare
Costs
Autoimprove
Plotting

Analysis

Stats
Analysis
Experiments

Reference

Skills
Tutorials

Analysis

Score comparison across models

Case

No score data for this case. Run the pipeline first:

uv run python scripts/04_score.py