ExFairness.CrucibleStage (ExFairness v0.5.1)

Crucible.Stage implementation for fairness evaluation.

This stage integrates ExFairness into crucible_framework pipelines, providing fairness metric evaluation on model outputs.

Configuration

The stage uses fairness configuration from the experiment context:

%CrucibleIR.Reliability.Fairness{
  enabled: true,                    # Enable fairness evaluation
  metrics: [:demographic_parity, :equalized_odds, :equal_opportunity, :predictive_parity],
  group_by: :gender,                # Sensitive attribute field name
  threshold: 0.1,                   # Maximum acceptable disparity
  fail_on_violation: false,         # Whether to fail experiment on fairness violation
  options: %{}                      # Additional metric-specific options
}

Data Sources

The stage extracts data from two possible sources (in order of preference):

From assigns (preferred when pre-computed tensors available):
- context.assigns.fairness_predictions - Binary predictions tensor
- context.assigns.fairness_labels - Ground truth labels tensor
- context.assigns.fairness_sensitive - Sensitive attribute tensor
- context.assigns.fairness_probabilities - (Optional) Probabilities for calibration
From outputs (fallback):
- context.outputs - List of maps with :prediction, :label, sensitive attribute

Results

Results are stored in context.metrics.fairness:

%{
  metrics: %{
    demographic_parity: %{disparity: 0.05, passes: true, ...},
    equalized_odds: %{tpr_disparity: 0.03, fpr_disparity: 0.04, passes: true, ...},
    ...
  },
  overall_passes: true,
  violations: []
}

Example Usage

config = %CrucibleIR.Reliability.Fairness{
  enabled: true,
  metrics: [:demographic_parity, :equalized_odds],
  group_by: :gender,
  threshold: 0.1
}

context = %Crucible.Context{
  experiment: %{reliability: %{fairness: config}},
  outputs: [
    %{prediction: 1, label: 1, gender: 0},
    %{prediction: 0, label: 0, gender: 1}
  ]
}

{:ok, result} = ExFairness.CrucibleStage.run(context, %{})
result.metrics.fairness
# => %{metrics: %{...}, overall_passes: true, violations: []}

Summary

Types

context()

fairness_result()

opts()

Functions

describe(opts \\ %{})

Returns metadata about the fairness evaluation stage in canonical schema format.

run(context, opts \\ %{})

Runs fairness evaluation on model outputs in the context.