Configuration

DeepEvalEx can be configured via application config, environment variables, or runtime options.

Application Config

In config/config.exs:

config :deep_eval_ex,
  # Default LLM provider and model
  default_model: {:openai, "gpt-4o-mini"},

  # API keys
  openai_api_key: System.get_env("OPENAI_API_KEY"),
  anthropic_api_key: System.get_env("ANTHROPIC_API_KEY"),

  # Evaluation defaults
  default_threshold: 0.5,
  max_concurrency: 10,
  default_timeout: 60_000

Environment Variables

Variable	Description	Example
`OPENAI_API_KEY`	OpenAI API key	`sk-...`
`ANTHROPIC_API_KEY`	Anthropic API key	`sk-ant-...`
`DEEP_EVAL_DEFAULT_MODEL`	Override default model	`gpt-4o`

LLM Providers

OpenAI (Default)

config :deep_eval_ex,
  default_model: {:openai, "gpt-4o-mini"},
  openai_api_key: "sk-..."

Available models:

gpt-4o - Most capable
gpt-4o-mini - Fast and cost-effective (recommended)
gpt-4-turbo - Previous generation
gpt-3.5-turbo - Fastest, cheapest

Anthropic

config :deep_eval_ex,
  default_model: {:anthropic, "claude-3-haiku-20240307"},
  anthropic_api_key: "sk-ant-..."

Available models:

claude-3-opus-20240229 - Most capable
claude-3-sonnet-20240229 - Balanced
claude-3-haiku-20240307 - Fast and efficient

Ollama (Local)

config :deep_eval_ex,
  default_model: {:ollama, "llama3.2"}

Requires Ollama running locally on port 11434.

Runtime Options

Override configuration at evaluation time:

# Use a different model
{:ok, result} = GEval.evaluate(metric, test_case,
  adapter: :openai,
  model: "gpt-4o"
)

# Custom API key
{:ok, result} = GEval.evaluate(metric, test_case,
  api_key: "sk-different-key"
)

# Adjust timeout
{:ok, result} = GEval.evaluate(metric, test_case,
  timeout: 120_000  # 2 minutes
)

Concurrency Settings

Control parallel evaluation:

# In config
config :deep_eval_ex,
  max_concurrency: 20

# At runtime
results = DeepEvalEx.evaluate_batch(test_cases, metrics,
  concurrency: 50
)

Environment-Specific Config

Development

config/dev.exs:

config :deep_eval_ex,
  default_model: {:openai, "gpt-4o-mini"}  # Cheaper model

Test

config/test.exs:

config :deep_eval_ex,
  default_model: {:mock, "test"},  # Mock adapter
  default_timeout: 5_000

Production

config/runtime.exs:

config :deep_eval_ex,
  openai_api_key: System.fetch_env!("OPENAI_API_KEY"),
  default_model: {:openai, "gpt-4o"}

Telemetry

Enable logging:

# In application.ex
def start(_type, _args) do
  DeepEvalEx.Telemetry.attach_default_logger()
  # ...
end

Or custom handler:

:telemetry.attach(
  "my-handler",
  [:deep_eval_ex, :metric, :stop],
  fn _event, measurements, metadata, _config ->
    Logger.info("#{metadata.metric}: #{measurements.score}")
  end,
  nil
)

Configuration Priority

Runtime options (highest)
Environment variables
Application config
Default values (lowest)

← Previous Page Quick Start Guide

Next Page → ExUnit Integration