Edifice.Generative.Diffusion (Edifice v0.2.0)

Diffusion Policy: Action generation via denoising diffusion.

Implements Diffusion Policy from "Diffusion Policy: Visuomotor Policy Learning via Action Diffusion" (Chi et al., RSS 2023). Instead of directly predicting actions, we learn to denoise random noise into actions conditioned on observations.

Key Innovation: DDPM for Actions

Traditional policies: a = pi(o) - direct mapping Diffusion Policy: a = denoise(noise | o) - iterative refinement

Training:
  1. Sample action sequence a_0 from data
  2. Add noise: a_t = sqrt(alpha_bar_t)*a_0 + sqrt(1-alpha_bar_t)*eps
  3. Predict noise: eps_hat = network(a_t, t, obs)
  4. Loss: ||eps - eps_hat||^2

Inference:
  1. Sample a_T ~ N(0, I)
  2. For t = T...1: a_{t-1} = denoise(a_t, t, obs)
  3. Return a_0

Architecture

Observations [batch, obs_dim]
      |
      v
+-------------------------------------+
|  Observation Encoder                 |
|  (MLP or temporal backbone)          |
+-------------------------------------+
      |
      v obs_embed
+-------------------------------------+
|  Denoising Network                   |
|  Input: (noisy_actions, timestep,    |
|          obs_embed)                  |
|  Output: predicted_noise             |
+-------------------------------------+
      |
      v
Denoised Actions [batch, action_horizon, action_dim]

Advantages

Feature	Benefit
Multi-modal	Can represent multiple valid actions
High-dim	Scales well to action sequences
Stable	MSE loss is simple and stable
Expressive	Captures complex action distributions

Usage

# Build diffusion policy
model = Diffusion.build(
  obs_size: 287,
  action_dim: 64,
  action_horizon: 8,
  num_diffusion_steps: 100
)

# Training: predict noise
{loss, predicted_noise} = Diffusion.training_step(
  model, params, observations, actions, key
)

# Inference: denoise to get actions
actions = Diffusion.sample(model, params, observations, key)

References

Paper: https://arxiv.org/abs/2303.04137
Project: https://diffusion-policy.cs.columbia.edu/

Summary

Types

build_opt()

Options for build/1.

Functions

build(opts \\ [])

Build a Diffusion Policy model.

build_denoiser(noisy_actions, timestep, observations, opts)

Build the denoising network (noise predictor).

build_obs_encoder(opts \\ [])

Build the observation encoder for temporal inputs.

compute_loss(true_noise, predicted_noise)

Compute training loss: MSE between true and predicted noise.

default_action_horizon()

Default action prediction horizon

default_beta_end()

Beta schedule end

default_beta_start()

Beta schedule start

default_hidden_size()

Default hidden dimension

default_num_layers()

Default number of denoiser layers

default_num_steps()

Default number of diffusion timesteps

fast_inference_defaults()

Fast inference configuration with fewer diffusion steps.

make_schedule(opts \\ [])

Precompute diffusion schedule constants.

output_size(opts \\ [])

Get the output size of a Diffusion Policy model.

p_sample(noisy_actions, predicted_noise, timestep, random_noise, schedule)

Single denoising step (reverse process).

param_count(opts)

Calculate approximate parameter count for a Diffusion Policy model.

q_sample(actions, timestep, noise, schedule)

Forward diffusion: add noise to actions.

recommended_defaults()

Get recommended defaults for action generation.