Edifice.WorldModel.WorldModel (Edifice v0.2.0)

World Model — learns a latent dynamics model of an environment.

Encodes observations into a latent space, predicts next-state transitions given actions, and optionally decodes back to observation space. This is the core component for model-based RL and planning.

Components

Encoder: obs → z — Maps raw observations to latent state
Dynamics: (z, action) → next_z — Predicts next latent state
Reward head: z → scalar — Predicts reward from latent state
Decoder (optional): z → obs — Reconstructs observations

Dynamics Variants

:mlp — Standard two-layer MLP transition
:neural_ode — Shared-weight Euler integration (continuous dynamics)
:gru — Gated recurrent update (good for partially observable envs)

Architecture

obs [batch, obs_size]
      |
+==============+
|   Encoder    |  dense → GELU → dense
+==============+
      |
z [batch, latent_size]
      |
+-----|-----+
|     |     |
v     v     v
Dynamics  Reward  Decoder (optional)
(z,a)→z'  z→r    z→obs

Returns

{encoder, dynamics, reward_head} or {encoder, dynamics, reward_head, decoder} when use_decoder: true.

Usage

{encoder, dynamics, reward_head} = WorldModel.build(
  obs_size: 64,
  action_size: 4,
  latent_size: 128,
  dynamics: :mlp
)

# With decoder for reconstruction loss
{encoder, dynamics, reward_head, decoder} = WorldModel.build(
  obs_size: 64,
  action_size: 4,
  dynamics: :gru,
  use_decoder: true
)

References

Ha & Schmidhuber, "World Models" (2018)
Hafner et al., "Dream to Control: Learning Behaviors by Latent Imagination" (Dreamer, 2020)
Hafner et al., "Mastering Diverse Domains through World Models" (DreamerV3, 2023)

Summary

Types

build_opt()

Options for build/1.

Functions

build(opts \\ [])

Build all world model components.

build_decoder(opts \\ [])

Build the observation decoder.

build_dynamics(opts \\ [])

Build the dynamics model.

build_encoder(opts \\ [])

Build the observation encoder.

build_reward_head(opts \\ [])

Build the reward prediction head.

output_size(opts \\ [])

Get the latent size of the world model.