viva_tensor · v1.2.1

graph LR
    A["24 GB"] -->|"×8"| B["192 GB"]

Install

gleam add viva_tensor

import viva_tensor/nf4

let small = nf4.quantize(big_tensor, nf4.default_config())
// 8x less memory

flowchart LR
    T[Tensor] --> Q{Quantize}
    Q -->|4x| I[INT8]
    Q -->|8x| N[NF4]
    Q -->|8x| A[AWQ]

make test
make bench

docs/ — PT-BR, EN, 中文

✨