LeXtract.Error.Processing.Tokenization exception (lextract v0.1.2)

Error for tokenization failures.

Raised when text cannot be tokenized, typically due to encoding issues or invalid character sequences.

Examples

iex> error = LeXtract.Error.Processing.Tokenization.exception(
...>   reason: "encoding failed"
...> )
iex> Exception.message(error)
"Tokenization failed: encoding failed"

iex> error = LeXtract.Error.Processing.Tokenization.exception(
...>   reason: "invalid UTF-8 sequence",
...>   text_sample: "test \xFF invalid"
...> )
iex> String.contains?(Exception.message(error), "invalid UTF-8")
true

Summary

Types

t()

Functions

exception(args)

Create an Elixir.LeXtract.Error.Processing.Tokenization without raising it.

message(exception)

Formats the error message for tokenization failures.