API Reference lextract v#0.1.2

Modules

LeXtract

LeXtract.Alignment

Aligns extracted entities back to their positions in source text.

LeXtract.AlignmentStatus

Represents the quality/status of text alignment.

LeXtract.AnnotatedDocument

Represents a document with extracted entities and relationships.

LeXtract.Annotator

Annotates documents with extractions using LLMs.

LeXtract.CharInterval

Represents a character position interval in text.

LeXtract.Chunking

Integrates semantic text chunking with tokenization for document processing.

LeXtract.Config

Configuration for extraction operations using NimbleOptions for validation.

LeXtract.Document

Represents an input document for information extraction.

LeXtract.Error

Main error aggregator for LeXtract using Splode.

LeXtract.Error.External

Error class for external service and resource failures.

LeXtract.Error.External.Annotation

Error for LLM annotation/inference failures.

LeXtract.Error.External.TemplateRead

Error for template file I/O failures.

LeXtract.Error.External.TokenizerLoad

Error for tokenizer loading failures.

LeXtract.Error.Invalid

Error class for validation and format errors.

LeXtract.Error.Invalid.Config

Error for configuration validation failures.

LeXtract.Error.Invalid.Format

Error for unknown or invalid format types.

LeXtract.Error.Invalid.Template

Error for invalid template structure or content.

LeXtract.Error.Processing

Error class for processing pipeline failures.

LeXtract.Error.Processing.Alignment

Error for text alignment failures.

LeXtract.Error.Processing.Chunking

Error for text chunking failures.

LeXtract.Error.Processing.Parsing

Error for JSON/YAML parsing failures.

LeXtract.Error.Processing.Resolution

Error for extraction resolution failures.

LeXtract.Error.Processing.Tokenization

Error for tokenization failures.

LeXtract.Error.Unknown

Error class for unexpected errors.

LeXtract.Error.Unknown.Unknown

Catch-all error for truly unexpected failures.

LeXtract.ExampleData

Represents a training example for extraction with input text and expected output.

LeXtract.Extraction

Represents a single extracted entity with alignment information.

LeXtract.FormatHandler

Handles detection and parsing of different text formats (JSON, YAML).

LeXtract.FormatType

Enumeration of supported format types for parsing LLM outputs.

LeXtract.Prompting

Prompt generation for LLM extraction.

LeXtract.Resolver

Parses LLM output into Extraction structs.

LeXtract.Schema

Generate and manage NimbleOptions schemas from extraction examples.

LeXtract.Schema.Analyzer

Analyzes example extractions to infer schema information.

LeXtract.TextChunk

Represents a chunk of text from a document, used for processing long documents.

LeXtract.TokenInterval

Represents a token position interval.

LeXtract.Tokenizer

Tokenization wrapper using Hugging Face Tokenizers library.