Spanish Grammar Specification

View Source

Formal specification of Spanish grammar for the Nasty NLP library.

Overview

Spanish is a Romance language with:

  • Subject-verb-object (SVO) word order with flexibility (VSO, VOS possible)
  • Pro-drop (null subjects allowed)
  • Rich verb morphology with gender and number agreement
  • Post-nominal adjectives (with some exceptions)
  • Two copular verbs (ser/estar)
  • Clitic pronouns

Lexical Categories

Parts of Speech (Universal Dependencies Tagset)

Nouns (NOUN)

Spanish nouns have grammatical gender (masculine/feminine) and number (singular/plural).

casa (house, feminine)
libro (book, masculine)
casas (houses, plural)

Gender markers:

  • Masculine: typically ends in -o
  • Feminine: typically ends in -a
  • Exceptions: el día (masculine), la mano (feminine)

Verbs (VERB)

Spanish verbs conjugate for:

  • Person: 1st, 2nd, 3rd
  • Number: singular, plural
  • Tense: present, preterite, imperfect, future, conditional
  • Mood: indicative, subjunctive, imperative
  • Aspect: simple, progressive, perfect

Three conjugation classes: -ar, -er, -ir

Present tense patterns:

-ar: hablo, hablas, habla, hablamos, habláis, hablan
-er: como, comes, come, comemos, coméis, comen
-ir: vivo, vives, vive, vivimos, vivís, viven

Auxiliary verbs:

  • haber (perfective aspect)
  • ser (passive voice, copula)
  • estar (progressive aspect, copula)

Adjectives (ADJ)

Adjectives agree in gender and number with nouns. Most appear post-nominally:

casa grande (big house)
libros interesantes (interesting books)

Pre-nominal adjectives (limited set):

buen libro (good book)
mucha gente (many people)

Determiners (DET)

Articles:

  • Definite: el, la, los, las
  • Indefinite: un, una, unos, unas

Demonstratives: este, ese, aquel (+ gender/number variants)

Possessives: mi, tu, su, nuestro, vuestro (+ number variants)

Pronouns (PRON)

Subject pronouns (often omitted due to pro-drop):

  • yo, tú, él/ella/usted
  • nosotros/nosotras, vosotros/vosotras, ellos/ellas/ustedes

Object pronouns (clitics):

  • Direct object: me, te, lo/la, nos, os, los/las
  • Indirect object: me, te, le, nos, os, les
  • Reflexive: se

Adpositions (ADP)

Prepositions: a, de, en, con, por, para, sin, sobre, entre, desde, hasta, etc.

No postpositions in Spanish.

Adverbs (ADV)

Manner: -mente suffix (rápidamente, lentamente) Place: aquí, allí, cerca, lejos Time: ahora, ayer, mañana, siempre, nunca Degree: muy, más, menos, tan, bastante

Conjunctions

Coordinating (CCONJ): y, o, pero, ni, sino Subordinating (SCONJ): que, porque, cuando, si, aunque, mientras

Morphology

Verb Morphology

Present Tense (-ar verbs: hablar)

hablo (I speak)
hablas (you speak, informal)
habla (he/she speaks, you speak formal)
hablamos (we speak)
habláis (you all speak, Spain)
hablan (they/you all speak)

Preterite Tense (-ar verbs: hablar)

hablé (I spoke)
hablaste (you spoke)
habló (he/she spoke)
hablamos (we spoke)
hablasteis (you all spoke)
hablaron (they spoke)

Imperfect Tense

-ar: hablaba, hablabas, hablaba, hablábamos, hablabais, hablaban
-er/-ir: comía, comías, comía, comíamos, comíais, comían

Future Tense

hablaré, hablarás, hablará, hablaremos, hablaréis, hablarán

Gerund (Progressive)

-ar: hablando
-er: comiendo
-ir: viviendo

Past Participle (Perfect)

-ar: hablado
-er: comido
-ir: vivido

Noun Morphology

Plural formation:

  • Add -s if ends in vowel: casa → casas
  • Add -es if ends in consonant: ciudad → ciudades
  • No change if ends in -s (non-final stress): crisis → crisis

Gender agreement:

  • Adjectives match noun gender: gato blanco, gata blanca

Phrase Structure

Noun Phrase (NP)

NP  (Det) (Quantifier) N (AP) (PP) (RelClause)

Examples:

el gato             (Det N)
el gato negro       (Det N AP)
el gato de María    (Det N PP)
muchos libros       (Quant N)

Key features:

  • Determiners precede nouns
  • Most adjectives follow nouns
  • Prepositional phrases follow nouns
  • Relative clauses follow nouns

Verb Phrase (VP)

VP  (Aux) V (Clitic) (NP) (PP) (AdvP)

Examples:

come               (V)
está comiendo      (Aux V-gerund)
ha comido          (Aux V-participle)
lo vio             (Clitic V)
come una manzana   (V NP)
vive en Madrid     (V PP)

Clitic placement:

  • Proclitic (before verb): lo veo
  • Enclitic (attached to infinitive, gerund, imperative): verlo, viéndolo, dámelo

Prepositional Phrase (PP)

PP  P NP

Examples:

en la casa
de Madrid
con mis amigos
para ti

Common prepositions:

  • Location: en, a, de, desde, hasta
  • Instrumental: con
  • Benefactive: para
  • Causative: por

Adjective Phrase (AP)

AP  (AdvP) A

Examples:

muy grande (very big)
bastante interesante (quite interesting)

Adverbial Phrase (AdvP)

AdvP  (AdvP) Adv

Examples:

muy rápidamente
bastante bien

Sentence Structure

Basic Sentence

S  NP VP
S  VP          (pro-drop: null subject)

Examples:

El gato duerme.           (NP VP)
Duerme.                   (VP - pro-drop)
María lee un libro.       (NP VP NP)

Clause Structure

Clause  (NP) VP

Pro-drop examples:

Voy al parque.            (go-1sg to-the park: "I go to the park")
Comimos ayer.             (ate-1pl yesterday: "We ate yesterday")

Coordination

S  S Conj S
NP  NP Conj NP
VP  VP Conj VP

Conjunctions:

  • y (and), e (before i/hi)
  • o (or), u (before o/ho)
  • pero, mas (but)
  • sino (but rather)
  • ni (nor)

Examples:

Juan y María vinieron.
Come manzanas o naranjas.
No vino Juan sino Pedro.

Subordination

S  S SCONJ S

Subordinating conjunctions:

  • que (that)
  • porque (because)
  • cuando (when)
  • si (if)
  • aunque (although)
  • mientras (while)

Examples:

Dijo que vendría.              (He said that he would come)
Vino porque lo llamé.          (He came because I called him)
Lo haré cuando pueda.          (I'll do it when I can)

Relative Clauses

NP  NP RelClause
RelClause  RelPron Clause

Relative pronouns:

  • que (that/which/who)
  • quien/quienes (who)
  • cual/cuales (which)
  • cuyo/cuya/cuyos/cuyas (whose)
  • donde (where)
  • cuando (when)

Examples:

El libro que leí es bueno.          (The book that I read is good)
La mujer con quien hablé es mi tía.  (The woman with whom I talked is my aunt)

Question Formation

Wh-Questions

Question words (always with accent):

  • ¿Qué? (what)
  • ¿Quién/Quiénes? (who)
  • ¿Dónde? (where)
  • ¿Cuándo? (when)
  • ¿Por qué? (why)
  • ¿Cómo? (how)
  • ¿Cuál/Cuáles? (which)
  • ¿Cuánto/Cuánta/Cuántos/Cuántas? (how much/many)

Syntax:

¿Wh-word + V + (NP) + ...?

Examples:

¿Qué comes?                (What do you eat?)
¿Quién vino?               (Who came?)
¿Dónde vives?              (Where do you live?)
¿Cuándo llegaste?          (When did you arrive?)

Yes/No Questions

Intonation-based with optional inversion:

¿Comes manzanas?           (Do you eat apples?)
¿Vino Juan?                (Did Juan come?)

Punctuation: ¿ ... ?

Dependency Relations (Universal Dependencies)

Core Arguments

  • nsubj: nominal subject
    • El gato duerme. (gato → duerme)
  • obj: direct object
    • Come una manzana. (manzana → come)
  • iobj: indirect object
    • Di un libro a Juan. (Juan → di)

Non-core Dependents

  • obl: oblique nominal
    • Vive en Madrid. (Madrid → vive)
  • advmod: adverbial modifier
    • Come rápidamente. (rápidamente → come)
  • aux: auxiliary
    • Ha comido. (ha → comido)

Nominal Dependents

  • det: determiner
    • El gato (el → gato)
  • amod: adjectival modifier
    • Gato negro (negro → gato)
  • nmod: nominal modifier
    • Casa de María (María → casa)
  • case: case marking (preposition)
    • En la casa (en → casa)

Clausal Dependents

  • ccomp: clausal complement
    • Dijo que vendría. (vendría → dijo)
  • acl: adnominal clause
    • El libro que leí (leí → libro)
  • advcl: adverbial clause
    • Vino porque llamé. (llamé → vino)

Coordination

  • conj: conjunct
    • Juan y María (María → Juan)
  • cc: coordinating conjunction
    • Juan y María (y → María)

Special

  • mark: subordinating conjunction
    • Dijo que vendría. (que → vendría)
  • expl:pv: reflexive clitic
    • Se sentó. (se → sentó)

Semantic Roles

Based on PropBank/FrameNet conventions:

Core Arguments

  • ARG0: Agent (typically subject)
    • Juan comió la manzana. (Juan = ARG0)
  • ARG1: Patient/Theme (typically object)
    • Juan comió la manzana. (manzana = ARG1)
  • ARG2: Instrument, Benefactive, Attribute
    • Cortó el pan con un cuchillo. (cuchillo = ARG2)
  • ARG3: Starting point, Benefactive
    • Dio un libro a María. (María = ARG3)

Adjunct Arguments

  • ARGM-LOC: Location
    • Vive en Madrid. (en Madrid = ARGM-LOC)
  • ARGM-TMP: Time
    • Llegó ayer. (ayer = ARGM-TMP)
  • ARGM-MNR: Manner
    • Come rápidamente. (rápidamente = ARGM-MNR)
  • ARGM-CAU: Cause
    • Vino porque lo llamé. (porque lo llamé = ARGM-CAU)
  • ARGM-PRP: Purpose
    • Estudia para aprender. (para aprender = ARGM-PRP)

Coreference

Spanish coreference patterns:

Pronoun-Antecedent

Juan llegó. Él estaba cansado.
(Juan  él)

Null Subject (Pro-drop)

María llegó. Ø Estaba cansada.
(María  Ø)

Clitic-Antecedent

Vi a Juan. Lo saludé.
(Juan  lo)

Definite NP-Antecedent

Compré un libro. El libro es interesante.
(un libro  el libro)

Agreement constraints:

  • Gender: masculine/feminine
  • Number: singular/plural
  • Person: 1st/2nd/3rd

Special Constructions

Reflexives

Reflexive clitic se + verb:

Se lava. (He washes himself)
Se sienta. (He sits down)

Passive

Ser + past participle:

La casa fue construida. (The house was built)

Reflexive passive (more common):

Se construyó la casa. (The house was built)

Impersonal Se

Se habla español. (Spanish is spoken / One speaks Spanish)

Periphrastic Future

Ir a + infinitive:

Voy a comer. (I'm going to eat)

Progressive

Estar + gerund:

Estoy comiendo. (I'm eating)

Perfect

Haber + past participle:

He comido. (I have eaten)

References

  • Real Academia Española (RAE) - Nueva gramática de la lengua española
  • Universal Dependencies - Spanish treebanks
  • Butt & Benjamin - A New Reference Grammar of Modern Spanish
  • Bosque & Demonte - Gramática descriptiva de la lengua española