¿Qué nos queda de las lenguas indígenas en el Caribe?

¿Qué nos queda de las lenguas indígenas en el Caribe?

Cristina Isabel Maymí
The University of Texas at Austin

I. Introducción

Durante la época precolombina, las islas del Caribe estaban habitadas por comunidades agrícolas y ceramistas descendientes de las olas migratorias provenientes de América del Sur. Rasgos comunes en las técnicas de cultivo (Carneiro, 1961), actividades culturales (Guitar, 2017; Wilson, 1993) y variedades lingüísticas (Granberry, 2012; Patte, 2010) trazan el origen de estas migraciones a las poblaciones arahuacas asentadas en las orillas del río Orinoco, alrededor de 200 a 400 años a. E. C. Tras siglos de contacto e interacción, estas comunidades lograron consolidar redes de comercio e intercambio cultural a lo largo del Mar Caribe (Fernandes et al., 2021). Sus principales enclaves estaban organizados en cacicazgos: comunidades autónomas de naborías (trabajadores y esclavos) y nitaínos (nobleza), quienes eran dirigidos por un líder o cacique.

Ilustraciones de indígenas caribes y arahuacos por John Gabriel Stedman

A la llegada de los españoles en 1492, existían alrededor de 45 cacicazgos con diversos grados de complejidad social y prácticas lingüísticas en el archipiélago antillano (Granberry y Vescelius, 2004). Sin embargo, a pesar de la diversidad cultural, los españoles llamaron taínos al conjunto de habitantes de las Antillas Mayores y, por extensión, a la lengua que estos hablaban.

II. El arahuaco y las lenguas indígenas del Caribe

El arahuaco constituye la familia de lenguas indígenas de mayor extensión territorial en las Américas. Sus variedades se distribuyen desde la cordillera andina de Perú y Bolivia, pasando por la llanura amazónica y la costa norte de Suramérica, hasta alcanzar las islas del Caribe (Aikhenvald, 2002, 2022), lo que la convierte en una de las familias lingüísticas precolombinas de mayor alcance geográfico. Una de sus ramas caribeñas es el iñeri, variedad documentada principalmente en las Antillas Menores y estrechamente relacionada con el taíno de las Antillas Mayores. En ambas variedades se observa un repertorio vocálico similar al castellano (Gaztambide Arrillaga, 1990), y variaciones sistemáticas en el uso de /n/ por /r/, /e/ por /i/ y /o/ por /u/, de modo que la voz bohío del arahuaco clásico aparece registrada como buhío en la variedad ciboneyña. La gran mayoría de las voces que recogen los documentos coloniales son términos compuestos. Voces como cacique, compuesta del prefijo determinante ka– y la raíz –isikecabeza’ (el cabeza) y cutura, de la raíz cut– ‘pie’ y el sufijo –ara ‘de corteza’ (calzado) evidencian la naturaleza polisintética del arahuaco antillano; rasgo que comparte con otras lenguas indoamericanas.

 

Distribución de las comunidades del Caribe al momento del contacto

Debido a la ausencia de un sistema de escritura documentado, las descripciones que se conservan de esta lengua provienen casi exclusivamente de las crónicas coloniales, principalmente del Diario de navegación de Cristóbal Colón y los escritos de Fray Bartolomé de las Casas, Fernández de Oviedo y Mártir de Anglería. Más que una descripción sistemática, estas crónicas nos ofrecen un registro de los términos y conceptos útiles para la administración colonial. En ellas, la lengua principal de las Antillas Mayores, las Bahamas y los cayos de la Florida recibe el nombre de lengua taína.

No obstante, existe cierta disensión en cuanto a las variedades que alberga esta denominación. Discrepancias en la clasificación de las lenguas se observan aún en las descripciones iniciales que ofrece Bartolomé de las Casas, quien en su Historia de las Indias (1527–1561) menciona como en todas las islas se hablaba «una sola lengua, conocida por todos», mientras que en otros de sus escrito distingue entre cuatro variedades (Herrero, 2004). Estudios tipológicos posteriores han identificado al menos siete variedades en el archipiélago al momento del contacto: el taíno clásico, el ciboney, el macorís, el ciguayo, el kalíphuna, el caribe kari’nya y el guanahatabey; este último fuera de la familia arahuaca (Granberry, 2012). El análisis comparativo de estas variedades sugiere, además, que el llamado taíno era el dialecto de mayor prestigio, asociado al cacicazgo de Xaraguá, que funcionaba como lengua intermediaria entre las regiones del archipiélago (de Luna y Faraclas, 2012; Sued Badillo, 2003).

III. El primer contacto

Como lengua del primer contacto, el taíno se convirtió en la principal fuente de denominación durante los primeros años de la Conquista. El Diario de navegación de Colón (1492–1493), el primer testimonio lingüístico del continente americano, recoge voces como ají, buhío, coa, batey, maguey, tuna y canoa. Esta última aparece en su descripción de las embarcaciones indígenas, las cuales Colón describe como «muy grandes almadías que los indios llaman canoas, como fustas, muy hermosas, labradas, diz que era plazer verlas, y al pie del monte vido todo labrado». En tan solo dos años, Antonio de Nebrija la había ya incorporado como el primer americanismo en su Vocabulario Español-Latino (1494), traduciendola al latín como monoxylum, nave de un madero.

Entrada léxica de canoa en el Vocabulario español-latino de Antonio de Nebrija (1494)

Ante la falta de categorías para nombrar lo que encontraban, los españoles recurrieron inicialmente a estrategias descriptivas como red de dormir, pero estas soluciones fueron rápidamente desplazadas por palabras indígenas como hamaca (Herrero, 2004).

Descripción e ilustración de hamaca en La historia general de las Indias (1535–1557)

La rapidez con que estas voces se asentaron en el habla cotidiana queda documentada en las cartas privadas que los colonos enviaban a sus familias. La voz maíz es, de hecho, el préstamo indigena más recurrente en estas correspondencias. En una de las cartas que recoge Fernández Alcaide (2009), el español Celedón Favalis le escribe a su padre con morriña durante la época navideña:

«Nunca e estado tan triste y melencólico como la víspera de la pasqua de nauidad en la noche […] sin tener con que la celebrar sino con un poco de queso y pan de maiz por no auer otra cosa […]»
— Celedón Favalis (s. XVI)

Es durante este periodo histórico que surge la figura del indio ladino: un indígena que conocía ambas lenguas y servía como traductor. Estos individuos eran, por lo general, hijos de la nobleza indígena que aprendían la lengua y la fe cristiana bajo la tutela del clero misionero (Jansen, 2017). Fuera de esta figura, el bilingüismo fue mínimo y funcionalmente restringido a intercambios entre indígenas y capataces que trabajaban las haciendas y a los mestizos, hijos de padres españoles y madres indígenas. Entre la población española en establecerse en las Antillas imperó el desinterés por estudiar la lengua índigena. Bartolomé de las Casas documenta estas actitudes al señalar que no se aprendían más vocablos que los estrictamente necesarios para la dominación:

«Y esto de no saber español alguno las lenguas de esta isla no fue porque ellas fuesen muy difíciles de aprender, sino porque ninguna persona eclesiástica ni seglar tuvo en aquel tiempo cuidado, chico ni grande, de dar doctrina ni cognoscimiento de Dios a estas gentes, sino solo de servirse todos dellas, para lo cual no se aprendían mas vocablos de las lenguas de «dala pan», «ve a las minas», «saca oro» y los que para el servicio y complimiento de la voluntad de los españoles eran necesarios.»
— Bartolomé de las Casas (ca. 1527–1559)

A este desinterés se añade que el período de convivencia entre españoles e indígenas fue relativamente corto. Las matanzas, la hambruna, las enfermedades y la asimilación forzosa provocaron el decrecimiento casi absoluto de la población indígena en pocas décadas. A partir de 1540 no se registran comunidades taínas en los censos coloniales, y la transmisión intergeneracional de la lengua había desaparecido ya mucho antes de esta fecha (Herrero, 2004). Este tipo de contacto reduce las posibilidades de difusión estructural y favorece la incorporación de elementos léxicos aislados (Mufwene, 2001), lo que explica la naturaleza de la influencia indígena en el español caribeño.

IV. La huella indoantillana en el español de las Américas

A pesar del catastrófico desenlace de la primera etapa de la Conquista, ciertas condiciones históricas y lingüísticas favorecieron la incorporación y preservación del léxico indoantillano en la lengua castellana. La convergencia en los sistemas vocálicos, el predominio de la sílaba abierta y la relativa inteligibilidad entre las variedades del Caribe facilitaron que los españoles integrarán voces indígenas para denominar las nuevas realidades a las que se enfrentaban. Al ser la lengua del primer contacto, el taíno no tuvo que competir con otras lenguas en la labor denominativa, y el cuarto de siglo que separó la llegada de los españoles a las Antillas del inicio de la conquista continental permitió que este léxico se consolidara antes de nuevos contactos. La teoría lingüística sugiere que los préstamos incorporados en etapas tempranas de contacto tienden a estabilizarse y expandirse geográficamente con mayor facilidad (Haspelmath & Tadmor, 2009).

Se conservó el léxico que los españoles necesitaron para nombrar y comercializar su entorno: la flora, la fauna, los cultivos y los objetos que se integraron a la vida cotidiana. Cuando los conquistadores llegaron a México y a Suramérica, ya cargaban con un vocabulario antillano que en muchos casos desplazó los términos locales como batata en lugar de camote y maíz en lugar de tlaolli. El castellano se convirtió así en un puente de contacto indirecto entre el taíno y otras lenguas indígenas como el quechua, el náhuatl y el guaraní.

Otras palabras, como barbacoa, trascendieron las fronteras del imperio español. Fernández de Oviedo describe en La historia general de las Indias (1535–1557) como los indígenas «asan la carne sobre unos palos, que ponen, a manera de trévedes o parrillas, en hueco, que ellos llaman barbacoa, e la lumbre debaxo; porque, como la tierra está en clima que naturalmente es calurosa, presto se daña el pescado o la carne […]». Con el tiempo, el nombre de la estructura de madera que utilizaban los taínos para ahumar la carne pasó a designar el evento y proceso de cocción, extensión semántica que se integró al inglés como barbecue.

V. El estudio del léxico indígena en el Caribe actual

Para analizar el léxico indígena que se conserva en el español del Caribe, en 2021 llevé a cabo un análisis de corpus a partir de tres diccionarios regionales de las Antillas hispanohablantes: el Diccionario del español de Cuba (2000), el Diccionario del español dominicano (2013) y el Tesoro lexicográfico del español de Puerto Rico (2021). Tras excluir topónimos y gentilicios por su especificidad regional, se identificaron 842 indigenismos. Los resultados revelan que, una vez descartadas las voces sin etimología acordada, el 82% proviene de lenguas arahuacas. El taíno encabeza la lista con el 31.5%, seguido del caribe (11.5%), el eyerí (17.8%) y el indoarahuaco (5.1%). Entre las lenguas indígenas externas a la región, el náhuatl es la de mayor influencia en el habla caribeña.

Distribución de indigenismos en el español del Caribe (Maymí, 2021)

Al contrastar los indigenismos del español caribeño con el Diccionario de Americanismos (DA) y el Diccionario de la lengua española (DLE) de la Real Academia Española, se constata que 96 de estas voces han pasado al español general y que al menos el 27% son conocidas en otras variedades latinoamericanas. Para poner esta cifra en perspectiva, el DLE 141 indigenismos de origen arahuaco y 135 de origen caribe, frente a 623 del quechua y 820 del náhuatl, lenguas que sobrevivieron el período colonial y han tenido siglos adicionales de contacto con el castellano. El hallazgo más revelador de este estudio proviene del uso contemporáneo. De los 842 indigenismos identificados en el Caribe, solo 265 registran instancias en el Corpus del Español del Siglo XXI (CORPES), el mayor corpus del español actual. Esto significa que más del 68% de este vocabulario ha quedado fuera del uso activo, conservado en diccionarios regionales pero ausente de la lengua culta del Caribe. A pesar de esta reducción, la mayoría de los indigenismos en uso en el español caribeño sigue siendo de origen arahuaco.

VI. Conclusión

El contacto entre el castellano y las lenguas indígenas en el Caribe constituye un caso singular dentro de la historia lingüística de las Américas. A diferencia de otros contextos donde el contacto prolongado generó cambios estructurales, en el Caribe el limitado bilingüismo y el colapso demográfico limitaron este proceso. Lo que nos queda de las lenguas indígenas del Caribe es una infraestructura léxica, un conjunto de palabras que se integraron en los campos semánticos de mayor necesidad referencial y circularon a través de rutas y estructuras del mundo colonial. Palabras como maíz, canoa, huracán, hamaca, barbacoa, iguana trascendieron ese origen y hoy forman parte del léxico global. El caso arahuaco demuestra cómo una lengua puede desaparecer como sistema comunicativo y seguir operando como infraestructura de denominación.

El análisis de las realidades sociales de estos primeros años y sus consecuencias en el panorama lingüístico del Caribe permite identificar las condiciones bajo las cuales el contacto entre lenguas puede extenderse a otros niveles, y su estudio comparativo con otras regiones de las Américas podría contribuir a expandir el entendimiento de los contactos coloniales en la actualidad. A pesar de los múltiples intentos de reconstruir la identidad taína (Curet, 2015; Feliciano-Santos, 2017), la vigencia de este léxico disminuye progresivamente. La falta de documentación y transmisión limita su preservación, lo que hace necesario desarrollar estrategias para evitar la pérdida de esta herencia lingüística. Entre ellas destaca el retomar los estudios de disponibilidad léxica regional con la ayuda de herramientas digitales que permitan identificar los espacios de mayor y menor retención de estas voces, el desarrollo de currículos educativos que integren estos términos y garanticen su transmisión a nuevas generaciones, y la creación de corpus digitales de acceso abierto que amplíen su difusión y faciliten su estudio. El estudio citado en este artículo contribuye a este esfuerzo al ofrecer un panorama de la distribución y vitalidad de la huella indígena en el español del Caribe contemporáneo.

VII. Referencias

Academia Dominicana de la Lengua. (2013). Diccionario del español dominicano. Editora Judicial.

Academia Puertorriqueña de la Lengua Española. (2021). Tesoro lexicográfico del español de Puerto Rico en línea. https://tesoro.pr/

Aikhenvald, A. Y. (2002). Language contact in Amazonia. Oxford University Press.

Aikhenvald, A. Y. (2022). The Amazon Basin: Linguistic Areas and Language Contact. In S. S. Mufwene & A. M. Escobar (Eds.), The Cambridge Handbook of Language Contact (pp. 232–260). Cambridge University Press.

Bernal, S. V., & Rodríguez, Y. B. (2003). El legado indoamericano en el español del Caribe insular hispánico. Revista de Ciencias Sociales, 10(32).

Carneiro, R. L. (1961). Slash-and-burn cultivation among the Kuikuru. In J. Wilbert (Ed.), The Evolution of Horticultural Systems in Native South America (pp. 47–68).

Curet, L. A. (2015). Indigenous revival and the jíbaro in Borikén. Centro Journal, 27(1), 206–247.

de las Casas, B. (1967). Apologética historia sumaria (Vol. 2). UNAM. (Original work ca. 1527–1559).

de las Casas, B. (1994). Historia de las Indias. Alianza. (Original work ca. 1527–1561).

Feliciano‐Santos, S. (2017). How do you speak Taíno? Journal of Linguistic Anthropology, 27(1), 4–21.

Fernandes, et al. (2021). A genetic history of the pre-contact Caribbean. Nature, 590, 103–110.

Fernández Alcaide, M. (2009). Cartas de particulares en Indias del siglo XVI. Iberoamericana/Vervuert.

Fernández de Oviedo y Valdés, G. (1535/1557). Historia general de las Indias.

Galeote, M. (2012). Indoamericanismos en diccionarios impresos. In En pos de la palabra viva (pp. 151–174).

Gaztambide Arrillaga, C. (1990). El idioma indígena taíno en las Antillas.

Granberry, J. (2012). Lenguas indígenas del Caribe. Cuba Arqueológica, 5(1), 5–11.

Granberry, J., & Vescelius, G. (2004). Languages of the pre-Columbian Antilles. University of Alabama Press.

Guitar, L. A. (2017). Changes in the lives of the Taíno. In Jansen & Weiss (Eds.), Fray Antonio de Montesino y su tiempo.

Haensch, G., & Werner, R. (2000). Diccionario del español de Cuba. Gredos.

Haspelmath, M., & Tadmor, U. (2009). Loanwords in the world’s languages. De Gruyter.

Herrero, M. A. A. (2004). Los indigenismos en la Historia de las Indias. CSIC.

Jansen, S. (2017). El español y el taíno en contacto. In Jansen & Weiss (Eds.), Fray Antonio de Montesino y su tiempo.

de Luna, M. V. B., & Faraclas, N. (2012). Indigenous peoples and Caribbean Creoles.

Maymí, C. I. (2021). La influencia de las lenguas indígenas en el español caribeño [Manuscript]. UT Austin.

Mufwene, S. S. (2001). The ecology of language evolution. Cambridge University Press.

Patte, M.-F. (2010). Arawak vs. Lokono. In In a Sea of Heteroglossia.

Real Academia Española. (2021). CORPES XXI. https://www.rae.es/

Real Academia Española. (2021). Diccionario de la lengua española. https://dle.rae.es

Sued Badillo, J. (1975). Los caribes: Realidad o fábula.

Tovar, A. (1986). Las lenguas arahuacas. Thesaurus, 41.

Valdés Bernal, S. (1991–1993). Las lenguas indígenas de América y el español de Cuba.

Valdés Bernal, S., & Balga Rodríguez, Y. (2006). El legado indoamericano en el español del Caribe.

Wilson, S. M. (1993). The cultural mosaic of the indigenous Caribbean. Proceedings of the British Academy, 81, 37–66.

Cristina Isabel Maymí es estudiante doctoral en lingüística ibérica y latinoamericana en la Universidad de Texas en Austin, con maestrías en Lingüística de la Universidad de Puerto Rico y en Lexicografía Hispánica de la Real Academia Española. Su investigación examina el contacto lingüístico, el léxico y la fonética del español caribeño y los procesos de migración en el Caribe contemporáneo. Participó en el equipo lexicográfico del Diccionario Lexicográfico de Puerto Rico (en línea), El ABC de DtMF (2025)  y coeditora de Puerto Rican Spanish, Reggaetón Style! The (Socio)linguistics of Urban Music (2025). 

What Remains of the Indigenous Languages of the Caribbean?

Cristina Isabel Maymí
The University of Texas at Austin

I. Introduction

In the pre-Columbian Caribbean, the islands were home to agricultural and ceramic-producing communities descended from successive waves of migration out of South America. Shared features in farming techniques (Carneiro, 1961), cultural practices (Guitar, 2017; Wilson, 1993), and linguistic varieties (Granberry, 2012; Patte, 2010) trace these movements to the Arawakan populations settled along the banks of the Orinoco River, between 200 and 400 BCE. Over centuries of sustained contact and exchange, these communities built extensive networks across the Caribbean Sea (Fernandes et al., 2021). Their principal settlements were organized as cacicazgos: autonomous polities composed of naborías (laborers and enslaved individuals) and nitaínos (nobility), all governed by a chief or cacique.

Illustrations of Carib and Arawak Indigenous People by John Gabriel Stedman

By the time the Spanish arrived in 1492, the Antillean archipelago was home to approximately 45 cacicazgos of varying degrees of social complexity and linguistic practices (Granberry & Vescelius, 2004). Despite this diversity, the Spanish chroniclers broadly applied the label Taíno to the inhabitants of the Greater Antilles and, by extension, to the language they spoke.

II. Arawakan and the Indigenous Languages of the Caribbean

The Arawakan language family constitutes the most geographically widespread Indigenous language family in the Americas. Its varieties extend from the Andean highlands of Peru and Bolivia, across the Amazonian lowlands and the northern coast of South America, to the islands of the Caribbean (Aikhenvald, 2002, 2022), making it one of the most expansive pre-Columbian linguistic families on record. One of its Caribbean branches is Iñeri, a variety primarily documented in the Lesser Antilles and closely related to the Taíno spoken in the Greater Antilles. Both varieties share a vowel inventory comparable to that of Spanish (Gaztambide Arrillaga, 1990), and display systematic alternations between /n/ and /r/, /e/ and /i/, and /o/ and /u/. For example, the form bohío in Classical Arawakan appears as buhío in the Ciboney variety. The vast majority of lexical items recorded in colonial documents are compound forms. Terms such as cacique, derived from the determiner prefix ka– and the root –isike ‘head’ (i.e., leader), and cutura, from the root cut– ‘foot’ and the suffix –ara ‘of bark’ (i.e., footwear), illustrate the polysynthetic nature of Antillean Arawakan, a feature it shares with other Indigenous languages in the Americas.

Distribution of pre-Columbian Indigenous communities in the Caribbean

Due to the absence of a documented writing system, surviving descriptions of these languages derive almost exclusively from colonial chronicles, most notably Christopher Columbus’s Diario de navegación and the writings of Bartolomé de las Casas, Fernández de Oviedo, and Peter Martyr of Anglería. Rather than offering a systematic linguistic description, these sources provide a selective record of terms and concepts deemed useful for colonial administration. Within this documentary tradition, the language of the Greater Antilles, the Bahamas, and the Florida Keys is referred to as Taíno.

Nevertheless, there is considerable disagreement regarding the range of varieties encompassed by this label. Disagreements over which varieties fall under this label appear even in early accounts, including those of Bartolomé de las Casas, who in his Historia de las Indias (1527–1561) notes “a single language, understood by all,” across the Caribbean, while elsewhere he distinguishes between four distinct varieties (Herrero, 2004). Subsequent typological research has identified at least seven varieties present in the archipelago at the time of contact: Classical Taíno, Ciboney, Macorís, Ciguayo, Kalíphuna, Island Carib (Kari’nya), and Guanahatabey, the last of which falls outside the Arawakan family altogether (Granberry, 2012). Comparative analysis further suggests that what came to be called Taíno was a prestige dialect, associated with the cacicazgo of Xaraguá, where it functioned as a regional lingua franca across the archipelago (de Luna & Faraclas, 2012; Sued Badillo, 2003).

III. Language at first contact

As the language of first contact, Taíno became the primary source of new nomenclature during the early years of the Conquest. Columbus’s Diario de navegación (1492–1493), the earliest linguistic record of the Americas, documents terms such as ají, buhío, coa, batey, maguey, tuna, and canoa. The latter appears in Columbus’s description of the Indigenous watercraft, which he describes as “very large canoes, which the Indians call canoas, like fustas, very beautiful, well crafted, indeed, a pleasure to behold”. Within just two years, Antonio de Nebrija had already incorporated canoa as the earliest recorded Americanism in his Vocabulario español-latino (1494), glossing it in Latin as monoxylum, ‘a vessel made from a single piece of wood.’

Lexical entry for canoa in Antonio de Nebrija’s Vocabulario Español-Latino (1494)

In the absence of established categories to describe unfamiliar objects and practices, Spanish observers initially relied on descriptive constructions such as red de dormir (‘sleeping net’) for hammock, but these solutions were quickly displaced by indigenous terms like hamaca (Herrero, 2004).

Description and illustration of hamaca in Historia general de las Indias (1535–1557)

The speed with which these terms became embedded in everyday speech is documented in the private letters that colonists sent to their families. The term maíz, in fact, is the most recurrent Indigenous borrowing in this correspondence. In one of the letters compiled by Fernández Alcaide (2009), the Spaniard Celedón Favalis writes to his father with great sadness during the Christmas season:

“I have never felt so sad and melancholy as on Christmas Eve […] with nothing to celebrate it but a little cheese and corn [maíz] bread, for there was nothing else.”
— Celedón Favalis (16th century)

It is during this period that the figure of the indio ladino emerges: an Indigenous individual proficient in both languages who served as interpreter. These individuals were typically members of the Indigenous nobility, trained in Spanish and Christian doctrine under the tutelage of missionary clergy (Jansen, 2017). Beyond this small group, bilingualism remained minimal and functionally restricted, largely confined to the exchanges between Indigenous laborers and colonial overseers on the encomiendas or colonial states, as well as to mestizos, the children of Spanish fathers and Indigenous mothers.
Among the Spanish settlers of the Antilles, there was little interest in learning the Indigenous language. Bartolomé de las Casas documents these attitudes, noting that only the vocabulary strictly necessary for domination was ever acquired:

“And this lack of knowledge of Spanish among the languages of this island was not because they were particularly difficult to learn, but because neither ecclesiastical nor lay persons at that time took any care, whether great or small, to impart doctrine or knowledge of God to these peoples, but rather sought only to make use of them. For this purpose, no more words of their languages were learned than ‘give bread,’ ‘go to the mines,’ ‘extract gold,’ and others necessary for service and the fulfillment of the Spaniards’ will”
— Bartolomé de las Casas (ca. 1527–1559)

This lack of interest was compounded by the relatively brief period of coexistence between Spanish settlers and Indigenous populations. Massacres, famine, diseases, and forced assimilation decimated the Indigenous population within a matter of decades. By 1540, Taíno communities had disappeared from colonial censuses, and intergenerational transmission of the language had ceased well before that date (Herrero, 2004). Such conditions of contact significantly constrain the potential for structural diffusion and instead favor the incorporation of isolated lexical items (Mufwene, 2001), a pattern that accounts for the nature of Indigenous influence on Caribbean Spanish.

IV. The Indo-Antillean Imprint on the Languages of the Americas

Despite the catastrophic outcome of the Conquest’s first phase, a confluence of historical and linguistic conditions favored the incorporation and preservation of the Indo-Antillean lexicon in the Spanish language. Convergence in vowel systems, the predominance of open syllable structure, and the relative mutual intelligibility among Caribbean varieties facilitated the adoption of Indigenous terms by Spanish speakers. As the language of first contact, Taíno did not initially compete with other Indigenous languages in the task of naming new realities. Moreover, the quarter century that elapsed between the Spanish arrival in the Antilles and the onset of continental conquest allowed this lexicon to stabilize before new linguistic contacts emerged. As the linguistic theory suggests, the borrowings introduced during early stages of contact are more likely to become entrenched and to spread geographically (Haspelmath & Tadmor, 2009).

What survived was the lexicon the Spanish needed to name and commercialize their environment: the flora, fauna, crops, and material objects that became integrated into everyday life. By the time the conquistadors reached Mexico and South America, they already carried an Antillean lexical repertoire that in many cases displaced local terms, such as batata instead of camote, maíz instead of tlaolli. Spanish thus became an unlikely vehicle of indirect contact between Taíno and other Indigenous languages such as Quechua, Nahuatl, and Guaraní.

Other words, like barbacoa, traveled beyond the boundaries of the Spanish Empire. Fernández de Oviedo, writing in his Historia general de las Indias (1535–1557), describes how Indigenous people “roast meat over sticks arranged like tripods or grates over a pit, which they call barbacoa, with the fire beneath; because, as the land lies in a naturally warm climate, fish and meat spoil quickly […]”. Over time, the name of the wooden structure used by Taíno communities to smoke meat came to denote the event and method of cooking itself, a semantic extension that was later incorporated into English as barbecue. Today, in much of the Spanish-speaking world, barbacoa is perceived as a borrowing from English, when the history runs precisely the other way.

V. Indigenous Lexicon in the Contemporary Caribbean

To examine the Indigenous lexicon preserved in Caribbean Spanish, I conducted a corpus-based analysis in 2021 drawing on three regional dictionaries of the Spanish-speaking Antilles: the Diccionario del español de Cuba (2000), the Diccionario del español dominicano (2013), and the Tesoro lexicográfico del español de Puerto Rico (2021). After excluding toponyms and demonyms due to their regional specificity, a total of 842 Indigenous lexical items were identified. The results show that, once words without agreed-upon etymologies were removed, 82% of the lexical items derive from Arawakan languages: Taíno accounts for the largest proportion (31.5%), followed by Eyerí (17.8%), Carib (11.5%), and Indo-Arawakan (5.1%). Among Indigenous languages external to the region, Nahuatl emerges as the most influential in Caribbean Spanish.

Distribution of Indigenous lexical items in Caribbean Spanish (Maymí, 2021)

When cross-referenced with the Diccionario de Americanismos (DA) and the Diccionario de la lengua española (DLE) of the Real Academia Española, 96 are found to have entered general Spanish, and at least 27% are attested in other Latin American varieties. To put these figures in perspective, the DLE records 141 indigenisms of Arawakan origin and 135 of Carib origin, compared to 623 from Quechua and 820 from Nahuatl, languages that survived the colonial period and have had centuries of additional contact with Spanish.

The most revealing finding of this study was from contemporary usage data. Of the 842 Indigenous lexical items identified in the Caribbean, only 265 are attested in the Corpus del Español del Siglo XXI (CORPES), the largest corpus of present-day Spanish. This indicates that over 68% of this vocabulary is no longer in use, remaining preserved in regional dictionaries but largely absent from everyday Caribbean Spanish. Despite this reduction, the majority of lexical items still in use in the region are of Arawakan origin.

VI. Conclusion

The contact between Spanish and the Indigenous languages of the Caribbean represents a distinct case in the linguistic history of the Americas. Unlike other contact situations where prolonged interaction results in structural changes, in the Caribbean, the limited bilingualism and demographic collapse constrained such developments. What remains of the Indigenous languages of the Caribbean is a lexical infrastructure, a set of words integrated into the areas of greatest referential need and diffused through the routes and networks of colonial expansion. Words such as maíz, canoa, huracán, hamaca, barbacoa, and iguana have long since transcended their origins and now form part of the global lexicon. The Arawakan case demonstrates that a language can cease to exist as a communicative system yet continue to operate as a naming infrastructure.

Examining the social conditions of this early period and their consequences in the Caribbean allows us to identify the conditions under which language contact can extend beyond the lexical level. Comparative analysis with other regions of the Americas could further illuminate the long-term dynamics of colonial language contact and their legacies in the present. Despite ongoing efforts to reconstruct Taíno identity (Curet, 2015; Feliciano-Santos, 2017), the vitality of this lexicon continues to decline.


The lack of documentation and transmission makes preservation increasingly difficult, underscoring the need for targeted strategies to prevent further loss of this linguistic heritage. These include renewed attention to regional lexical availability studies supported by digital tools capable of identifying zones of retention and attrition; the development of educational curricula that integrate this vocabulary and ensure its transmission to new generations; and the creation of open-access digital corpora to expand their circulation and facilitate future research. The study referenced in this article contributes to this effort by offering an overview of the distribution and vitality of Indigenous lexical items in contemporary Caribbean Spanish.

VII. References

Academia Dominicana de la Lengua. (2013). Diccionario del español dominicano. Editora Judicial.

Academia Puertorriqueña de la Lengua Española. (2021). Tesoro lexicográfico del español de Puerto Rico en línea. https://tesoro.pr/

Aikhenvald, A. Y. (2002). Language contact in Amazonia. Oxford University Press.

Aikhenvald, A. Y. (2022). The Amazon Basin: Linguistic Areas and Language Contact. In S. S. Mufwene & A. M. Escobar (Eds.), The Cambridge Handbook of Language Contact (pp. 232–260). Cambridge University Press.

Bernal, S. V., & Rodríguez, Y. B. (2003). El legado indoamericano en el español del Caribe insular hispánico. Revista de Ciencias Sociales, 10(32).

Carneiro, R. L. (1961). Slash-and-burn cultivation among the Kuikuru. In J. Wilbert (Ed.), The Evolution of Horticultural Systems in Native South America (pp. 47–68).

Curet, L. A. (2015). Indigenous revival and the jíbaro in Borikén. Centro Journal, 27(1), 206–247.

de las Casas, B. (1967). Apologética historia sumaria (Vol. 2). UNAM. (Original work ca. 1527–1559).

de las Casas, B. (1994). Historia de las Indias. Alianza. (Original work ca. 1527–1561).

Feliciano‐Santos, S. (2017). How do you speak Taíno? Journal of Linguistic Anthropology, 27(1), 4–21.

Fernandes, et al. (2021). A genetic history of the pre-contact Caribbean. Nature, 590, 103–110.

Fernández Alcaide, M. (2009). Cartas de particulares en Indias del siglo XVI. Iberoamericana/Vervuert.

Fernández de Oviedo y Valdés, G. (1535/1557). Historia general de las Indias.

Galeote, M. (2012). Indoamericanismos en diccionarios impresos. In En pos de la palabra viva (pp. 151–174).

Gaztambide Arrillaga, C. (1990). El idioma indígena taíno en las Antillas.

Granberry, J. (2012). Lenguas indígenas del Caribe. Cuba Arqueológica, 5(1), 5–11.

Granberry, J., & Vescelius, G. (2004). Languages of the pre-Columbian Antilles. University of Alabama Press.

Guitar, L. A. (2017). Changes in the lives of the Taíno. In Jansen & Weiss (Eds.), Fray Antonio de Montesino y su tiempo.

Haensch, G., & Werner, R. (2000). Diccionario del español de Cuba. Gredos.

Haspelmath, M., & Tadmor, U. (2009). Loanwords in the world’s languages. De Gruyter.

Herrero, M. A. A. (2004). Los indigenismos en la Historia de las Indias. CSIC.

Jansen, S. (2017). El español y el taíno en contacto. In Jansen & Weiss (Eds.), Fray Antonio de Montesino y su tiempo.

de Luna, M. V. B., & Faraclas, N. (2012). Indigenous peoples and Caribbean Creoles.

Maymí, C. I. (2021). La influencia de las lenguas indígenas en el español caribeño [Manuscript]. UT Austin.

Mufwene, S. S. (2001). The ecology of language evolution. Cambridge University Press.

Patte, M.-F. (2010). Arawak vs. Lokono. In In a Sea of Heteroglossia.

Real Academia Española. (2021). CORPES XXI. https://www.rae.es/

Real Academia Española. (2021). Diccionario de la lengua española. https://dle.rae.es

Sued Badillo, J. (1975). Los caribes: Realidad o fábula.

Tovar, A. (1986). Las lenguas arahuacas. Thesaurus, 41.

Valdés Bernal, S. (1991–1993). Las lenguas indígenas de América y el español de Cuba.

Valdés Bernal, S., & Balga Rodríguez, Y. (2006). El legado indoamericano en el español del Caribe.

Wilson, S. M. (1993). The cultural mosaic of the indigenous Caribbean. Proceedings of the British Academy, 81, 37–66.

Cristina Isabel Maymí is a doctoral candidate in Iberian and Latin American linguistics at the University of Texas at Austin, with master’s degrees in Linguistics from the University of Puerto Rico and in Hispanic Lexicography from the Real Academia Española. Her research focuses on language contact, lexicon, and the phonetics of Caribbean Spanish, as well as migration processes in the contemporary Caribbean. She has contributed to the lexicographic team of the Diccionario Lexicográfico de Puerto Rico, El ABC de DtMF (2025), and is co-editor of Puerto Rican Spanish, Reggaetón Style! The (Socio)linguistics of Urban Music (2025). 

Visitas: 15

Share on facebook
Share on twitter
Share on linkedin
Share on pinterest