Questions, Reviews, and Selections: Reflections on Digital Humanities in the Study of Nahua Colonial Texts

Spanish and Portuguese translations below

Abstract

This article reflects on the application of Digital Humanities (DH) methodologies to Nahua colonial sources, focusing on three projects conducted over the past three years. Inspired by discussions on ethics and the role of artificial intelligence in historical research, it emphasizes that traditional social science methods—such as critical thinking, interpretation, and careful source analysis—remain essential despite the proliferation of digital tools. The first project explores the use of Transkribus and Handwritten Text Recognition (HTR) models to transcribe Nahuatl manuscripts from the Fondo Real de Cholula, highlighting technical challenges and collaborative workflows. The second project expands these models to other Nahua sources, demonstrating the importance of review and quality control in automated transcription. Finally, the creation of the Fondo Real de Cholula Vocabulary illustrates the process of selecting, organizing, and translating lexical data for broader scholarly access. Throughout, the article underscores three fundamental tools for navigating DH: questioning, reviewing, and selecting. The reflections offered suggest that human intervention remains central to DH projects, and that the integration of traditional methodologies with emerging technologies can enhance research in history and social sciences.

*

Questions, Reviews, and Selections: Reflections on Digital Humanities in the Study of Nahua Colonial Texts

 

Eduardo H. Gorobets Martins
The University of Texas at Austin

Every generation has its own scholarly trend. In 2025, Digital Humanities (DH) has become one of the most frequently discussed fields in Academia. But what does Digital Humanities mean? What is the importance of Digital Humanities in the academic work of historians, social scientists, and teachers? How can we navigate it? On a recent edition of the American Society for Ethnohistory Conference, independent scholar Ben Leeming analyzed the use of Artificial Intelligence (AI) tools, such as ChatGPT, Claude, Gemini and NotebookLM, in his work with Nahua colonial sources. One of the aspects Leeming discussed in his presentation was to what degree artificial intelligence might replace or transform the research currently conducted by ethnohistorians. Leeming’s concerns about the ethical use of AI tools to research made me reflect on my Digital Humanities work over the past three years, and how a short text could help newcomers who, like me four years ago, do not yet know exactly how to navigate technological innovations within their academic work.

By briefly outlining three projects I developed and their outcomes, I offer a reflection suggesting that “old” social sciences’ methods or “good” scientific practices remain important despite new technologies and applications that emerge every day. I am inspired by scholars such as Jeffrey Ravel (Charnow et al., 2023), who asserts that human interpretation and critical thinking remain fundamental to works in history and social sciences, despite the development of Digital Humanities. Within this article, I argue that three indispensable (and possibly obvious) tools that helped me navigate Digital Humanities are: questioning, reviewing, and selecting. In this piece, I briefly examine the role of Digital Humanities in the study of Nahua colonial sources, emphasizing the necessary presence of traditional methods of social sciences in the work with emerging technologies.

What is Digital Humanities?

Coined in the 2000s, Digital Humanities is a term that is being continually reformulated. According to Schreibman et al. (2007), DH is a field that enables «clear and direct relationship between the interpretative strategies that humanists employ and the tools that facilitate exploration of original artifacts based on those interpretative strategies.» In other words, DH refers to the use of digital tools within the humanities disciplines, supporting both research and teaching. Digital tools involve the use of technology to create maps, digital exhibits, visualize, and analyze data. ArcGIS, for example, uses Geographic Information Systems (GIS) to create data visualizations or interactive maps, while Transkribus uses Handwritten Text Recognition (HTR) to transcribe manuscripts via AI models. DH is important because it transforms knowledge from humanities fields into different shapes, and it helps scholars and students access it in innovative ways. DH can be hard to navigate, since every day there are new tools being launched. However, by considering the duo ‘source + tool,’ we can begin to explore project possibilities and the messages or learning outcomes we wish to convey.

In the field of Nahua Studies, for example, scholars are investigating ways in which colonial (and, in the future, even preinvasion) sources can be approached through Digital Humanities. Among her several DH projects, Patricia Murrieta-Flores, together with Diego Jiménez-Badillo and Bruno Martins (2023), developed open-access digital tools, datasets, and methods to enable large-scale, spatially grounded analysis of the Relaciones Geográficas de la Nueva España. Another example is the work of Francis Tyers, Robert Pugh, and Valery Berthoud, who are developing computational systems for analyzing and annotating historical and contemporary Nahuatl texts, such as the Florentine Codex (Tyers et al., 2023).

Transkribus: A Tool to Transcribe Nahua Colonial Manuscripts

Four years ago, when I first heard the expression Digital Humanities, I confess I had no idea what people were talking about. My first project involved paleography and transcription of manuscripts written in Nahuatl, an Indigenous language from Mexico. My work was a small contribution to the project Unlocking the Colonial Archive, led by scholars from several universities, including Kelly McDonough and Albert Palacios from the University of Texas at Austin, who mentored my early experiences with Digital Humanities. My goal (which started with a DH Fellowship in 2022 and continued during my period as a Graduate Research Assistant with Albert Palacios) was to create AI models to assist in the transcription of digitized manuscripts written in Nahuatl. This work employed the tool Transkribus to analyze Nahuatl-language documents from the Fondo Real de Cholula, an archive preserving hundreds of records that offer insight into how Nahua colonial everyday life was legally documented. The FRC was recently digitized (2018-2022) through a partnership among the Nettie Lee Benson Latin American Collection (UT-Austin), the Judicial Branch of the State of Puebla (Mexico), and the Benemérita Universidad Autónoma de Puebla (BUAP-Mexico).

The Fondo Real de Cholula archive represents an important corpus for scholars who work with New Spain materials, as Cholula held the status of “City of Indians” from the 1530s onward, meaning it was under direct control of the Spanish Crown while it enjoyed certain privileges and maintained a fully functioning Indigenous cabildo, or council, which ruled alongside the Spanish one. From more than 700 documents in the FRC, at least 72 have folios written in Nahuatl, which illustrates how this language was broadly used in the context of judicial processes. The digitization of this archive generated easier access to several kinds of documents that compose it, such as civil and criminal proceedings, financial documents issued by the Republics of Indians, and wills.

The work with Transkribus consists of several phases. First, upload a number of files with pictures of manuscripts to its online website or to the program on a computer. Second, select the text areas from each page we want to train on, and transcribe them. Training here refers to transcribing a sufficient number of pages and creating an AI model capable of identifying the same image patterns and converting them into characters. The technology involved in this process is called Handwritten Text Recognition (HTR). After compiling a small set of transcribed pages (at least thirty in the same handwriting style) a model can be created, and the process of refining its error rate begins. As we can see, a big part of the initial work with Transkribus is to create a sample of transcriptions, which means that technology will not create a model automatically with just a few clicks. In this phase, the collective work of scholars and students was fundamental through the Seminario de Náhuatl “Luis Reyes García” (BUAP, coordinated by Lídia Gómez García) and the NEH-AHRC Spanish Paleography and Digital Humanities Institute (UT-Austin, coordinated by Albert Palacios). Both of these seminars used the collaborative platform FromThePage to transcribe (and occasionally translate) documents, with the goal of making them publicly available.

Example of a folio from the Fondo Real de Cholula (FRC) being transcribed in Transkribus.

 

In the end, a Transkribus model for the FRC Nahuatl documents was created, specifically to be used with documents produced in the 17th and 18th centuries. This model had a low coefficient of error (between 7 and 11%), meaning that when applied to an untranscribed folio, the output contained an estimated 7–11% of the total words that would need to be reviewed and corrected. As a consequence of creating the model, more than 50 folios from 9 documents were transcribed collectively, totaling more than 10,000 words. All these materials and many other texts transcribed from Spanish are available on FromThePage.

On another project, developed in 2024 (Digital Scholarship Fellowship Award), I decided to apply the FRC Nahuatl models of Transkribus on other materials held by the Nettie Lee Benson Latin American Collection. More specifically, to the manuscript 984 of the Joaquín García Izcabalceta collection, which is held by the Nettie Lee Benson Latin American Collection. The work consists of an anonymous set of sermons, Teotlatol Nemachtiloni ipan in Nahuacopa, written during the 16th century. My work consisted of applying and expanding the models for Nahuatl into the 346 pages of the manuscript, and reviewing it in order to have it ready to consult.

The Fondo Real de Cholula Vocabulary

After working with Transkribus and Nahua sources for a couple of years, it occurred to me that although the problem of transcription was solved, the challenge of translating these unpublished materials remained. Since no automated tool yet exists to translate Nahuatl colonial texts, I came up with the idea of a vocabulary that could incorporate the transcription and translation notes produced by the paleography groups I collaborated with for the FRC documents. The result was the creation of the Fondo Real de Cholula Vocabulary, a project developed with support from the UT Libraries and the Scholars Lab Fellowship 2024-2025.

The first phase of this project consisted of creating a list of words in Excel using the contents of the folios transcribed with Transkribus from the FRC. Using Python with the guidance of librarians Ian Goodale and Dale Correa, an initial list of more than 10,000 words was generated, and organized alphabetically and excluding stop words — common, repetitive words such as “in” in Nahuatl. The next step involved selecting words that could be added to the vocabulary list by frequency and relevance for users, and grouping words with abbreviations or vocabulary variations under the one most commonly used. The list after Python was reduced to more than 3,000 words, while the final list included 962 entries, with their possible variations and abbreviations. Among the final list, there are 86 names, 117 last names, 28 place names, and 97 Spanish loanwords (words borrowed from Spanish into Nahuatl). After completing the list, subsequent phases included translating and uploading entries to a WordPress website. Words were translated from Nahuatl to English and Spanish using physical and online sources, and occasionally, the expertise of the scholars from the Seminario de Náhuatl “Luis Reyes García” (BUAP). Finally, the entries were published on a website hosted by the UT Creates platform, where each entry contains translations, sources, orthographic variants or abbreviations, and occasional formulaic expressions in which these words appear. The inclusion of formulaic expressions was one of the goals of the vocabulary, since these expressions can be understood in the judicial contexts in which they were produced. One example is the expression “Que sepan todos aquellos que vieren,” which was translated into Nahuatl as “Ma quimatican in ixquichtin yn aquique quitasque.” In English, that means “Shall know those who see,” a common expression used in the beginning of Spanish judicial documents. Each of the words of the expression is referred to with links to their respective entries, but the whole expression itself is also an entry.

Home page of the Fondo Real de Cholula Vocabulary website.

Final Reflections

According to scholars working with Handwritten Text Recognition (HTR) tools such as Transkribus, the broader implementation of Digital Humanities methodologies is transforming the methods used in traditional humanities disciplines, including History and Archival Studies. These tools enable new forms of access, processing, and inquiry that fundamentally challenge long-standing scholarly practices, primarily by transforming accessibility and indexing methods (Schwarz-Ricci, 2022). According to Muehlberger et al. (2019), archives are transitioning from being repositories of inaccessible physical documents to providers of searchable, digitally indexed resources. The scholars mentioned and Tikhonov et al. (2022) also argue that automated transcription and searching expand the existing possibilities of historical enquiry for scholars, since they no longer need to spend immense amounts of time on the labor of transcription. In this text, I do not aim to exhaust the literature on Transkribus or DH; rather, I offer a reflection about to what degree “old” or traditional methods in history and the social sciences will be replaced by new technologies.

The persistence of traditional methods in history and social sciences is emphasized by several scholars despite the advancement of DH (Charnow et al., 2023). A fundamental argument for it rests on the nature of scholarly inquiry itself, which relies on human interpretation and critical thinking rather than computational efficiency. Jeffrey Ravel (Charnow et al., 2023), for instance, asserts that archival work demands an unavoidable degree of patience and persistence to decipher and interpret findings. Building on these ideas, I argue that questioning, reviewing, and selecting are obvious, but also crucial tools for historians and social scientists working with DH. In my own projects, I encountered similar reflections to those of Jeffrey Ravel as I learned to use new technologies. To work with Transkribus properly, I had to immerse myself in groups of paleography and understand the details of the corpus of documents that compose the FRC. After developing and applying the models with Transkribus, I also did extensive work reviewing the transcribed texts, since the models have an error coefficient. Even when the error coefficient was close to zero, it was still necessary to review the transcribed materials carefully to ensure accuracy. Later, when dealing with the translation of colonial Nahuatl texts from FRC, I reflected on how to make the process easier and faster, despite the inexistence of automated tools for that. Finally, the creation of a vocabulary for FRC required multiple selections of content and what to exhibit. In sum, all these experiences with DH could not happen without questioning ideas, reviewing data, and selecting materials and categories. Although these methods may be obvious for any work in science, I believe they must be highlighted in the works with Digital Humanities to avoid both excessive skepticism and excitement with new technologies.

Returning to Ben Leeming’s questions about the ethical use of AI tools in Nahuatl ethnohistorical research that inspired me, I believe projects in Digital Humanities cannot occur without human intervention — at least not yet. It is impossible to make definitive predictions about the future, but methods that characterize the “humanities” in Digital Humanities will continue to play important roles in the works of history and social sciences. For now, questions, reviews, and selections persist as fundamental human “tools” to make research in humanities, and maybe, in other scientific fields.

Acknowledgements

I would like to acknowledge that I am studying sources produced by Nahuas, to whom I express my profound respect, and I am committed to a careful use of them. Also, this text has selected topics about Digital Humanities, and it was partially written using the Dictate tool from Microsoft Word, translated into Spanish and Portuguese, reviewed using ChatGPT, and it had literature research organized with NotebookLM. It also reflects critically on the use of technology in current academic production.

References

Charnow, Sally Debra, et al. “Digital Humanities—Ways Forward; Future Challenges: Honoring David Kammerling Smith and the Digital Public Sphere; Acceleration?; Digital Humanities for the People(?); Infrastructure as Privilege; Computation, Cultures, and Communities; Digital Humanities and Generational Shift.” Historical Reflections [Waterloo], vol. 49, no. 3, 2023, pp. 1–55. https://doi.org/10.3167/hrrh.2023.490301.

Muehlberger, Guenter, et al. “Transforming Scholarship in the Archives through Handwritten Text Recognition: Transkribus as a Case Study.” Journal of Documentation [Bradford], vol. 75, no. 5, 2019, pp. 954–76. https://doi.org/10.1108/JD-07-2018-0114.

Murrieta-Flores, Patricia, et al. Digital Resources: Artificial Intelligence, Computational Approaches, and Geographical Text Analysis to Investigate Early Colonial Mexico. Oxford University Press, 2022. https://doi.org/10.1093/acrefore/9780199366439.013.977.

Schreibman, Susan, et al. A Companion to Digital Humanities. John Wiley & Sons, Ltd., 2007. Blackwell Companions to Literature and Culture.

Schwarz-Ricci, V. I. Handwritten Text Recognition per registri notarili (secc. XV-XVI): una sperimentazione. 2022. iris.cnr.ithttps://iris.cnr.it/handle/20.500.14243/458793.

Tikhonov, Aleksej, et al. “Multilingual Handwritten Text Recognition (MultiHTR) or Reading Your Grandma’s Old Letters in German, Russian, Serbian, and Ottoman Turkish with Artificial Intelligence.” The Palgrave Handbook of Digital and Public Humanities, with Anne Schwan and Tara Thomson, Springer International Publishing, 2022, pp. 215–33. https://doi.org/10.1007/978-3-031-11886-9_12.

Tyers, Francis, et al. “Codex to Corpus: Exploring Annotation and Processing for an Open and Extensible Machine-Readable Edition of the Florentine Codex.” Proceedings of the Workshop on Natural Language Processing for Indigenous Languages of the Americas (AmericasNLP), Association for Computational Linguistics, 2023.

***

Cuestiones, revisiones y selecciones: reflexiones sobre las humanidades digitales en el estudio de textos coloniales nahuas

 

Eduardo H. Gorobets Martins
The University of Texas at Austin

 

Cada generación tiene sus propias tendencias académicas. En 2025, las Humanidades Digitales (HD) se han convertido en uno de los campos más discutidos en la academia. Pero ¿qué significan las Humanidades Digitales? ¿Cuál es su importancia en el trabajo académico de historiadores, científicos sociales y docentes? ¿Cómo podemos navegar en este campo? En una conferencia reciente de la American Society for Ethnohistory, el investigador independiente Ben Leeming analizó el uso de herramientas de Inteligencia Artificial (IA), como ChatGPT, Claude, Gemini y NotebookLM en su trabajo con fuentes coloniales producidas por los nahuas. Uno de los aspectos generales que Leeming abordó en su presentación fue hasta qué punto la inteligencia artificial podría reemplazar o transformar las investigaciones que actualmente realizan los etnohistoriadores. Las preocupaciones de Leeming acerca del uso ético de las herramientas de IA para la investigación me llevaron a reflexionar sobre mi trabajo en HD durante los últimos tres años, y sobre cómo un texto breve podría ayudar a quienes, como yo hace cuatro años, aún no saben exactamente cómo navegar las innovaciones tecnológicas en su trabajo académico.

En este texto, al esbozar brevemente tres proyectos que desarrollé y sus resultados, ofrezco una reflexión que sugiere que los métodos “antiguos” de las ciencias sociales o las “buenas” prácticas científicas siguen siendo importantes a pesar de las nuevas tecnologías y aplicaciones que surgen diariamente. Me inspiro en académicos como Jeffrey Ravel (Charnow et al., 2023), quien afirma que la interpretación humana y el pensamiento crítico siguen siendo fundamentales en los trabajos de historia y ciencias sociales, a pesar del desarrollo de las HD. En este artículo, sostengo que tres herramientas indispensables (y posiblemente obvias) que me ayudaron a navegar las HD son: cuestionar, revisar y seleccionar. En este texto, examino brevemente el papel de las Humanidades Digitales en el estudio de fuentes coloniales Nahuas, enfatizando la necesaria presencia de los métodos tradicionales de las ciencias sociales en el trabajo con tecnologías emergentes.

¿Qué son las Humanidades Digitales?

Creado en los años 2000, el término Humanidades Digitales se encuentra en continua reformulación. Según Schreibman et al. (2007), las HD son un campo que permite una “relación clara y directa entre las estrategias interpretativas que emplean los humanistas y las herramientas que facilitan la exploración de artefactos originales basados en esas estrategias interpretativas”. En otras palabras, las HD se refieren al uso de herramientas digitales dentro de las disciplinas humanísticas, apoyando tanto la investigación como la enseñanza. Las herramientas digitales incluyen el uso de tecnología para crear mapas, exhibiciones digitales, visualizar y analizar datos. Por ejemplo, ArcGIS utiliza Sistemas de Información Geográfica (GIS) para generar visualizaciones de datos o mapas interactivos, mientras que Transkribus emplea el Reconocimiento de Texto Manuscrito (HTR, en inglés) para transcribir manuscritos mediante modelos de IA. Las HD son importantes porque transforman el conocimiento proveniente de las áreas humanísticas en distintas formas y ayudan a los académicos y estudiantes a acceder a él de maneras innovadoras. Sin embargo, pueden ser difíciles de navegar, ya que diariamente se lanzan nuevas herramientas. No obstante, al considerar la pareja “fuente + herramienta”, podemos empezar a explorar las posibilidades de un proyecto y los contenidos o resultados de aprendizaje que deseamos transmitir.

En el campo de los Estudios Nahuas, por ejemplo, los académicos investigan cómo se pueden abordar las fuentes coloniales (y, en el futuro, incluso tal vez las fuentes del período anterior a la invasión española) a través de las HD. Entre sus varios proyectos en HD, Patricia Murrieta-Flores, junto con Diego Jiménez-Badillo y Bruno Martins (2023), desarrolló herramientas digitales de acceso abierto, conjuntos de datos y métodos para permitir análisis a gran escala y espacialmente fundamentados de las Relaciones Geográficas de la Nueva España. Otro ejemplo es el trabajo de Francis Tyers, Robert Pugh y Valery Berthoud, quienes están desarrollando sistemas computacionales para analizar y anotar textos  históricos y contemporáneos en náhuatl, como el Códice Florentino (Tyers et al., 2023).

Transkribus: una herramienta para transcribir manuscritos coloniales nahuas

Hace cuatro años, cuando escuché por primera vez la expresión “Humanidades Digitales”, confieso que no tenía idea de lo que se hablaba. Mi primer proyecto involucró paleografía y transcripción de manuscritos escritos en náhuatl, una lengua indígena de México. Mi trabajo fue una pequeña contribución al proyecto Unlocking the Colonial Archive, liderado por académicos de varias universidades, entre ellos Kelly McDonough y Albert Palacios de la University of Texas at Austin, quienes me orientaron en mis primeras experiencias con las HD. Mi objetivo (que comenzó con una beca en HD en 2022 y continuó durante mi período como asistente de investigación de posgrado con Albert Palacios) era crear modelos de IA para asistir en la transcripción de manuscritos digitalizados escritos en náhuatl. Este trabajo usó la herramienta Transkribus para analizar documentos en lengua náhuatl del Fondo Real de Cholula, un archivo que conserva cientos de registros que ofrecen perspectivas acerca de cómo la vida cotidiana nahua en época colonial se documentaba legalmente. El FRC fue recientemente digitalizado (2018-2022) mediante una colaboración entre la Nettie Lee Benson Latin American Collection (UT-Austin), el Poder Judicial del Estado de Puebla (México) y la Benemérita Universidad Autónoma de Puebla (BUAP-México).

El archivo Fondo Real de Cholula representa un corpus importante para los estudios sobre Nueva España, ya que desde la década de 1530 Cholula tenía el estatus de “Ciudad de Indios”, lo que significaba que estaba bajo control directo de la Corona española, aunque gozaba de ciertos privilegios y mantenía un cabildo indígena plenamente funcional, que gobernaba junto al cabildo español. De más de 700 documentos en el FRC, al menos 72 contienen folios escritos en náhuatl, lo que ilustra el uso amplio de esta lengua en el contexto de los procesos judiciales. La digitalización de este archivo facilitó el acceso a distintos tipos de documentos que lo componen, como juicios civiles y criminales, documentos financieros emitidos por las Repúblicas de Indios y testamentos.

El trabajo con Transkribus consiste en varias fases. Primero, se suben a su sitio web o al programa de computadora una serie de archivos con imágenes de manuscritos. Segundo, se seleccionan las áreas de texto de cada página que se desean entrenar y se transcriben. Entrenar aquí se refiere a transcribir un número suficiente de páginas y crear un modelo de IA capaz de identificar los mismos patrones de imagen y convertirlos en caracteres. La tecnología involucrada en este proceso se llama Reconocimiento de Texto Manuscrito (HTR). Tras compilar un pequeño conjunto de páginas transcritas (al menos treinta con el mismo estilo de escritura) se puede crear un modelo y comenzar el proceso de reducir su margen de error. Como puede observarse, una gran parte del trabajo inicial con Transkribus consiste en generar una muestra de transcripciones, lo que significa que la tecnología no crea un modelo automáticamente con unos pocos clics. En esta fase, el trabajo colectivo de académicos y estudiantes fue fundamental, a través del Seminario de Náhuatl “Luis Reyes García” (BUAP, coordinado por Lídia Gómez García) y del NEH-AHRC Spanish Paleography and Digital Humanities Institute (UT-Austin, coordinado por Albert Palacios). Ambos seminarios utilizaron la plataforma colaborativa FromThePage para transcribir (y ocasionalmente traducir) documentos, con el objetivo de ponerlos a disposición pública.

Ejemplo de un folio del Fondo Real de Cholula (FRC) siendo transcrito en Transkribus.

 

Finalmente, se creó un modelo de Transkribus para los documentos en náhuatl del FRC, diseñado específicamente para textos producidos en los siglos XVII y XVIII. Este modelo presentó un bajo coeficiente de error (entre 7 y 11 %), lo que significa que, al aplicarlo a un folio no transcrito, se estima que de 7 a 11 % del total de palabras deberá ser revisado y corregido. Como consecuencia de la creación del modelo, se transcribieron colectivamente más de 50 folios de 9 documentos, sumando más de 10.000 palabras. Todos estos materiales, junto con muchos otros textos transcritos del español, están disponibles en FromThePage.

Además, en otro proyecto desarrollado en 2024 (Digital Scholarship Fellowship Award), decidí aplicar los modelos de Transkribus del FRC en otros materiales de la Nettie Lee Benson Latin American Collection. Más concretamente, lo apliqué al manuscrito 984 de la colección Joaquín García Izcabalceta, que se trata de un conjunto anónimo de sermones titulado Teotlatol Nemachtiloni ipan in Nahuacopa, escrito durante el siglo XVI. Mi trabajo consistió en aplicar y expandir los modelos de náhuatl a las 346 páginas del dicho manuscrito y revisarlas, con el objetivo de dejarlas listas para consulta.

El Vocabulario del Fondo Real de Cholula

Después de trabajar con Transkribus y fuentes nahuas durante un par de años, me di cuenta de que, aunque se había resuelto el problema de la transcripción, el desafío de traducir estos materiales inéditos permanecía. Dado que aún no existe una herramienta automatizada para traducir textos coloniales en náhuatl, se me ocurrió la idea de crear un vocabulario que incorporara las notas de transcripción y traducción producidas por los grupos de paleografía con los que colaboré en los documentos del FRC. El resultado fue la creación del Fondo Real de Cholula Vocabulary, un proyecto desarrollado con el apoyo de las bibliotecas de la UT y la beca Scholars Lab Fellowship 2024-2025.

La primera fase del proyecto consistió en crear una lista de palabras en Excel utilizando el contenido de los folios transcritos con Transkribus del FRC. Con la ayuda de Python y la orientación de los bibliotecarios Ian Goodale y Dale Correa, se generó una lista inicial de más de 10.000 palabras, organizada alfabéticamente y excluyendo palabras vacías (stop words), es decir, palabras comunes y repetitivas, como “in” en náhuatl. La fase siguiente consistió en seleccionar las palabras que podrían incluirse en el vocabulario según su frecuencia y relevancia para los usuarios, y agrupar aquellas con abreviaturas o variantes bajo la forma más utilizada. La lista tras Python se redujo a más de 3.000 palabras, mientras que la lista final incluyó 962 entradas, con sus posibles variaciones y abreviaturas. Entre las entradas finales, se incluyen 86 nombres, 117 apellidos, 28 topónimos y 97 préstamos del español (palabras tomadas del español al náhuatl). Tras completar la lista, las fases siguientes incluyeron traducir y subir las entradas a un sitio web en WordPress. Las palabras fueron traducidas del náhuatl al inglés y al español utilizando fuentes físicas y en línea, y en ocasiones con la experiencia de los académicos del Seminario de Náhuatl “Luis Reyes García” (BUAP). Finalmente, las entradas se publicaron en un sitio web alojado en la plataforma UT Creates, donde cada entrada incluye traducciones, fuentes, variantes ortográficas o abreviaturas, y expresiones formulares en las que aparecen dichas palabras. La inclusión de expresiones formulares fue uno de los objetivos del vocabulario, ya que estas expresiones se comprenden dentro de los contextos judiciales en los que fueron producidas. Un ejemplo es la expresión “Que sepan todos aquellos que vieren”, traducida al náhuatl como “Ma quimatican in ixquichtin yn aquique quitasque”, una expresión común al inicio de documentos judiciales españoles. Cada palabra de la expresión está vinculada a su respectiva entrada, pero la expresión completa también constituye una entrada por sí misma.

Página de inicio del sitio web Vocabulario del Fondo Real de Cholula.

Reflexiones finales

Según los estudiosos que trabajan con herramientas de Reconocimiento de Texto Manuscrito (HTR) como Transkribus, la implementación más amplia de metodologías de Humanidades Digitales está transformando los métodos utilizados en las disciplinas tradicionales de las humanidades, incluyendo Historia y Archivología. Estas herramientas permiten nuevas formas de acceso, procesamiento e investigación que desafían fundamentalmente prácticas académicas de larga data, principalmente al transformar los métodos de accesibilidad e indexación (Schwarz-Ricci, 2022). Según Muehlberger et al. (2019), los archivos están pasando de ser depósitos de documentos físicos inaccesibles a proveedores de recursos digitalmente indexados y consultables. Los estudiosos mencionados y Tikhonov et al. (2022) también sostienen que la transcripción y búsqueda automatizadas amplían las posibilidades existentes de investigación histórica, ya que los académicos ya no necesitan dedicar enormes cantidades de tiempo en la labor de transcripción. En este texto, no pretendo agotar la literatura sobre Transkribus o HD; más bien, propongo una reflexión sobre hasta qué punto los métodos “antiguos” o tradicionales en historia y ciencias sociales serán reemplazados por las nuevas tecnologías.

La persistencia de los métodos tradicionales en historia y ciencias sociales es enfatizada por varios académicos a pesar del avance de las HD (Charnow et al., 2023). Un argumento fundamental radica en la naturaleza misma de la investigación académica, que se basa en la interpretación humana y el pensamiento crítico más que en la eficiencia computacional. Jeffrey Ravel (Charnow et al., 2023), por ejemplo, afirma que el trabajo en archivos exige un nivel inevitable de paciencia y persistencia para descifrar e interpretar hallazgos. Siguiendo las ideas de Jeffrey Ravel, sostengo que cuestionar, revisar y seleccionar son herramientas obvias, pero también cruciales para historiadores y científicos sociales que trabajan con HD. En mis propios proyectos, hice reflexiones similares a las de Jeffrey Ravel mientras aprendía a utilizar nuevas tecnologías. Para trabajar correctamente con Transkribus, tuve que integrarme en grupos de paleografía y comprender los detalles del corpus de documentos que componen el FRC. Tras desarrollar y aplicar los modelos con Transkribus, también realicé un extenso trabajo de revisión de los textos transcritos, dado que los modelos poseen un coeficiente de error. Incluso cuando el coeficiente de error era cercano a cero, era necesario revisar cuidadosamente los materiales transcritos para garantizar su exactitud. Posteriormente, al trabajar con la traducción de textos coloniales en náhuatl del FRC, reflexioné sobre cómo facilitar y agilizar el proceso, a pesar de la inexistencia de herramientas automatizadas. Finalmente, la creación de un vocabulario para el FRC requirió múltiples selecciones de contenido y de lo qué mostrar. Aunque estos métodos puedan parecer obvios en cualquier trabajo científico, considero necesario destacarlos en los trabajos con HD para evitar tanto el escepticismo excesivo como el entusiasmo desmedido ante las nuevas tecnologías.

Retomando las preguntas de Ben Leeming sobre el uso ético de las herramientas de IA en la investigación etnohistórica del náhuatl que me inspiraron, creo que los proyectos en HD no pueden desarrollarse sin intervención humana — al menos por ahora. Es imposible hacer predicciones definitivas sobre el futuro, pero los métodos que caracterizan las “humanidades” en las Humanidades Digitales seguirán desempeñando papeles importantes en los trabajos de historia y ciencias sociales. Por ahora, las preguntas, las revisiones y las selecciones persisten como herramientas humanas fundamentales para hacer investigación en las humanidades y, quizás, también en otros campos científicos.

Agradecimientos

Quisiera reconocer que estudio fuentes producidas por los nahuas, a quienes expreso mi profundo respeto, y me comprometo a un uso cuidadoso de las mismas. Asimismo, este texto trata temas seleccionados sobre Humanidades Digitales, y fue parcialmente redactado utilizando la herramienta Dictate de Microsoft Word, traducido al español y al portugués y revisado con ChatGPT y contó con la investigación bibliográfica organizada con NotebookLM. También reflexiona críticamente sobre el uso de la tecnología en la producción académica actual.

Referencias

Charnow, Sally Debra, et al. “Digital Humanities—Ways Forward; Future Challenges: Honoring David Kammerling Smith and the Digital Public Sphere; Acceleration?; Digital Humanities for the People(?); Infrastructure as Privilege; Computation, Cultures, and Communities; Digital Humanities and Generational Shift.” Historical Reflections [Waterloo], vol. 49, no. 3, 2023, pp. 1–55. https://doi.org/10.3167/hrrh.2023.490301.

Muehlberger, Guenter, et al. “Transforming Scholarship in the Archives through Handwritten Text Recognition: Transkribus as a Case Study.” Journal of Documentation [Bradford], vol. 75, no. 5, 2019, pp. 954–76. https://doi.org/10.1108/JD-07-2018-0114.

Murrieta-Flores, Patricia, et al. Digital Resources: Artificial Intelligence, Computational Approaches, and Geographical Text Analysis to Investigate Early Colonial Mexico. Oxford University Press, 2022. https://doi.org/10.1093/acrefore/9780199366439.013.977.

Schreibman, Susan, et al. A Companion to Digital Humanities. John Wiley & Sons, Ltd., 2007. Blackwell Companions to Literature and Culture.

Schwarz-Ricci, V. I. Handwritten Text Recognition per registri notarili (secc. XV-XVI): una sperimentazione. 2022. iris.cnr.ithttps://iris.cnr.it/handle/20.500.14243/458793.

Tikhonov, Aleksej, et al. “Multilingual Handwritten Text Recognition (MultiHTR) or Reading Your Grandma’s Old Letters in German, Russian, Serbian, and Ottoman Turkish with Artificial Intelligence.” The Palgrave Handbook of Digital and Public Humanities, with Anne Schwan and Tara Thomson, Springer International Publishing, 2022, pp. 215–33. https://doi.org/10.1007/978-3-031-11886-9_12.

Tyers, Francis, et al. “Codex to Corpus: Exploring Annotation and Processing for an Open and Extensible Machine-Readable Edition of the Florentine Codex.” Proceedings of the Workshop on Natural Language Processing for Indigenous Languages of the Americas (AmericasNLP), Association for Computational Linguistics, 2023.

***

Questões, revisões e seleções: reflexões sobre humanidades digitais no estudo dos textos coloniais nahuas

 

Eduardo H. Gorobets Martins
The University of Texas at Austin

 

Cada geração tem sua própria tendência acadêmica. Em 2025, as Humanidades Digitais (HD) tornaram-se um dos campos mais discutidos na Academia. Mas o que significam as Humanidades Digitais? Qual é a importância das Humanidades Digitais no trabalho acadêmico de historiadores, cientistas sociais e professores? Como podemos nos orientar nesse campo? Em uma edição recente do congresso da American Society for Ethnohistory, o pesquisador independente Ben Leeming analisou o uso de ferramentas de Inteligência Artificial (IA), como ChatGPT, Claude, Gemini e NotebookLM em seu trabalho com fontes coloniais nahuas. Um dos aspectos gerais discutidos por Leeming foi foi até que ponto a inteligência artificial poderia substituir ou transformar as pesquisas atualmente conduzidas por etnohistoriadores. As preocupações de Leeming sobre o uso ético de ferramentas de IA na pesquisa me levaram a refletir sobre meu trabalho em HD nos últimos três anos e sobre como um texto breve poderia ajudar iniciantes que, como eu há quatro anos, ainda não sabem exatamente como navegar pelas inovações tecnológicas em seu trabalho acadêmico.

Neste texto, ao apresentar brevemente três projetos que desenvolvi e seus resultados, ofereço uma reflexão sugerindo que os métodos “antigos” das ciências sociais ou boas práticas científicas continuam sendo importantes, apesar das novas tecnologias e aplicações que surgem diariamente. Inspiro-me em estudiosos como Jeffrey Ravel (Charnow et al., 2023), que afirma que a interpretação humana e o pensamento crítico continuam fundamentais para trabalhos em história e ciências sociais, apesar do desenvolvimento das HD. Neste artigo, argumento que três ferramentas indispensáveis (e possivelmente óbvias) que me ajudaram a navegar as HD são: questionar, revisar e selecionar. Neste texto, examino brevemente o papel das HD no estudo de fontes coloniais nahuas, enfatizando a necessária presença dos métodos tradicionais das ciências sociais no trabalho com tecnologias emergentes.

O que são humanidades digitais?

A expressão “humanidades digitais” foi cunhada nos anos 2000 e vem sendo continuamente reformulada. Segundo Schreibman et al. (2007), as HD constituem um campo que permite uma “relação clara e direta entre as estratégias interpretativas empregadas pelos humanistas e as ferramentas que facilitam a exploração de artefatos originais com base nessas estratégias interpretativas”. Em outras palavras, as HD referem-se ao uso de ferramentas digitais nas disciplinas humanísticas, apoiando tanto a pesquisa quanto o ensino. As ferramentas digitais envolvem o uso de tecnologia para criar mapas, exposições digitais, visualizar e analisar dados. Por exemplo, o ArcGIS utiliza Sistemas de Informação Geográfica (GIS) para gerar visualizações de dados ou mapas interativos, enquanto o Transkribus emprega Reconhecimento de Texto Manuscrito (HTR) para transcrever manuscritos por meio de modelos de IA. As HD são importantes porque transformam o conhecimento das humanidades em diferentes formatos e ajudam pesquisadores e estudantes a acessá-lo de maneiras inovadoras. No entanto, navegar esse campo pode ser desafiador, já que diariamente surgem novas ferramentas. Uma forma de começar é considerar a dupla “fonte + ferramenta”, o que permite explorar as possibilidades de um projeto e os resultados de aprendizagem ou conteúdos que se deseja transmitir.

No campo dos Estudos Nahuas, por exemplo, pesquisadores estão pesquisando como fontes coloniais (e, futuramente, até mesmo pré-invasão) podem ser abordadas por meio das HD. Entre seus diversos projetos em HD, Patricia Murrieta-Flores, junto com Diego Jiménez-Badillo e Bruno Martins (2023), desenvolveu ferramentas digitais de acesso aberto, conjuntos de dados e métodos para viabilizar análises em grande escala e espacialmente fundamentadas das Relaciones Geográficas de la Nueva España. Outro exemplo é o trabalho de Francis Tyers, Robert Pugh e Valery Berthoud, que estão desenvolvendo sistemas computacionais para analisar e anotar textos históricos e contemporâneos em nahuatl, como o Códice Florentino (Tyers et al., 2023).

Transkribus: uma ferramenta para transcrever manuscritos coloniais nahuas

Há quatro anos, quando ouvi pela primeira vez a expressão “humanidades digitais”, confesso que não fazia ideia do que as pessoas estavam falando. Meu primeiro projeto envolveu paleografia e transcrição de manuscritos escritos em nahuatl, uma língua indígena do México. Meu trabalho foi uma pequena contribuição para o projeto Unlocking the Colonial Archive, liderado por pesquisadores de várias universidades, incluindo Kelly McDonough e Albert Palacios, da University of Texas at Austin, que orientaram minhas primeiras experiências com HD. Meu objetivo (iniciado com uma bolsa de HD em 2022 e continuado durante meu período como assistente de pesquisa de pós-graduação com Albert Palacios) era criar modelos de IA para auxiliar na transcrição de manuscritos digitalizados em nahuatl. Esse trabalho utilizou a ferramenta Transkribus para analisar documentos escritos em nahuatl do Fondo Real de Cholula, um arquivo que preserva centenas de registros que oferecem perspectivas de como a vida cotidiana nahua durante o período colonial foi documentada legalmente. O FRC foi recentemente digitalizado (2018-2022) por meio de uma parceria entre a Nettie Lee Benson Latin American Collection (UT-Austin), o Poder Judiciário do Estado de Puebla (México) e a Benemérita Universidad Autónoma de Puebla (BUAP-México).

O arquivo do Fondo Real de Cholula representa um corpus importante para pesquisadores que trabalham com materiais da Nova Espanha, pois Cholula detinha o status de “Cidade de Índios” desde a década de 1530, o que significava que estava sob controle direto da Coroa espanhola, mas mantinha certos privilégios e um cabildo indígena plenamente funcional, que governava junto ao espanhol. De mais de 700 documentos do FRC, pelo menos 72 contêm fólios escritos em nahuatl, o que ilustra o amplo uso dessa língua no contexto dos processos judiciais. A digitalização desse arquivo gerou um acesso mais fácil a diversos tipos de documentos que o compõem, como processos civis e criminais, documentos financeiros emitidos pelas Repúblicas de Índios e testamentos.

Já o trabalho com o Transkribus consiste em várias fases. Primeiro, é necessário enviar para o site online ou para o programa no computador um número de arquivos com imagens dos manuscritos. Em seguida, seleciona-se as áreas de texto de cada página que queremos treinar e as transcreve. “Treinar” aqui significa transcrever um número suficiente de páginas e criar um modelo de IA capaz de identificar os mesmos padrões de imagem e convertê-los em caracteres. A tecnologia envolvida nesse processo é chamada Reconhecimento de Texto Manuscrito (HTR, em inglês). Após compilar um pequeno conjunto de páginas transcritas (pelo menos trinta no mesmo estilo de escrita) um modelo pode ser criado, e começa então o processo de refinamento do índice de erro. Como se pode ver, grande parte do trabalho inicial com o Transkribus é criar uma amostra de transcrições, o que significa que a tecnologia não criará um modelo automaticamente com apenas alguns cliques. Nessa fase, o trabalho coletivo de pesquisadores e estudantes foi fundamental por meio do Seminário de Náhuatl “Luis Reyes García” (BUAP, coordenado por Lídia Gómez García) e do NEH-AHRC Spanish Paleography and Digital Humanities Institute (UT-Austin, coordenado por Albert Palacios). Ambos os seminários utilizaram a plataforma colaborativa FromThePage para transcrever (e ocasionalmente traduzir) documentos, com o objetivo de torná-los publicamente disponíveis.

Exemplo de um fólio do Fundo Real de Cholula (FRC) sendo transcrito no Transkribus.

 

Ao final, foi criado um modelo de Transkribus para os documentos em nahuatl do FRC, especificamente para ser usado com documentos produzidos nos séculos XVII e XVIII. Esse modelo apresentou um baixo coeficiente de erro (entre 7 e 11%), o que significa que, ao aplicá-lo a um fólio não transcrito, estima-se que entre 7 e 11% das palavras precisarão ser revisadas e corrigidas. Como consequência da criação do modelo, mais de 50 fólios de 9 documentos foram transcritos coletivamente, totalizando mais de 10.000 palavras. Todos esses materiais, juntamente com muitos outros textos transcritos do espanhol, estão disponíveis no FromThePage.

Além disso, em outro projeto desenvolvido em 2024 (Digital Scholarship Fellowship Award), decidi aplicar os modelos de náhuatl do FRC do Transkribus em outros materiais da Nettie Lee Benson Latin American Collection. Mais especificamente, os apliquei ao manuscrito 984 da coleção Joaquín García Izcabalceta, que consiste em um conjunto anônimo de sermões intitulado Teotlatol Nemachtiloni ipan in Nahuacopa, escrito no século XVI. Meu trabalho consistiu em aplicar e expandir os modelos de nahuatl às 346 páginas do manuscrito e revisá-lo para que ficasse pronto para consulta.

O vocabulário do Fondo Real de Cholula

Após trabalhar com o Transkribus e fontes nahuas por alguns anos, percebi que, embora o problema da transcrição estivesse resolvido, o desafio de traduzir esses materiais inéditos permanecia. Como ainda não existe uma ferramenta automatizada para traduzir textos coloniais em nahuatl, surgiu a ideia de criar um vocabulário que incorporasse as notas de transcrição e tradução produzidas pelos grupos de paleografia com os quais colaborei nos documentos do FRC. O resultado foi a criação do Fondo Real de Cholula Vocabulary, um projeto desenvolvido com o apoio das bibliotecas da UT e da Scholars Lab Fellowship 2024-2025.

A primeira fase do projeto consistiu em criar uma lista de palavras no Excel usando o conteúdo dos fólios transcritos com o Transkribus a partir do FRC. Com o auxílio da linguagem Python e a orientação dos bibliotecários Ian Goodale e Dale Correa, foi gerada uma lista inicial com mais de 10.000 palavras, organizada alfabeticamente e excluindo stop words — palavras comuns e repetitivas, como “in” em nahuatl. A etapa seguinte consistiu em selecionar palavras que poderiam ser incluídas no vocabulário com base em sua frequência e relevância para os usuários, além de agrupar palavras com abreviações ou variações sob a forma mais comumente utilizada. Após a triagem com Python, a lista foi reduzida para pouco mais de 3.000 palavras, enquanto a lista final incluiu 962 entradas, com suas possíveis variações e abreviações. Entre essas, há 86 nomes próprios, 117 sobrenomes, 28 topônimos e 97 palavras emprestadas do espanhol (palavras incorporadas do espanhol para o nahuatl). Após a conclusão da lista, as fases subsequentes incluíram a tradução e o upload das entradas em um site WordPress. As palavras foram traduzidas do nahuatl para o inglês e o espanhol utilizando fontes físicas e online, e ocasionalmente a expertise dos estudiosos do Seminário de Náhuatl “Luis Reyes García” (BUAP). Por fim, as entradas foram publicadas em um site hospedado na plataforma UT Creates, onde cada entrada contém traduções, fontes, variantes ortográficas ou abreviações e, em alguns casos, expressões formulares em que essas palavras aparecem. A inclusão de expressões formulares foi justamente um dos objetivos do vocabulário, já que elas podem ser compreendidas nos contextos judiciais em que foram produzidas. Um exemplo é a expressão “Que sepan todos aquellos que vieren”, traduzida para o náhuatl como “Ma quimatican in ixquichtin yn aquique quitasque”. Em português, significa “Que saibam todos aqueles que verem”, uma expressão comum usada no início de documentos judiciais espanhóis. Cada palavra da expressão possui links para suas respectivas entradas, mas a expressão completa também é registrada como uma entrada.

Página inicial do site Vocabulário do Fundo Real de Cholula.

Reflexões finais

Segundo estudiosos que trabalham com ferramentas de Reconhecimento de Texto Manuscrito (HTR), como o Transkribus, a implementação mais ampla das metodologias das Humanidades Digitais está transformando os métodos utilizados nas disciplinas tradicionais das humanidades, incluindo História e Arquivologia. Essas ferramentas possibilitam novas formas de acesso, processamento e investigação que desafiam fundamentalmente práticas acadêmicas de longa data, principalmente ao transformar os métodos de acessibilidade e indexação (Schwarz-Ricci, 2022). De acordo com Muehlberger et al. (2019), os arquivos estão passando de repositórios de documentos físicos inacessíveis para provedores de recursos pesquisáveis e digitalmente indexados. Os autores mencionados e Tikhonov et al. (2022) também argumentam que a transcrição e busca automatizadas ampliam as possibilidades existentes de investigação histórica para os pesquisadores, pois não é mais necessário gastar imensas quantidades de tempo no labor da transcrição. Neste texto, não busco esgotar a literatura sobre o Transkribus ou HD; em vez disso, proponho uma reflexão sobre até que ponto os métodos “antigos” ou tradicionais em história e ciências sociais serão realmente substituídos pelas novas tecnologias.

A persistência dos métodos tradicionais em história e ciências sociais é enfatizada por diversos estudiosos, mesmo diante do avanço das HD (Charnow et al., 2023). Um argumento fundamental para isso se baseia na própria natureza da investigação acadêmica, que depende da interpretação humana e do pensamento crítico, e não apenas da eficiência computacional. Jeffrey Ravel (Charnow et al., 2023), por exemplo, afirma que o trabalho em arquivos exige um grau inevitável de paciência e persistência para decifrar e interpretar os resultados. Com base nestas ideias, defendo que questionar, revisar e selecionar são ferramentas óbvias, mas também cruciais para historiadores e cientistas sociais que trabalham com HD. Em meus próprios projetos, encontrei reflexões semelhantes às de Jeffrey Ravel enquanto aprendia a usar novas tecnologias. Para trabalhar adequadamente com o Transkribus, precisei me integrar a grupos de paleografia e compreender os detalhes do corpus de documentos que compõem o Fondo Real de Cholula (FRC). Após desenvolver e aplicar os modelos com o Transkribus, também realizei um trabalho extensivo de revisão dos textos transcritos, uma vez que os modelos apresentam um coeficiente de erro. Mesmo quando o coeficiente de erro estava próximo de zero, ainda era necessário revisar cuidadosamente os materiais transcritos para garantir sua precisão. Posteriormente, ao lidar com a tradução de textos coloniais em nahuatl do FRC, refleti sobre como tornar o processo mais fácil e rápido, apesar da inexistência de ferramentas automatizadas para isso. Por fim, a criação de um vocabulário para o FRC exigiu múltiplas escolhas de conteúdo e definição do que exibir. Em suma, todas essas experiências com HD não seriam possíveis sem questionar ideias, revisar dados e selecionar materiais e categorias. Embora esses métodos pareçam óbvios em qualquer trabalho científico, acredito que devam ser ressaltados nos trabalhos com HD, para evitar tanto o ceticismo excessivo quanto o entusiasmo exagerado com as novas tecnologias.

Retomando as questões de Ben Leeming sobre o uso ético de ferramentas de IA em pesquisas etno-históricas nahuas que me inspiraram, acredito que projetos em HD não podem ocorrer sem intervenção humana — pelo menos, ainda não. É impossível fazer previsões definitivas sobre o futuro, mas os métodos que caracterizam as “humanidades” nas Humanidades Digitais continuarão desempenhando papéis importantes nos trabalhos de história e ciências sociais. Por ora, questionamentos, revisões e seleções permanecem como “ferramentas” humanas fundamentais para fazer pesquisa em humanidades — e talvez, em outros campos científicos também.

Agradecimentos

Gostaria de reconhecer que estou estudando fontes produzidas pelos nahuas, aos quais expresso meu profundo respeito, e estou comprometido com seu uso cuidadoso. Além disso, este texto aborda tópicos selecionados sobre Humanidades Digitais, e foi parcialmente escrito utilizando a ferramenta Dictate do Microsoft Word, traduzido para espanhol e português, revisado com o auxílio do ChatGPT e teve a pesquisa bibliográfica organizada com o NotebookLM. O texto também reflete de forma crítica sobre o uso da tecnologia na produção acadêmica atual.

Referências

Charnow, Sally Debra, et al. “Digital Humanities—Ways Forward; Future Challenges: Honoring David Kammerling Smith and the Digital Public Sphere; Acceleration?; Digital Humanities for the People(?); Infrastructure as Privilege; Computation, Cultures, and Communities; Digital Humanities and Generational Shift.” Historical Reflections [Waterloo], vol. 49, no. 3, 2023, pp. 1–55. https://doi.org/10.3167/hrrh.2023.490301.

Muehlberger, Guenter, et al. “Transforming Scholarship in the Archives through Handwritten Text Recognition: Transkribus as a Case Study.” Journal of Documentation [Bradford], vol. 75, no. 5, 2019, pp. 954–76. https://doi.org/10.1108/JD-07-2018-0114.

Murrieta-Flores, Patricia, et al. Digital Resources: Artificial Intelligence, Computational Approaches, and Geographical Text Analysis to Investigate Early Colonial Mexico. Oxford University Press, 2022. https://doi.org/10.1093/acrefore/9780199366439.013.977.

Schreibman, Susan, et al. A Companion to Digital Humanities. John Wiley & Sons, Ltd., 2007. Blackwell Companions to Literature and Culture.

Schwarz-Ricci, V. I. Handwritten Text Recognition per registri notarili (secc. XV-XVI): una sperimentazione. 2022. iris.cnr.ithttps://iris.cnr.it/handle/20.500.14243/458793.

Tikhonov, Aleksej, et al. “Multilingual Handwritten Text Recognition (MultiHTR) or Reading Your Grandma’s Old Letters in German, Russian, Serbian, and Ottoman Turkish with Artificial Intelligence.” The Palgrave Handbook of Digital and Public Humanities, with Anne Schwan and Tara Thomson, Springer International Publishing, 2022, pp. 215–33. https://doi.org/10.1007/978-3-031-11886-9_12.

Tyers, Francis, et al. “Codex to Corpus: Exploring Annotation and Processing for an Open and Extensible Machine-Readable Edition of the Florentine Codex.” Proceedings of the Workshop on Natural Language Processing for Indigenous Languages of the Americas (AmericasNLP), Association for Computational Linguistics, 2023.

Eduardo H. Gorobets Martins is a Ph.D. Candidate in the Department of Spanish and Portuguese at The University of Texas at Austin. His dissertation examines the relational dynamics between humans and more-than-humans in early colonial Nahua society, as well as the influence of Christianity on these worldviews. Eduardo holds an M.A. in Social History (2018) and a bachelor’s degree in history (2014) from the University of São Paulo. His primary research interests include the history and culture of Indigenous peoples in colonial Mexico, the Nahuatl language, and digital humanities.

Visitas: 27

Share on facebook
Share on twitter
Share on linkedin
Share on pinterest