Miguel Rodríguez-Mondoñedo, Francisco Cerna-Herrera, César Ramos, Alexandra Arnaiz, Ana Rosa Moreno, Joe Huamani-Malca, and Gissella Bejarano (2025) An Interdisciplinary Approach to Sign Language Data Set Collection of Native Signers
Our work presents the design of a process to collect a sign language corpus from Deaf participants as an interdisciplinary effort. The process was designed to provide a guide to record videos ensuring that the linguistic data accurately reflects the natural usage of signers. A key aspect of this research was the direct participation of Deaf individuals as primary language informants and co-designers, reinforcing the authenticity and cultural relevance of the collected data. Moreover, an interdisciplinary team composed by linguists, interpreters, and engineers tested and refined the data collection methodology. The proposed process was designed to align with the linguistic and communicative norms of the Peruvian Deaf community. The data was gathered through signing tasks piloted with two Deaf participants. This process represents a significant step toward documenting and analyzing an LSP corpus. It provides a valuable resource for data collection involving minority groups, linguistic research, language planning, and promoting accessibility for the Peruvian Deaf community. The study underscores the importance of community-centered approaches and interdisciplinary collaboration in sign language research.
Año de publicación: 2025
Our work presents the design of a process to collect a sign language corpus from Deaf participants as an interdisciplinary effort. The process was designed to provide a guide to record videos ensuring that the linguistic data accurately reflects the natural usage of signers. A key aspect of this research was the direct participation of Deaf individuals as primary language informants and co-designers, reinforcing the authenticity and cultural relevance of the collected data. Moreover, an interdisciplinary team composed by linguists, interpreters, and engineers tested and refined the data collection methodology. The proposed process was designed to align with the linguistic and communicative norms of the Peruvian Deaf community. The data was gathered through signing tasks piloted with two Deaf participants. This process represents a significant step toward documenting and analyzing an LSP corpus. It provides a valuable resource for data collection involving minority groups, linguistic research, language planning, and promoting accessibility for the Peruvian Deaf community. The study underscores the importance of community-centered approaches and interdisciplinary collaboration in sign language research.
Año de publicación: 2025
Joe Huamani-Malca, Miguel Rodriguez Mondoñedo, Francisco Cerna-Herrera, Gissella Bejarano, Carlos Vásquez Roque, Cesar Augusto Ramos Cantu, and Sabina Oporto Pérez (2024) Lessons from Deploying the First Bilingual Peruvian Sign Language - Spanish Online Dictionary
Bilingual dictionaries present several challenges, especially for sign languages and oral languages, where multimodality plays a role. We deployed and tested the first bilingual Peruvian Sign Language (LSP) - Spanish Online Dictionary. The first feature allows the user to introduce a text and receive as a result a list of videos whose glosses are related to the input text or Spanish word. The second feature allows the user to sign in front of the camera and shows the five most probable Spanish translations based on the similarity between the input sign and gloss-labeled sign videos used to train a machine learning model. These features are constructed in a design and architecture that differentiates among the coincidence for the Spanish text searched, the sign gloss, and Spanish translation. We explain in depth how these concepts or database columns impact the search. Similarly, we share the challenges of deploying a real-world machine learning model for isolated sign language recognition through Amazon Web Services (AWS).
Año de publicación: 2024
Bilingual dictionaries present several challenges, especially for sign languages and oral languages, where multimodality plays a role. We deployed and tested the first bilingual Peruvian Sign Language (LSP) - Spanish Online Dictionary. The first feature allows the user to introduce a text and receive as a result a list of videos whose glosses are related to the input text or Spanish word. The second feature allows the user to sign in front of the camera and shows the five most probable Spanish translations based on the similarity between the input sign and gloss-labeled sign videos used to train a machine learning model. These features are constructed in a design and architecture that differentiates among the coincidence for the Spanish text searched, the sign gloss, and Spanish translation. We explain in depth how these concepts or database columns impact the search. Similarly, we share the challenges of deploying a real-world machine learning model for isolated sign language recognition through Amazon Web Services (AWS).
Año de publicación: 2024
Malca Belén, Marco (2023) Lexicogénesis en Lengua de Señas Peruana: procesos involucrados en la formación de señas que designan divisiones territoriales de carácter administrativo
El propósito de este artículo es analizar las señas que designan divisiones territoriales de carácter administrativo en la Lengua de Señas Peruana (LSP) con el fin de obtener los principales procesos de formación de estas señas toponímicas. En esta investigación, se recopilaron datos con Sordos señantes de LSP mediante una lista que contenía nombres de divisiones territoriales administrativas peruanas, por ejemplo, los nombres de los departamentos y las capitales del Perú. Luego, para determinar los diversos procesos de creación léxica, se llevó a cabo un análisis de los datos elicitados. Los resultados muestran que los procesos involucrados en la creación de estas señas pueden dividirse en dos grupos: el de los procesos lingüísticos, por ejemplo, el deletreo y la composición, y el de los mecanismos cognitivos, como la metonimia.
Año de publicación: 2023
El propósito de este artículo es analizar las señas que designan divisiones territoriales de carácter administrativo en la Lengua de Señas Peruana (LSP) con el fin de obtener los principales procesos de formación de estas señas toponímicas. En esta investigación, se recopilaron datos con Sordos señantes de LSP mediante una lista que contenía nombres de divisiones territoriales administrativas peruanas, por ejemplo, los nombres de los departamentos y las capitales del Perú. Luego, para determinar los diversos procesos de creación léxica, se llevó a cabo un análisis de los datos elicitados. Los resultados muestran que los procesos involucrados en la creación de estas señas pueden dividirse en dos grupos: el de los procesos lingüísticos, por ejemplo, el deletreo y la composición, y el de los mecanismos cognitivos, como la metonimia.
Año de publicación: 2023
RODRÍGUEZ MONDOÑEDO, Miguel. y ARNAIZ, Alexandra (2022). A copula in Peruvian Sign Language.
In this paper, we present the hypothesis that Peruvian Sign Language (LSP) has at least one copula that has been recruited from the pronominal third person pronoun, a very well attested typological change (Van der Gelderen 2011, 2015). Interestingly, the copula is only allowed in a subset of non-verbal predication clauses, namely, the ones expressing stage-level predicate.
Año de publicación: 2022
In this paper, we present the hypothesis that Peruvian Sign Language (LSP) has at least one copula that has been recruited from the pronominal third person pronoun, a very well attested typological change (Van der Gelderen 2011, 2015). Interestingly, the copula is only allowed in a subset of non-verbal predication clauses, namely, the ones expressing stage-level predicate.
Año de publicación: 2022
BEJARANO, Gissella, Joe Huamani-Malca, Francisco CERNA-HERRERA, Fernando Alva-Manchego, Pablo Rivas (2022) PeruSIL: A Framework to Build a Continuous Peruvian Sign Language Interpretation Dataset
Video-based datasets for Continuous Sign Language are scarce due to the challenging task of recording videos from native signers and the reduced number of people who can annotate sign language....
Año de publicación: 2022
Video-based datasets for Continuous Sign Language are scarce due to the challenging task of recording videos from native signers and the reduced number of people who can annotate sign language....
Año de publicación: 2022
CERNA-HERRERA, Francisco & César RAMOS (2022) Cláusulas relativas en lengua de señas peruana (LSP)
La lengua de señas peruana (LSP) es una lengua viso-gestual originaria del Perú utilizada por la comunidad sorda del país. Este artículo tiene como objetivo presentar hallazgos preliminares sobre las...
Año de publicación: 2022
La lengua de señas peruana (LSP) es una lengua viso-gestual originaria del Perú utilizada por la comunidad sorda del país. Este artículo tiene como objetivo presentar hallazgos preliminares sobre las...
Año de publicación: 2022
MARINO C., Mateo (2018). Propuesta de investigación para el estudio sobre la adquisición de clasificadores en Lengua de Señas Peruana como segunda lengua
El presente documento ofrece una propuesta esquemática de investigación acerca de la adquisición de los clasificadores en Lengua de Señas Peruana como segunda lengua por parte de niños y niñas oyentes.
Año de publicación: 2018
El presente documento ofrece una propuesta esquemática de investigación acerca de la adquisición de los clasificadores en Lengua de Señas Peruana como segunda lengua por parte de niños y niñas oyentes.
Año de publicación: 2018
