Papers by Lucía Cantamutto
Aplicaciones de las humanidades digitales al análisis de las prácticas discursivas digitales en e... more Aplicaciones de las humanidades digitales al análisis de las prácticas discursivas digitales en el ámbito universitario: una propuesta desde el proyecto CoDiCE .
Circulo De Linguistica Aplicada A La Comunicacion, Feb 19, 2019
Within the semiotic resources available in instant messaging systems, emojis are especially appre... more Within the semiotic resources available in instant messaging systems, emojis are especially appreciated by users due to the varied repertoire that offer as for its ability to dynamize the interaction. With the growth of its use, we consider the need for a methodology technique that allows not only to identify the most frequent emojis (i.e., those who have a more extended use in a speech community), but also its main functions and common interpretations. Therefore, in this work, we present, on the one hand, a methodology that makes it possible to recover the emojis used most frequently by a group of WhatsApp users and, on the other, an exploration and interpretation of these first data obtained. We applied our methodological design for the collection of a comparative sample of two Spanish varieties: Spanish of Spain and Spanish of Argentina.
El algoritmo Stanford Multi Sieve Pass (propuesto por Raghunathan et al. 2010) realiza secuencial... more El algoritmo Stanford Multi Sieve Pass (propuesto por Raghunathan et al. 2010) realiza secuencialmente una serie de pasos de reconocimiento que de manera incremental terminan proponiendo correferencias entre las entidades candidatas identificadas en el texto. En este artículo, presentamos brevemente los trabajos de adaptación de este algoritmo y de otras herramientas de análisis (p. e., OpeNER) a textos en español (Agerri et al. 2013; Bermúdez 2013). A fin de avanzar en el desarrollo de estas herramientas para el Procesamiento del Lenguaje Natural (PLN), aplicamos estas directrices manualmente sobre un corpus experimental extraído de Wikipedia, con los que se pueden configurar textos breves (como por ejemplo tuits u otro tipo de microcontenidos) con sentido pleno. Como resultado, se ofrece un ejemplo de análisis manual que será automatizado en etapas posteriores de la investigación.
Revista Signos, Mar 1, 2022
Introducción a la sección monográfica: Nuevas perspectivas en el estudio de las formas y fórmulas... more Introducción a la sección monográfica: Nuevas perspectivas en el estudio de las formas y fórmulas de tratamiento: De la teoría a la práctica Entendemos las formas y fórmulas de tratamiento como expresiones que utilizan los emisores para aludir a sus interlocutores y que involucran las variadas maneras de dirigirse de una persona a otra. De ahí, entonces, su inestabilidad, ya que son especialmente susceptibles a influencias lingüísticas y extralingüísticas que condicionan su empleo y evolución (Cautín-Epifani & Gladic, 2018). Tradicionalmente, la investigación en esta área ha intentado esclarecer las regularidades que subyacen al uso de estos elementos en diversas situaciones y para dirigirse a diferentes interlocutores. Así, en 2018 editamos un volumen monográfico en el que abordamos, específicamente, el estudio del uso de las formas y fórmulas de tratamiento en el discurso digital, siempre desde una perspectiva descriptiva, en un afán de dar cuenta de las regularidades antes mencionadas (Hummel, Cautín-Epifani, Cantamutto & Rigatuso, 2018).
El estudio de las formas y fórmulas de tratamiento está en pleno auge. Prueba de ello son los muc... more El estudio de las formas y fórmulas de tratamiento está en pleno auge. Prueba de ello son los muchos congresos, coloquios, secciones temáticas y publicaciones que se realizaron durante las últimas dos décadas, incluyendo una nueva serie especializada, Topics in Address Research en la editorial John Benjamins. Dentro de este concierto, los estudios dedicados a las formas y fórmulas de tratamiento en el mundo hispanohablante ocupan un lugar destacado, tanto por la cantidad como por la calidad de los trabajos. La segunda edición de la bibliografía en línea editada por Mauro Fernández y Katharina Gerhalter (2016-2017) reseña más de 1500 trabajos. El tema es muy complejo, porque la estrecha vinculación de las fórmulas de tratamiento con la diversidad de las relaciones individuales y sociales va aparejado con el desarrollo no solo de usos diversos, sino también de sistemas o paradigmas distintos que se reparten según los factores de la variación lingüística sobre el vasto territorio donde se hablan las distintas variedades del español. Dentro del conjunto de los ejes variacionales clásicos, que son la variación diacrónica, diatópica, diastrática y diafásica, el último tipo de variación resulta problemático, ya que, en el fondo, se trata de indagar en los motivos de usos individuales capaces de convertirse, en algunos casos, en un estilo individual.
Dentro del conjunto de investigaciones sobre la comunicacion digital, uno de los problemas con lo... more Dentro del conjunto de investigaciones sobre la comunicacion digital, uno de los problemas con los que se enfrenta el investigador estriba en el establecimiento de corpus de datos. No siempre resulta posible la recogida de muestras de lengua que conserven la representatividad necesaria para legitimar cualquier estudio (cfr. Toruella y Llisterri, 1999). Esta limitacion ha llevado a muchos investigadores a trabajar con corpus “escasos” (Ling, 2005) o “fortuitos” (Campano Escudero, 2007). Para solventar esta carencia resulta necesario establecer corpus estables de muestras de lengua de la comunicacion digital. Las herramientas colaborativas que actualmente ofrece internet resultan muy utiles a este fin. Los corpus linguisticos han encontrado en la Web un espacio dinamico y accesible para investigadores de disciplinas diversas que requieren datos primarios no siempre a su alcance. No obstante, hasta donde llega nuestro conocimiento, no existe aun para el espanol un repositorio de corpus de comunicacion digital que recopile muestras de chat, email, SMS, entre otras, para su estudio sociolinguistico. El objetivo de esta comunicacion es doble. Por un lado, llevaremos a cabo una reflexion sobre los problemas metodologicos de recogida y fijacion de datos en los entornos comunicativos digitales, a partir de la reflexion sobre los antecedentes encontrados en ingles, frances y chino. Por otro lado, presentaremos los preliminares de un proyecto de creacion de un repositorio abierto y colaborativo de comunicaciones digitales. Este corpus permitira el avance de investigaciones sobre variacion pragmatica y sociolinguistica intra e interlinguistica, de gran repercusion en los estudios linguisticos del ultimo tiempo, en la comunicacion digital.
Cuadernos.info, 2023
Corpus de interacciones digitales: sistematización de técnicas para recoger datos en WhatsApp Cor... more Corpus de interacciones digitales: sistematización de técnicas para recoger datos en WhatsApp Corpus of digital interactions: systematization of techniques to collect data on WhatsApp Corpus de interações digitais: sistematização de técnicas para coleta de dados no WhatsApp
Tonos digital: Revista de estudios filológicos, 2020
El objetivo de este trabajo es caracterizar el texto breve como género emergente del discurso dig... more El objetivo de este trabajo es caracterizar el texto breve como género emergente del discurso digital. Partimos de la hipótesis de que los géneros discursivos son respuestas lingüísticas tipificadas a ciertas necesidades comunicativas, que en el caso del discurso digital, están influidos de forma directa por las características del medio. Para abordar nuestros objetivos de investigación optamos por una propuesta metodológica que combina el análisis de textos reales, con los resultados de unas entrevistas abiertas y una encuesta de hábitos sociales sobre los textos breves en internet. A partir de estos instrumentos, se identificaron dos subtipos pertenecientes al 1 El orden de las autoras es alfabético. Las dos autoras han colaborado por igual en concepción y planificación y redacción del trabajo. Todas las ideas de este artículo son fruto de la reflexión que ambas autoras llevan desarrollando de forma colaborativa en el ámbito de proyecto CoDiCE (disponible en www.codice.aplicacionesonline.com) que ellas dirigen.
Ikala, revista de lenguaje y cultura, May 5, 2021
La crisis sanitaria de la covid-19 vino acompañada de medidas de aislamiento, entre las que se en... more La crisis sanitaria de la covid-19 vino acompañada de medidas de aislamiento, entre las que se encontraba el confinamiento domiciliario, que provocaron múltiples reacciones en las redes sociales. El objetivo de este artículo consiste en analizar la conversación digital observada en Twitter®, en torno al hashtag #Me-QuedoEnCasa, en el periodo comprendido entre el 20 y el 27 de marzo de 2020. El estudio parte de una metodología mixta, en la que se combinan técnicas de análisis del social media mining con estrategias cualitativas propias del análisis lingüístico. Desde el punto de vista teórico, nos apoyamos en conceptos de las teorías del encuadre y de la valoración. Los resultados apuntan al enmarque positivo del confinamiento, a través de rasgos semióticos de distinto nivel: léxico, semántico y pragmático. Las cuentas más influyentes inclinaron su producción discursiva hacia la polaridad positiva. El análisis empírico permite concluir que el encuadre discursivo de esta conversación digital combina dos ejes semánticos (colectividad y salud), dos ejes enunciativos (aquí y ahora) y un eje emocional, lo que implica que hashtags como #MeQuedoEnCasa funcionan como señas de identidad social, como marcas de anclaje enunciativo y como instrumentos para fomentar la responsabilidad del individuo desde valores positivos. Palabras clave: covid-19; teoría del encuadre; análisis lexicométrico; redes sociales; teoría de la valoración; Twitter®; conversaciones digitales.
CHIMERA: Revista de Corpus de Lenguas Romances y Estudios Lingüísticos
One of the challenges faced by the analyst of digital communication consists on the establishment... more One of the challenges faced by the analyst of digital communication consists on the establishment of a corpus that preserve the representativeness and which responds to the nature of these samples of language, in particular as regards two parameters: multimodality and the multi-simultaneity. The article has three objectives. On the one hand, we review the situation of samples of digital speech at international level and specifically for the Spanish.Then, we show a methodological reflection on the problems of collecting and setting of data in the digital speech, from four cornerstones (communicative situation, nature of the data, representativeness of the sample and ethical issues). Finally, we propose guidelines to collect and transcript samples of digital speech (textual or enriched with multimodal data) for the CoDiCE repository feed.
Filología
En el presente artículo se describe la incidencia del hipervínculo apelativo en uno de los género... more En el presente artículo se describe la incidencia del hipervínculo apelativo en uno de los géneros de la comunicación digital, el texto breve, y se establecen las condiciones que justifican su aparición como una forma de apelación propia de este ámbito discursivo. Para ello, analizamos las ocurrencias de hipervínculos apelativos en un corpus exploratorio de textos breves publicados en la Biografía Facebook de sujetos chilenos. Lo observado indica que el hipervínculo apelativo responde, por un lado, a una posibilidad que ofrece la arquitectura de las plataformas de avisar al usuario que ha sido nombrado y, por otro, a la necesidad de los usuarios de utilizar mecanismos efectivos para apelar a otros y favorecer así la interacción. En este sentido, proponemos al hipervínculo apelativo como una forma de tratamiento propia del discurso digital, cuyo análisis se enmarca desde la perspectiva de los elementos vocativos, y que, además, caracteriza al texto breve como un género autóctono del ...
Este trabajo contribuye a la definición del discurso digital como objeto de estudio. Para ello, r... more Este trabajo contribuye a la definición del discurso digital como objeto de estudio. Para ello, reflexiona sobre la posibilidad de caracterizarlo a través de una serie de propiedades que atiendan tanto a factores relativos al modo de realización, a la situación de comunicación y a la relación entre sus interlocutores. En el marco de la nueva retórica y los estudios sobre el análisis del discurso digital, el artículo describe diferentes propiedades de la interacción digital. En un contexto en que las interfaces y los artefactos que mediatizan los intercambios se encuentran en constante redefinición, se defiende la pertinencia de apuntar unos parámetros que permitan abordar las condiciones que las interfaces imprimen sobre el discurso digital, desde una perspectiva independiente a las aplicaciones.Este trabajo contribuye a la definición del discurso digital como objeto de estudio. Para ello, reflexiona sobre la posibilidad de caracterizarlo a través de una serie de propiedades que ati...
espanolEl discurso digital supone un desafio metodologico para el analisis del discurso. Muchas s... more espanolEl discurso digital supone un desafio metodologico para el analisis del discurso. Muchas son las facetas que implican dificultades en el acceso a las muestras de lenguas necesarias para su posterior analisis. La naturaleza intima de las interacciones digitales obliga al analista de discurso a disenar protocolos complejos para la recogida de datos. El articulo aborda la tecnica de participante observador para el estudio de los grupos de WhatsApp. Se hace un repaso teorico sobre las formas de recoleccion de datos utilizadas en la bibliografia previa y, a partir de ello, se describe el protocolo implementado en una investigacion enmarcada en CoDiCE. Los resultados dan muestra de la fiabilidad de esta tecnica para hacer estudios de interacciones privadas. EnglishDigital discourse is a methodological challenge for discourse analysis. There are many aspects in the access to sample of languages which implicate difficulties for further analysis. The private nature of digital interact...
Revista Dígitos, 2020
En este artículo se analiza el empleo de los emojis como elemento de afiliación grupal en los pro... more En este artículo se analiza el empleo de los emojis como elemento de afiliación grupal en los procesos de activismo digital. A partir de la observación de diferentes perfiles activos en la red social Twitter y de tuits producidos por dichas cuentas, se identifica el uso de los emoji del corazón (en distintos colores) en concurrencia con diferentes hashtag como estrategias de encuadre. En este trabajo exploratorio, ilustramos nuestro estudio con la oposición que, entre el emoji del corazón verde y el emoji del corazón azul, se generó en Twitter, a partir de la remediación digital de los pañuelos de colores empleados por las y los activistas movilizados en torno a la discusión sobre la ampliación de los supuestos de la ley del aborto que se llevó a cabo en Argentina, en junio de 2018, y en otros países de Latinoamérica. De la misma forma que estos pañuelos conformaban insignias identificativas en las movilizaciones callejeras, los emojis de colores se han convertido en señas de identi...
Verba Hispanica, 2019
De acuerdo con el último informe del Instituto Cervantes (Fernández Vitores, 2018), el español co... more De acuerdo con el último informe del Instituto Cervantes (Fernández Vitores, 2018), el español constituye no solo la segunda lengua materna del mundo, sino que también representa la segunda de comunicación internacional. Además, el mismo documento afirma que, junto con el inglés, el francés y el alemán, es uno de los idiomas más estudiados como lengua segunda o extranjera. Por atra parte, el español constituye «una de las lenguas con mayor cantidad de variantes idiomáticas y normas regionales y de grupo» (Rojas Mayer, 2000: 15), dada su estandarización policéntrica (Fontanella de Weinberg, 1990). En tal sentido, el estudiante de segundas lenguas debe desarrollar sus competencias pragmáticas y comunicativas de acuerdo con la variedad del español predominante en el intercambio.
Onomázein Revista de lingüística filología y traducción, 2018
Nuestra investigación se centra en las conversaciones escritas producidas en aplicaciones de mens... more Nuestra investigación se centra en las conversaciones escritas producidas en aplicaciones de mensajería instantánea del teléfono móvil. El corpus está constituido por dos interacciones de WhatsApp de hablantes del español peninsular y del español de Argentina, recolectadas entre 2014 y 2016 a través de la técnica de participante observador y alojadas en la base de datos CoDiCE. El objetivo es analizar los mecanismos de apelación (en particular, aquellos con valor deíctico) que funcionan como organizadores de la interacción digital escrita en dos variedades del español. En tal sentido, se compara la variación intralingüística así como la relación entre la conversación escrita y la cara-a-cara, a partir de la intersección de diferentes fenómenos tales como la delimitación de los pares de adyacencia, mecanismos de coherencia y cohesión y el manejo del tiempo y la linealidad de los intercambios comunicativos.
Procedia - Social and Behavioral Sciences, 2015
Having analyzed the current situation of Spanish corpora-and the scarce representativeness of dig... more Having analyzed the current situation of Spanish corpora-and the scarce representativeness of digital communication in themand corpora from different types of interactions on digital platforms (e-mail, chats, SMSs), we noticed the need to create a repository of stable language samples aiming to solve this deficiency. Before implementing the CODICE, an open and collaborative repository of language samples from the digital discourse in Spanish, it becomes necessary to deal with the specific problems of compiling and transcribing this type of data. The present work addresses this approach aiming towards two goals: 1) establishing common standards, mainly concerning contextual and situational factors, in order to facilitate sociopragmatic analysis, and 2) developing ethical standards to ensure the anonymization of participants.
Verba Hispanica. Nuevos retos y perspectivas en la enseñanza/aprendizaje del léxico en ELE, 2019
For the acquisition and domain of the spectrum of functions that markers have, the ELE (Spanish i... more For the acquisition and domain of the spectrum of functions that markers have, the ELE (Spanish initials for Spanish as a Foreign Language) student needs to encounter the different contexts where they operate. ELE textbooks usually address markers superficially, showing univocal lexical meaning, only attending to their oral dynamic and, generally, exemplifying just with the expression bueno. This paper analyses the dynamics of some conversational markers of agreement in written digital interactions in Argentinean Spanish, from the approaches of Interactional Sociolinguistics and Sociocultural Pragmatics. In addition, we integrate the contributions of the communicative model for foreign language teaching. Our objective is twofold. On the one hand, to demonstrate the incidence of the communicative situation in the interpretation of conversational markers of agreement, whose polarity, depending on linguistic and extralinguistic factors, is both positive (marker of agreement) and negative (anger expression). On the other hand, to focus on the loanword OK – with much use in the oral interactions of ELE students – and the nuances that it acquires in the written digital interactions. Through a qualitative analysis of 20 surveys conducted in Argentina, the results indicate the relevance of addressing different occurrence contexts to comprehend the complexity of the markers.
Revista Estudios del Discurso Digital, 2019
Uploads
Papers by Lucía Cantamutto
décadas hasta convertirse en un área de trabajo completamente asentada.
Superadas las visiones dicotómicas iniciales que explicaban este objeto de estudio
como un híbrido a medio camino entre la oralidad y la escritura, las visiones actuales
caracterizan el discurso digital como un producto comunicativo con propiedades
específicas que demandan un abordaje particular. Sin embargo, para realizar estos
estudios resulta imprescindible disponer de datos procedentes corpus lingüísticos. La
165
realidad nos demuestra que, aunque la situación está en proceso de cambio,
actualmente no se dispone de muestras lingüísticas suficientemente representativas
en el ámbito del discurso digital (Cantamutto y Vela, en prensa). Esta carencia resulta
especialmente acuciante en una lengua como el español, la tercera más usada en los
intercambios digitales, en cuyos corpus generales de reciente compilación, como por
ejemplo CORPES, no se incluyen datos procedentes de interacciones mediatizadas.
En tal situación ha llevado a muchos investigadores a trabajar con corpus “escasos”
(Ling, 2005) o “fortuitos” (Campano Escudero, 2007) que no siempre conservan la
representatividad necesaria para legitimar cualquier estudio (cfr. Toruella y Llisterri,
1999).
El objetivo de esta comunicación es doble. Por un lado, revisaremos la situación de
las muestras de lengua disponibles para el estudio del discurso digital, en particular,
en lo que concierne a la lengua española. Por otro lado, llevaremos a cabo una
reflexión sobre los problemas metodológicos de recogida y fijación de datos en los
entornos comunicativos digitales así como también la posibilidad de volcar los datos
en repositorios externos. A partir de la discusión de los antecedentes encontrados,
principalmente en inglés, pero también en francés, alemán y chino (véase
Beißwenger, M., & Storrer, A., 2008). presentaremos los preliminares de un proyecto
de creación de un repositorio abierto y colaborativo de comunicaciones digitales, el
proyecto CODICE. Este corpus permitirá el avance de investigaciones sobre variación
pragmática y sociolingüística intra e interlingüística, de gran repercusión en los
estudios lingüísticos del último tiempo, en la comunicación digital.
Referencias
Beißwenger, M., & Storrer, A. (2008). 21. Corpora of Computer-Mediated Communication. In:
Anke Lüdeling & Merja Kytö (eds): Corpus Linguistics. An International Handbook. Series:
Handbücher zur Sprach- und Kommunikationswissenschaft/Handbooks of Linguistics and
Communication Science. Mouton de Gruyter, Berlin
Cantamutto, L. y Vela-Delfa, C. (2014), “Repositorio abierto de comunicaciones digitales:
hacia la construcción de un corpus para el español”, I Jornadas Nacionales de Humanidades
Digitales, Buenos Aires: AAHD
Campano Escudero, B. (2007), “Análisis lingüístico-pragmático de un corpus de mensajes
SMS” en Ferrán nº 8, nov. 2007 (págs. 185-210), en
www.educa.madrid.org/web/ies.jaimeferran.colladovillalba/revista2 (consulta: marzo 2011)
Ling, R. (2005), “The sociolinguistics of SMS: An analysis of SMS use by a random sample of
Norwegians”. In Mobile communication, Springer London, (págs. 335-349).
Torruella, J., & Llisterri, J. (1999). “Diseño de corpus textuales y orales”. Filología e
informática. Nuevas tecnologías en los estudios filológicos, Departamento de Filología
Española, Univ. Autónoma de Barcelona: Editorial Milenio (págs. 45-77)
Tras haber relevado la situación actual de los corpus sobre el español -y la escasa representatividad que en ellos tiene la comunicación digital- y de los corpus sobre diferentes tipos de interacciones en plataformas digitales (correo electrónico, chats, SMS), detectamos la necesidad de crear un respositorio de muestras estables de lengua que permita solventar esta carencia.
En el presente trabajo, ahondaremos en los aspectos metodológicos que conciernen al proyecto CODICE. Por un lado, durante la etapa de recolección de datos, se plantea como objetivo complementario la creación de unos estándares comunes, en lo que concierne principalmente a los factores contextuales y situacionales, a fin de facilitar los análisis sociopragmáticos. Por otro, para su disposición en un respositorio, se ahondará en los posibles caminos de preservación de los colaboradores. En tal sentido, se discutirá en torno a la pertinencia de ofrecer seguros suplementarios al repositorio.
Esta mesa corresponde a una continuación del trabajo conjunto que se ha venido realizando entre los participantes de la primera mesa coordinada sobre apelación en el discurso digital presentada en SOCHIL, 2015.
La coordinación de esta mesa temática ha sido posible, en parte, gracias al apoyo del Proyecto Fondecyt 1140912, dirigido por el Dr. Cristian González Arias.