Tema 2 Oade

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 29

CC-BY-NC-ND 

• PID_00143966 41 La cadena documental

depósito legal (DL)  m  Modalidad de adquisición. El depósito legal (DL) es la exigencia


impuesta por ley de depositar, en una o diversas agencias especificadas, ejemplares de las
publicaciones de todo tipo, en cualquier soporte, por cualquier procedimiento de distribu-
ción (venta, alquiler...). El DL es un sistema de adquisición propio de un reducido número de
bibliotecas, las nacionales. Los documentos susceptibles de DL son: libros, folletines, hojas
impresas, publicaciones periódicas y seriadas, partituras musicales, grabados, mapas y planos,
carteles, postales, naipes, diapositivas, producciones cinematográficas.

descartar  v  Ved expurgar.

descripción bibliográfica  f  Ved Análisis formal.

difusión selectiva de información (DSI)  f  Información que periódicamente se facilita


a los usuarios y que previamente ha sido pactada; también se facilita bajo demanda.

directorios  m  Fuentes de información o instrumento que ofrecen enlaces a recursos de


Internet seleccionados por el SID organizados en una clasificación temática. Los directorios
están realizados por un equipo humano, lo cual implica una selección de fuentes, identifica-
ción del contenido e indización más valiosa que la realizada por un robot, como en el caso
de los buscadores. Es por eso que los directorios se conocen como productos de información
de alto valor añadido.

donación  f  Modalidad de adquisición. Es la cesión gratuita de documentos. Puede venir


por parte del autor de la obra, por un particular o por la propia dinámica de la institución. Las
donaciones pueden ser definitivas o temporales. Entre las donaciones podemos distinguir
los legados y los depósitos. Los legados son donaciones provenientes de testamentos, están
formados por colecciones particulares completas o parciales. Los depósitos son donaciones
en las que la propiedad continúa siendo del donante.

expurgar  v  Evaluación crítica de la colección a partir de criterios materiales e intelectuales


que nos permitan retirar de manera temporal o definitiva una parte del fondo con el fin de
reorganizar los contenidos del SID y ofrecer un mejor servicio.

formación de usuarios  f  Conjunto de acciones que los SID llevan a cabo para ayudar
a los usuarios en su búsqueda, consistentes en la elaboración de guías de uso general, de
consulta del centro o sobre el funcionamiento de sus bases de datos.

guías de lectura  f  Recopilaciones de fuentes y recursos web sobre un tema particular.


También se conocen como exposiciones virtuales o exposiciones bibliográficas. Las confec-
cionan las bibliotecas públicas y universitarias.

instrumentos de búsqueda  m  Fuentes de información secundaria que ofrecen la refe-


rencia y el resumen del documento original. Son instrumentos los inventarios, los catálogos,
los buscadores, los directorios, los portales, las guías de lectura, los boletines de sumarios y
los boletines de nuevas adquisiciones.

intercambio  m  Modalidad de adquisición. Como su nombre indica, consiste en el inter-


cambio de material duplicado (o poco solicitado) entre dos centros.

International Standard Bibliographic Description (ISBD)  m  Normas internacio-


nalmente admitidas para la descripción en el análisis formal.

inventarios  m  Fuentes de información e instrumentos de búsqueda. Descripción global y


sistemática de las series documentales de archivo.

ISAD(G)  m  Norma internacional general de descripción archivística.

Machine Readable Catalog (MARC 21)  m  Formato que permite intercambiar registros
entre diferentes bases de datos; sus normas codifican, almacenan e intercambian datos bi-
bliográficos.

motores de búsqueda  m  Ved buscadores.

NODAC  f  Norma de Descripción Archivística de Cataluña.

Open Access  Modalidad de adquisición. Se trata de toda aquella información dispuesta de


forma gratuita y universalmente accesible vía Internet, como los repositorios institucionales,
depósitos de archivos abiertos o los recolectores.

ordenaciones altamente significativas  f  Criterio de ordenación. Se ordena a partir de


un cuadro de clasificación, de manera que los contenidos afines se colocan uno al lado del
CC-BY-NC-ND • PID_00143966 42 La cadena documental

otro. Es apropiado para SID de libre acceso, como las bibliotecas públicas y universitarias. Por
ejemplo, útil para ordenar siguiendo las clases de la CDU (Clasificación decimal universal).

ordenaciones con significado limitado  f  Criterio de ordenación. Se ordenan, por


ejemplo, por la lengua del documento, el autor, o el tema. Es la ordenación que encontramos
en librerías, bibliotecas personales o bibliotecas pequeñas.

ordenaciones no significativas  f  Criterio de ordenación. Son aquellas en las que no hay


relación con el contenido del documento. Por ejemplo, ordenar según el número asignado
a la llegada. Es una ordenación útil en SID que no den acceso libre a las estanterías, y donde
la recuperación la haga el documentalista. Apropiado para SID que tengan su colección en
el depósito y no en la sala de lectura. Es el método más usado en archivos.

portales  m  Fuentes de información o instrumento. Los portales son páginas de entrada a


un conjunto de recursos y servicios electrónicos organizados para permitir al usuario acceder
a un gran volumen de información. Un portal siempre es una página web, pero no a la
inversa: no todas las páginas web son portales.

préstamo  m   Ved préstamo interbibliotecario.

préstamo interbibliotecario  m  Entrega de un documento por un tiempo determinado


y bajo ciertas condiciones. Se presta todo tipo de documentos a excepción de los documentos
valiosos (manuscritos), ejemplares únicos de los cuales es difícil encontrar una copia, las
obras de referencia y las publicaciones periódicas.

procesamiento técnico  m  Conjunto de tareas de ordenación, almacenamiento y medidas


de conservación.

proceso documental  m   Ved cadena documental.

recepción  f  Proceso de la fase de entrada, que consta de tareas administrativas, el registro


y la preparación del material.

referencia documental  f  Producto documental que contiene todos los datos identifica-
tivos y descriptivos del documento. La referencia documental es la representación conden-
sada del documento original. Esta referencia se introduce en el catálogo y se convierte en la
herramienta que representa el documento para futuras búsquedas.

referencias bibliográficas  f  Descripción del documento primario al que se remite al


lector. En términos especializados es el documento que ha sido citado expresamente en un
trabajo de investigación y es obligatorio, ética y textualmente, hacer alusión a él.

reprografía  f  Servicio de fotocopias.

robots  m   Ved buscadores.

search engine  m   Ved buscadores.

selección  f  Proceso en el que se decide qué documentos se añaden o eliminan de la co-


lección. La selección es un proceso complejo en el que intervienen muchos factores: las ne-
cesidades del centro, las de sus usuarios, estadísticas de uso, recursos humanos y recursos
económicos.

selección negativa  f   Ved expurgar.

servicios de difusión  pl  Servicios de la fase de salida puestos a disposición de los usuarios
para hacer difusión de la colección, por ejemplo el acceso al fondo, servicios de referencia,
préstamo, reprografía y formación de usuarios.

servicios de referencia  m  Servicios que prestan los SID para orientar y ayudar al usuario
en la consulta del fondo, en la búsqueda, la localización, la selección, la identificación de las
fuentes de información y la información final.

SID  m  Servicio de información y documentación.

signatura topográfica  f  Código que identifica cada material en las salas y estanterías
del SID. Es el conjunto de números, letras y símbolos que localiza y ordena físicamente el
documento en la estantería.

salida  f  Última fase de la cadena que pone a disposición de los usuarios un conjunto de
instrumentos para la búsqueda y unos servicios de difusión.
CC-BY-NC-ND • PID_00143966 43 La cadena documental

spiders  f pl   Ved buscadores.

transferencia  f  Traslado del conjunto de documentos de la unidad administrativa que


los ha producido a un servicio de archivos con plenos derechos para su tratamiento y dis-
posición.
CC-BY-NC-ND • PID_00143966 44 La cadena documental

Bibliografía
Alberch i Fugueras, R. (1999). Gestió integral d’arxius. Barcelona: Fundació per a la Uni-
versitat Oberta de Catalunya.

Allo Manero, A. (2002). “Conservación de la colección”. En: Luisa Orera Orera (ed.). Manual
de Biblioteconomía. Madrid: Síntesis (pág. 181-200).

Asociación Española de Normalización y Certificación (1994). Referencias bibliográ-


ficas. Contenido, forma y estructura. UNE 50-104:1994. Madrid: AENOR.

Ayuso García, M.ª D. y Martínez Navarro, V. (2006). “Evaluación de calidad de fuentes


y recursos digitales: guía de buenas prácticas”. Anales de Documentación, núm. 9, pág. 17-42.

Biblioteca UOC (2005). Criteris de selecció de recursos web gratuïts. Document de treball. Bar-
celona (revisión marzo del 2006).

Borgoñós, M.ª D. (1999). Análisis de redacción de referencias y citas bibliográficas en literatura


científica, a través del estudio de la normalización bibliográfica. Tesis doctoral. Directora Celia
Chaín Navarro. Universidad de Murcia, Departamento de literatura española y teoría de la
literatura.

Carrizo Sainero, G. et al. (2000). Manual de fuentes de información. Madrid: CEGAL.

Cid Leal, P. (1999). Fonaments de llenguatges documentals. Barcelona: Fundació per la Uni-
versitat Oberta de Catalunya.

Codina, Ll. (2000). “Evaluación de recursos digitales en línea: conceptos, indicadores y


métodos”. Revista Española de Documentación Científica, vol. 23, pág. 9-44.

Fuentes, J. J. (2005). “Bibliotecas nacionales y consorcios bibliotecarios”. Jornadas sobre


bibliotecas nacionales. Las biblotecas nacionales del siglo XXI. Valencia.

García Gutiérrez, A. L. (1984). Lingüística documental. Barcelona: Mitre.

García Rodríguez, A. (2002). “Servicios de lectura en sala y préstamo”. En: Luisa Orera
Orera (ed.). Manual de Biblioteconomía. Madrid: Síntesis (pág. 247-263).

García Valenzuela, H. (2002). “El soporte de la biblioteca”. En: Luisa Orera Orera (ed.).
Manual de Biblioteconomía. Madrid: Síntesis (pág. 201-214).

ISAD(G): Norma internacional general de descripció arxivística: adoptada per la Comissió Ad Hoc
de Normes de Descripció, Suècia, 21-23 de gener de 1993: versió final aprovada pel CIA. Barcelona:
Associació d’Arxivers de Catalunya: Departament de Cultura de la Generalitat de Catalunya,
1995. ed. orig.: Ottawa: CIA, 1994. ISBN 84-605-4625-X.

López Hernández, M. A. (1996). “La selección documental”. Revista general de información


y documentación. Madrid.

Maniez, J. (1992). Los lenguajes documentales y de clasificación: concepción, construcción y utili-


zación en los sistemas documentales. Madrid: Pirámide / Fundación Germán Sánchez Ruipérez.

Melero, R.; Abad, M. F. (2008). “Revistes d’accés obert: característiques, models i


tendències”. BID Textos universitaris de biblioteconomia i documentació (juny). Barcelona.

Orera Orera, L. (2002). “La colección, formación, desarrollo y mantenimiento” En: Luisa
Orera Orera (ed.). Manual de Biblioteconomía. Madrid: Síntesis (pág. 92-112).

Pacios Lozano, R. (1995).”El control de la gestión de las adquisiciones”. Revista general de


información y documentación, vol 5, Núm. 2. Madrid.

Termens Graells, M. (2005). “Los consorcios una nueva etapa de la cooperación bibliote-
caria”. El profesional de la información (mayo-junio), vol. 14, núm. 3, pág. 166-173.

Turiel, J. (2006). “Recursos web per a les adquisicions”. BID Textos universitaris de biblioteco-
nomia i documentació, núm. 16 (juny). Barcelona.

Vall Casa, A. (2006). “Esporgar: per què, com i quan”. BID Textos universitaris de biblioteco-
nomia i documentació, núm. 16 (juny). Barcelona.
CC-BY-NC-ND • PID_00143966 45 La cadena documental

Vilchez Pardo, J. (2002). “Tratamiento y ubicación de la colección” En: Luisa Orera Orera
(ed.). Manual de Biblioteconomía. Madrid: Síntesis (pág. 113-135).
Análisis de
contenido:
resumen e
indización
Manela Juncà Campdepadrós
PID_00143964
CC-BY-NC-ND • PID_00143964 Análisis de contenido: resumen e indización

Los textos e imágenes publicados en esta obra están sujetos –excepto que se indique lo contrario– a una licencia de
Reconocimiento-NoComercial-SinObraDerivada (BY-NC-ND) v.3.0 España de Creative Commons. Podéis copiarlos,
distribuirlos y transmitirlos públicamente siempre que citéis el autor y la fuente (FUOC. Fundación para la Universitat
Oberta de Catalunya), no hagáis de ellos un uso comercial y ni obra derivada. La licencia completa se puede consultar en
http://creativecommons.org/licenses/by-nc-nd/3.0/es/legalcode.es
CC-BY-NC-ND • PID_00143964 Análisis de contenido: resumen e indización

Índice

Introducción............................................................................................... 5

Objetivos....................................................................................................... 7

1. El análisis de contenido................................................................... 9

2. El resumen........................................................................................... 11
2.1. Tipos de resúmenes ..................................................................... 14
2.2. Resumen automático ................................................................... 16

3. La indización....................................................................................... 20
3.1. Lenguaje natural y lenguaje documental ................................... 20
3.1.1. Número de términos ..................................................... 21
3.1.2. Control de las formas .................................................... 22
3.1.3. Control del significado .................................................. 22
3.1.4. Relaciones de significado de los términos ..................... 24
3.2. ¿Cómo se indiza? ........................................................................ 26
3.3. Calidad y coherencia de la indización ....................................... 31

4. Los lenguajes documentales............................................................ 33


4.1. Los términos de indización ........................................................ 33
4.2. Evolución histórica de los lenguajes documentales ................... 35
4.3. ¿Cuándo son necesarios los lenguajes documentales? ............... 39
4.4. Complementariedad de los lenguajes documentales .................. 42

5. Tipología de los lenguajes documentales.................................... 44


5.1. Naturaleza del término: codificado o natural ............................. 44
5.2. Nivel de control: libre o controlado ........................................... 45
5.3. Nivel de coordinación: precoordinado o postcoordinado .......... 46
5.4. Estructura: jerárquica o combinatoria ........................................ 48
5.5. Nivel de análisis: materias, conceptos, palabras clave ................ 50
5.6. Conclusiones ............................................................................... 52

Actividades.................................................................................................. 53

Glosario........................................................................................................ 54

Bibliografía................................................................................................. 58
CC-BY-NC-ND • PID_00143964 5 Análisis de contenido: resumen e indización

Introducción

Este módulo os introduce en los procesos documentales de la segunda fase de


la cadena documental, llamada análisis�de�contenido,�formada por el resu-
men y la indización.

Itinerario�de�estudio

El módulo empieza con un capítulo dedicado al análisis de contenido, para


situar al estudiante en las dos operaciones mencionadas, el resumen y la in-
dización.

El apartado dedicado al resumen está diseñado para responder a las preguntas


de qué es un resumen, quién lo redacta, qué utilidades tiene y cuántos tipos
de resúmenes hay. Finalmente, se presentan los resúmenes automáticos, ex-
plicando su evolución y funcionamiento.

La indización es el grueso de esta asignatura y en este módulo tiene tres apar-


tados. El primero de ellos trata de dar respuesta a las preguntas de qué es indi-
zar, quién indiza, por qué hacen falta los lenguajes documentales y cómo se
indiza. El apartado titulado “Lenguajes documentales” responde a las pregun-
tas de qué son los lenguajes, cuántos hay, qué son los términos de indización,
cómo han evolucionado, cuándo son necesarios y cuál es su uso en solitario o
combinados. El último apartado, titulado “Tipología”, trata de los diferentes
criterios usados para clasificar los lenguajes.

Este es un módulo básico para el aprendizaje de la terminología que se usará


en el resto de módulos.

Conceptos más importantes

Concepto Ved

Resumen informativo 1. El resumen


Resumen indicativo
Resumen selectivo
Resumen automático

Ambigüedad 2. La indización
Lenguaje natural
Exhaustividad
Especificidad
Traducción
Univocidad
CC-BY-NC-ND • PID_00143964 6 Análisis de contenido: resumen e indización

Concepto Ved

Lenguaje documental 4. Los lenguajes documentales


Sistemas de clasificación
Listados de encabezamientos
de materia
Listados de autoridades
Tesauros
Listados de descriptores libres
Listados de palabras clave
Notación
Encabezamiento
Descriptor
Identificador o autoridad
Palabra clave

Codificado 5. Tipología de los lenguajes documentales


Natural
Libre
Controlado
Precoordinado
Postcoordinado
Jerárquico
Combinatorio
Materias
Conceptos
Palabras clave
CC-BY-NC-ND • PID_00143964 7 Análisis de contenido: resumen e indización

Objetivos

Con el estudio de los materiales asociados a este módulo alcanzaréis los obje-
tivos siguientes:

En cuanto al resumen:

1. Aprender a hacer resúmenes de manera intelectual: resúmenes informati-


vos, indicativos y selectivos.

2. Aprender a hacer resúmenes con programas de resúmenes automáticos.

En cuanto a la indización:

1. Analizar los factores necesarios para que haya una buena comunicación
documental: entender los problemas del lenguaje natural y la función de
los lenguajes documentales dentro de esta comunicación.

2. Conocer los procesos de indización: examen del documento, selección y


traducción.

En cuanto a los lenguajes�documentales:

1. Conocer las características principales de los lenguajes documentales.

2. Conocer la evolución histórica de los lenguajes documentales.

3. Aprender a distinguir y saber utilizar la diferente tipología de los len-


guajes documentales: sintéticos-analíticos, precoordinados-postcoordina-
dos, controlados-libres, jerárquicos-combinatorios, materias-conceptos-
palabras clave.
CC-BY-NC-ND • PID_00143964 9 Análisis de contenido: resumen e indización

1. El análisis de contenido

El�análisis�de�contenido se sitúa en la segunda fase de la cadena documental


y reúne todo el conjunto de operaciones destinadas a representar la materia
de los documentos para una posterior recuperación.

Son tareas de cariz intelectual en las que la formación y la habilidad del analista
juegan un papel importante.

“Representar la materia” o “describir el contenido” es responder a la


pregunta: “¿cuál es el tema de un documento?”.

Para representar el contenido de un documento el analista tiene que llevar a


cabo dos operaciones:

1) El resumen, que condensa el contenido en un texto más breve y manejable.

2) La indización, que identifica los conceptos o temas principales. También


se conoce como descripción característica.

Estas dos operaciones admiten una elaboración humana o automática. Por lo


tanto, habrá resúmenes elaborados por documentalistas y resúmenes elabora-
dos por programas, y también indizaciones hechas por analistas e indizaciones
elaboradas por un software.

Operaciones humanas y automatizadas

Humano Automatizado

Resumen Resumen informativo Resumen automático


Resumen indicativo
Resumen selectivo

Indización Sistemas de clasificación Listado de palabras clave


Listas de encabezamientos de materia
Listados de autoridades
Tesauros
Listados de descriptores libres

Los dos sistemas tienen ventajas e inconvenientes. La calidad y coherencia


que aporta un documentalista supera en estos momentos la que ofrecen los
programas informáticos, pero en cambio los sistemas automáticos son instan-
táneos, baratos y capaces de asumir ingentes cantidades de documentos.
CC-BY-NC-ND • PID_00143964 10 Análisis de contenido: resumen e indización

La rama científica que estudia cómo emular el conocimiento humano, en Ved también
cuanto a la identificación de los conceptos y las frases con contenido relevante
Trataremos el procesamiento
para el resumen y la indización, es el procesamiento en lenguaje natural. del lenguaje natural en el su-
bapartado 2.4 y en el apartado
3.

El procesamiento en lenguaje natural (PLN1) es una rama de la inteli-


(1)
gencia artificial y de la lingüística computacional que estudia los len- PLN es la sigla de procesamiento
en lenguaje natural.
guajes que usan los humanos para interactuar con los ordenadores en
contextos escritos y orales.
Lectura complementaria

I.�Gil�Leiva;�J.�V.�Rodríguez
A modo de conclusión Muñoz (1996). “El procesa-
miento del lenguaje natural
Para representar o describir el contenido de un documento el analista tiene que llevar aplicado al análisis del con-
a cabo dos operaciones: tenido de los documentos”.
Revista general de informa-
• El resumen, que condensa el contenido en un texto más breve y manejable. ción y documentación (vol.
6, núm. 2, pág. 205-218).
• La indización, que identifica los conceptos o temas principales. También se conoce
como descripción característica.

Las dos operaciones se pueden llevar a cabo de manera humana o automática.


CC-BY-NC-ND • PID_00143964 11 Análisis de contenido: resumen e indización

2. El resumen

Ved también
Según la norma UNE 50-103-90 Preparación de resúmenes, un resumen es
la presentación abreviada y precisa de un documento, sin interpretación Encontraréis la norma UNO
50-103-90 en el espacio “Ma-
ni crítica y sin mención expresa del autor del resumen. teriales y fuentes” de las aulas.

Cuando decimos documento nos estamos refiriendo a todo tipo de documen-


to, sea cual sea su soporte material. Podemos resumir un texto, la imagen de
una fotografía, un vídeo, audios, información en línea o hipertextos.

Los resúmenes, como la indización, pueden ser de elaboración humana o au-


tomática. En el primer caso hay cuatro tipos de personas que pueden redactar
un resumen. En el caso de los resúmenes automáticos, se trata de un software.

1)�Resumen�humano:

a) El�autor del documento. Los resúmenes elaborados por los propios autores Resúmenes para revistas
son muy habituales en el mundo de las comunicaciones científicas y tecno-
Las revistas acostumbran a dar
lógicas. directrices a sus autores para
la elaboración de resúmenes.
Ved, por ejemplo, la revista EPI
b) Un especialista en la materia de la que trata el documento. en su apartado “Instrucciones
para los autores”.

c) La�editorial. Son los resúmenes que aparecen en la contraportada de los


libros impresos y que tienen una función claramente publicitaria.

d) Un profesional�de�la�documentación. Aporta su conocimiento sobre la re-


dacción de buenos resúmenes y los elabora pensando en las utilidades futuras.

2)�Resumen�automático: los programas se conocen como programas resumi- Programas resumidores


dores de textos o Automatic Text Summarizer. de textos

Un ejemplo de programas re-


La norma internacional ISO 214:1976, traducida por AENOR como norma sumidores de textos es Swe-
sum, que hace un análisis es-
UNE 50-103-90 Preparación de resúmenes, establece las directrices que se tienen tadístico del texto y elabora
el resumen con los fragmen-
que seguir para presentar los resúmenes en los documentos. Pone especial én- tos que contienen las palabras
fasis en la preparación de resúmenes por parte de los autores de los documen- más ponderadas (más repeti-
das pero con significado).
tos primarios y en la misma publicación.
CC-BY-NC-ND • PID_00143964 12 Análisis de contenido: resumen e indización

Redactar un resumen es fácil. Lo difícil es redactar un buen resumen. El punto


de inflexión es la calidad del resumen, que lo hará más o menos útil en un
sistema documental. Un resumen propagandístico no aportará muchos con-
ceptos principales para indizar, aunque haya sido un buen reclamo para las
ventas.

Ejemplo de resumen elaborado por la editorial con finalidad publicitaria

SAGAN, Carl. Cosmos. Traducció: Albert Santamaria i Martínez; pròleg: Ricard Guerrero.
Barcelona: Publicacions i Edicions de la Universitat de Barcelona: Omnis Cellula, cop.
2006.

“He aquí una de las obras más destacadas de la literatura internacional de divulgación
científica, publicada por primera vez en catalán. Una obra imprescindible de uno de los
grandes maestros de la divulgación, que nos introduce en los grandes enigmas que la
humanidad ha tratado de entender y explicar desde tiempos inmemoriales, y por los
cuales ha nacido lo que llamamos ciencia.

Desde la infinitud del Universo hasta el mundo invisible de los átomos, desde el naci-
miento de las estrellas hasta la aparición de la vida, Carl Sagan consigue transmitir los
conocimientos de la ciencia actual de una manera clara y apasionante.”

Para un analista sólo tendría utilidad el último párrafo, en qué aparecen términos como
universo, átomos, estrellas, vida.

Difundir la información
El resumen es útil en dos fases de la cadena, en los procesos de selección
y adquisición que se da en la primera fase de la cadena y en la fase Cada vez más bases de da-
tos referenciales ofrecen el re-
de salida, donde es un excelente instrumento de recuperación, ya que sumen de sus monografías y
revistas, como por ejemplo
el resumen ofrece más datos que la simple referencia documental. La Ebsco, Dialnet, Compludoc,
principal utilidad del resumen es la de difundir la información. CBUC, Eric database o ISI cu-
rrent contents connect. Tam-
bién lo hacen las bases de da-
tos de novedades editoriales,
por ejemplo la editorial Trea
En todos los casos es indudable el valor informativo que aporta el resumen (recomendamos el acceso des-
para difundir el contenido del documento de la colección. Pero además, el de la biblioteca de la UOC).

resumen tiene otras utilidades, tal como dice la norma UNE 50-103-90:

a) Determinar la pertenencia: un resumen bien elaborado capacita a los lecto-


res para identificar de forma rápida y precisa el contenido de un documento
y decidir si hay que leerlo en su totalidad.

b) Evitar la lectura del texto completo en documentos de interés secundario.


Un resumen bien elaborado proporciona suficiente información sobre temas
que no sean de interés principal para el lector. Ahorra tiempo al usuario.

c) Ayudar en la búsqueda automatizada. Los resúmenes automatizados incor-


porados en los catálogos son muy útiles para:

• Extraer términos de indización de su texto, es decir, indizar a partir del


resumen.

• Hacer búsquedas de palabras clave que no se encuentran en el título.


CC-BY-NC-ND • PID_00143964 13 Análisis de contenido: resumen e indización

• Servir de control bibliométrico, al comparar los términos usados en una


ecuación de búsqueda con los términos que aparecen en un resumen y así
establecer la pertinencia de la recuperación.

• Ayudar a la difusión desde los servicios de alerta.

Según María Pinto (1992), las características�de�un�resumen son las siguien- Lectura complementaria
tes:
Podéis ampliar la informa-
ción sobre el resumen leyen-
• Brevedad. Se tienen que omitir datos preliminares o temas del conocimien- do la obra siguiente:
M.�Pinto�Batanea (1992). El
to común.
resumen documental: principios
y métodos. Madrid: Pirámide/
Fundación Germán Sánchez
• Pertinencia. El resumen se tiene que adecuar al mensaje principal del do- Ruipérez (Biblioteca del Li-
cumento, sin obviar o interpretar los datos. bro, Y).

• Claridad y coherencia. Frases completas, dotadas de coherencia lineal y


global.

• Profundidad. Varía en función del tipo de resumen o de los diferentes ni-


veles de detalle que se persigan.

• Consistencia lingüística. Un resumen se tiene que adaptar a las pautas lin-


güísticas en uso y tiene que tener en cuenta las reglas morfológicas y sin-
tácticas correspondientes.

• Proximidad cronológica entre las ediciones del documento original y el


resumen. Es importante que el tiempo transcurrido entre la publicación
del original y el resumen no sea excesivo, especialmente en ámbitos cien-
tíficos y técnicos.

A modo de conclusión

• El resumen es la presentación abreviada y precisa de un documento, sin interpreta-


ción ni crítica y sin mención expresa del autor del resumen.

• El resumen puede ser redactado por el autor del documento, un especialista en la


materia, la editorial, un documentalista o un programa informático.

• El resumen es útil en dos fases de la cadena: en los procesos de selección y adquisición


que se da en la primera fase de la cadena y en la fase de salida, donde es un excelente
instrumento de recuperación.

• La principal utilidad del resumen es la de difundir la información, pero además, el


resumen tiene otras utilidades, como determinar la pertinencia, evitar la lectura del
texto completo en documentos marginales y ayudar a la búsqueda automatizada.

• Los resúmenes automatizados incorporados en los catálogos son muy útiles para ex-
traer términos de indización del texto, para hacer búsquedas de palabras clave que no
se encuentran en el título, para servir de control bibliométrico y ayudar a la difusión
a través de los servicios de alerta.
CC-BY-NC-ND • PID_00143964 14 Análisis de contenido: resumen e indización

2.1. Tipos de resúmenes

Hay diversos tipos de resúmenes, según el tamaño, los usuarios y la profundi-


zación en el contenido. Los tipos más habituales son los resúmenes informa-
tivos, indicativos y selectivos.

1)�Resumen�informativo

Redactaremos el tema central, temas adicionales, naturaleza y objetivo del do-


cumento, metodología, resultados, conclusiones y anexos. La idea de fondo es
que un resumen informativo puede sustituir en ocasiones la lectura del docu-
mento original. La norma UNE 50-103-90 recomienda que el esquema a seguir
sea el de:

objetivo + metodología + resultados (o conclusiones)

Sin embargo, no hay que seguir forzosamente este orden, ya que hay entornos,
como el técnico científico, donde se prefieren los resúmenes orientados a los
resultados (para que la discriminación sea más rápida).

En cuanto al tamaño del resumen, la norma da pautas pero advirtiendo que el


contenido del documento es más significativo que las pautas para determinar
la extensión del resumen. De todas maneras la norma nos sugiere:

• Monografías, informes, tesis: 500 palabras.

• Artículos de revista, capítulos de monografías: 250 palabras.

• Comunicaciones breves: 100 palabras.

Ejemplo de resumen informativo

CONSUEGRA FERNÁNDEZ, Jesús: “El Ajedrez: evolución y claves de un juego milenario”.


En Mundo antiguo. Madrid: 2002. n° 3-4, año 1, p. 60-61.

“Artículo divulgativo sobre el juego del ajedrez, estructurado según sus orígenes, anti-
güedad, expansión, variantes y simbolismo.

El origen del ajedrez es hindú y el primer representante conocido es el Ghaturanga, apa-


recido entre el 3000 y el 2000 a.C. en Sri Lanka, aunque no aparece documentado hasta
el siglo VII d.C.

Del Ghaturanga proceden en cascada las diferentes variantes del ajedrez: de la India viajó
a Persia en el siglo VI d.C., donde pasó de los 4 jugadores originales a 2 en la versión persa
Shatranj. Desde Persia se extendió hacia Occidente y hacia Oriente.

Hacia Occidente: paralela a la expansión árabe, el juego llega a la Península Ibérica du-
rante la Alta Edad Media, y desde aquí se expande al resto de Europa y al resto del mundo
en la época de las colonizaciones.

Hacia Oriente: en la China, en el s. VII d.C., el ajedrez toma la forma del ajedrez chino
Xiang qi; en el Japón, el Shogi; en Indochina, el ajedrez birmano y tailandés. Tanto en
Oriente como en Occidente, el ajedrez presenta innumerables variaciones locales.
CC-BY-NC-ND • PID_00143964 15 Análisis de contenido: resumen e indización

El tablero y las fichas parecen poseer un significado simbólico. El tablero, con la alter-
nancia de casillas blancas y negras, forma un mandala. El simbolismo de las fichas es
menos esotérico y ha ido cambiando según los tiempos: obispos, elefantes, etc.

El autor concluye que el ajedrez, además de un juego, es una herramienta educativa de


primer orden, casi una ciencia.”

Como podéis comprobar, este resumen tiene 237 palabras.

2)�Resumen�indicativo

Redactaremos sólo las ideas centrales del documento. Su lectura no puede sus-
tituir la lectura del original. Como su nombre sugiere, el resumen indicativo
presenta de forma abreviada y muy sintética el contenido o la tipología del
documento. Su extensión puede oscilar entre una frase o 4 líneas de texto.

Ejemplo de resumen indicativo

CONSUEGRA FERNÁNDEZ, Jesús: “El Ajedrez: evolución y claves de un juego milenario”.


En Mundo antiguo. Madrid: 2002. n° 3-4, año 1, p. 60-61.

“Artículo divulgativo sobre el juego del ajedrez, trata de su origen hindú, antigüedad,
expansión histórica tanto en Oriente como en Occidente, variantes nacionales y simbo-
lismo del tablero y las fichas.”

3)�Resumen�selectivo

Redactaremos sólo una parte concreta del documento. El más habitual es el


resumen de conclusiones, pero también hay otros tipos, como la reseña (re-
view), que es un análisis del documento con elementos críticos. Este tipo de
resumen se adapta muy bien a las necesidades de los usuarios, por ejemplo in-
vestigadores o técnicos que necesitan un dato muy concreto sobre el objetivo
del documento o las conclusiones a las que llega.

Ejemplo de resumen selectivo

CONSUEGRA FERNÁNDEZ, Jesús: “El Ajedrez: evolución y claves de un juego milenario”.


En Mundo antiguo. Madrid: 2002. n° 3-4, año 1, p. 60-61.

“El ajedrez, además de un juego, es una herramienta educativa de primer orden, casi una
ciencia.”

A modo de conclusión

Los resúmenes más habituales son el resumen informativo, el indicativo y el selectivo:

• El resumen�informativo consigna el tema central, temas adicionales, naturaleza y


objetivo del documento, metodología, resultados, conclusiones y anexos. La idea de
fondo es que un resumen informativo puede sustituir en ocasiones a la lectura del
documento original.

• El resumen�indicativo consigna sólo las ideas centrales del documento. Su lectura


no puede sustituir a la lectura del original.

• El resumen�selectivo consigna sólo una parte concreta del documento. El más ha-
bitual es el resumen de conclusiones, pero también hay otros tipos, como la reseña
(review).
CC-BY-NC-ND • PID_00143964 16 Análisis de contenido: resumen e indización

2.2. Resumen automático

Una de las necesidades más perentorias ante el aumento de información digi-


tal debido al crecimiento exponencial de Internet es manejar y filtrar el gran
volumen de información. Una de las soluciones aportadas por el PLN han si-
do los programas de resumen automático, que actúan sobre textos, imágenes,
webs y correo electrónico.

Los primeros en trabajar en el campo de la automatización de los resúmenes


fueron Hans Peter Luhn en el año 1958 y Edmundson en 1969, que aplicaron
técnicas como la frecuencia de las palabras, o la posición de una frase dentro
de un documento para redactar resúmenes sin intervención humana.
Hans Peter Luhn

A partir de estas primeras investigaciones se han perfeccionado muchas técni-


cas diferentes basadas en conocimiento y recursos lingüísticos (como las de
Lin y Hovy, 2002; Gotti et al., 2007) o basadas en métodos estadísticos y de
aprendizaje automático (Hirao et al., 2002; Svore, 2007) (autores citados en
Lloret et al., 2008; y Mateo et al., 2003).

Últimamente las investigaciones giran en torno al resumen multidocumento, Lecturas


es decir, resumir más de un documento (Goldstein et al., 2000; Qiu, 2007; Huo complementarias

y Chen, 2008) de contenidos afines o redundantes (autores citados en Lloret Podéis consultar los resulta-
et al., 2008; y Mateo et al., 2003). dos de las investigaciones de
estos autores en los artículos
siguientes:
Los resúmenes automáticos se conocen también como extracts. La terminolo- E.�Lloret;�O.�Ferrández;�R.
Muñoz;�M.�Palomar (2008).
gía anglosajona diferencia así los extracts y los abstracts. Los extracts son los “Integración del reconoci-
resúmenes formados a partir de la extracción de algunas frases del texto pre- miento de la impliación tex-
tual en tareas automáticas de
viamente seleccionadas por un programa, mientras que los abstracts son los resúmenes de textos”. Proce-
samiento del lenguaje natural,
resúmenes elaborados por una persona.
n°. 41, pág. 183-190.
P.�L.�Mateo;�J.�C.�González;
J.�Villena;�J.�L.�Martínez
(2003). Un sistema para resu-
La base de todas las técnicas de funcionamiento de un programa de men automático de textos en
resúmenes automático es el cómputo de la frecuencia de las palabras. castellano.

Hay diversas herramientas para hacer estos cálculos, por ejemplo WVTool. Se Ved también

trata de contar cuántas veces sale una palabra no vacía en el texto. Encontraréis una explicación
detallada sobre las palabras va-
cías en el módulo “Indización
automática y descriptores li-
bres”.
CC-BY-NC-ND • PID_00143964 17 Análisis de contenido: resumen e indización

Ejemplo de funcionamiento de un programa de resúmenes automático


(extraído de Lloret et al., 2008)

“Tropical storm Gilbert formed in the eastern Caribbean and strengthened into a hurri-
cane Saturday night. There were no reports of casualties.”

Oración 1: Tropical (2) storm (6) Gilbert (7) formed (1) in (0) the (0) eastern (1) Carib-
bean (1) and (0) strengthened (1) into (0) a (0) hurricane (7) Saturday (4)
night (2).

Oración 2: There (0) were (0) no (0) reports (1) of (0) casualties (1).

Lo primero que vemos es que las palabras vacías, es decir, las palabras que no tienen
significado (preposiciones, artículos, verbos) no se computan.

Al lado de cada palabra con significado vemos el número de veces que sale en todo el tex-
to. Se suman los valores, de manera que la oración 1 tiene 3,2 puntos y la oración 2, 0,2.
El programa seleccionará la frase 1 como más representativa para el resumen automático.

Este sistema de resumir a partir de las frases con las palabras más significativas
en el texto parece simplista pero tiene cierta justificación. Según Kupiec et al.
(1995) aproximadamente el 80% de las frases en resúmenes humanos están
copiadas literalmente o con pequeñas modificaciones del texto original.

A partir de esta base estadística se incorporan otras técnicas para dotar al pro-
grama de más conocimiento y paliar la escasa coherencia del resultado, como
puede ser, por ejemplo, la resolución de la anáfora o aplicar programas (por
ejemplo, WordNet) que proporcionen relaciones como las de sinonimia o hi-
peronimia, o mecanismos para detectar y eliminar la redundancia.

Definimos brevemente qué son las anáforas y la hiperonimia:

a) Las anáforas son la relación de referencia entre un elemento lingüístico y Anáfora


otro anterior en el discurso.
“El Salón del Hobby ha tenido
más de 60.000 visitantes este
b) Decimos que una palabra es hiperónima cuando tiene un campo significa- año. Este salón se ha converti-
do en la feria de ocio familiar
tivo que incluye otro de menor extensión. más visitada”.
En este ejemplo, la anáfora se
da en “este salón”, que hace
Los expertos consideran que la tecnología actual no tiene problemas para de- referencia al Salón del Hobby,
expresado en la frase anterior.
tectar las frases con más significado, pero sí para ordenarlas según su impor- Como se puede comprobar, si
en el resumen automático apa-
tancia. rece sólo la segunda frase, el
lector no sabrá a qué salón ha-
ce referencia.
Los programas funcionan a grandes rasgos de la siguiente manera: se copia
el texto a resumir o bien se escribe la dirección del documento. Se escoge el
tipo de documento (académico, periodístico, etc.) y el tanto por ciento de Hiperonimia
reducción del texto.
Color es un hiperónimo. Su
contrario es hipónimo: amari-
llo, naranja, verde son hipóni-
A continuación tenéis unos cuantos programas de los más conocidos: mos.
CC-BY-NC-ND • PID_00143964 18 Análisis de contenido: resumen e indización

(2)
• Connexor Podéis practicar con el programa
Swesum, que es gratuito y traduce
• Daedalus
al español.
• Extractor
• FociSum
• InTEXT (Dynamic Summarizing)
• Inxight Summarizer
• IslandInText
• K-Site de Daedalus
• Pertinence Summarizer
• Sinope Summarizer
• Summarizer
• SweSum2
• System Q
• TextAnalyst
• Trestle

El programa K-Site de Daedalus

De entre los programas de resumen automático mencionados, veamos el funcionamiento


del programa K-Site de Daedalus. Este programa tiene cinco módulos:

• Módulo�1:�Análisis�morfosintáctico. En este módulo se determina la categoría léxi-


ca de cada palabra: sustantivo, verbo, adjetivo, artículo, preposición, etc. También se
determina el lema. Estas operaciones permiten distinguir las palabras con significado
(sustantivos, adjetivos, verbos) de las vacías (artículos, preposiciones, pronombres,
etc.). El lema permite agrupar todas las palabras que son flexiones de otra (info/in-
formar/información/informador/informacional/etc.). El producto final es un listado
con las palabras puntuadas y un listado de frases candidatas.

• Módulo�2:�Ponderación�de�frases. Este módulo recibe las palabras etiquetadas por


el módulo anterior, y su función es escoger entre todas las frases candidatas. Para
hacerlo se ayuda de diversos submódulos que ponderan las frases según los paráme-
tros siguientes: la frecuencia, la presencia de palabras indicativas (buscan palabras
como importante, esencial, conclusiones, etc.), buscan frases que contengan palabras
que aparezcan en el título, o que tengan nombres propios, o que la tipografía sea
destacada (negritas, cursivas, tamaño superior, etc.) y seleccionan frases que aparez-
can en posiciones destacadas en el texto (al principio de cada párrafo, al final a modo
de conclusión).

• Módulo�3:�Detección�de�anáforas. Una vez tiene las frases seleccionadas, puede ser


que se dé el caso de anáforas mal resueltas (una frase contiene una anáfora que se
encontraba en la frase previa y que no ha sido seleccionada). El programa busca las
anáforas (especialmente los demostrativos pronominales o pronombres personales,
por ejemplo este, aquel, lo que, eso) y su posición en la frase: al principio, entre las seis
primeras palabras, en otras posiciones.

• Módulo�4:�Selección�de�frases. Este módulo computa toda la información recogida


en las fases anteriores: frases candidatas, puntuaciones, detección de anáforas. Selec-
ciona las frases candidatas de puntuación más alta hasta llegar al tanto por ciento
pedido por el usuario. Si entre estas frases hay alguna que contenga una anáfora, se
selecciona la frase anterior (que contiene la palabra a la cual se está haciendo referen-
cia) siempre y cuando forme parte de las frases candidatas y no sobrepase la longitud
del resumen.

• Módulo�5:�Postprocesado�del�extracto. Su función es detectar expresiones que co-


nectan partes del texto, ya sea para mostrar causalidad, contraposición, etc. Son ex-
presiones del tipo por lo tanto, en contra, etc. Como en el caso de las anáforas, si for-
man parte de una frase seleccionada, se procura incluir en el resumen la frase con la
cual están relacionadas.
CC-BY-NC-ND • PID_00143964 19 Análisis de contenido: resumen e indización

Por último, debemos recordar que algunos procesadores de textos, como Mi-
crosoft Word, también ofrecen esta opción (Autosummarize o Auto-resumen).

A modo de conclusión

• Los resúmenes automáticos (extracts) son una de las soluciones aportadas por el PLN
para hacer frente al manejo de grandes volúmenes de información en línea.

• Los primeros en trabajar en el campo de la automatización de los resúmenes fueron


Hans Peter Luhn en el año 1958 y Edmundson en 1969.

• Las técnicas han evolucionado de los primeros cómputos sobre la frecuencia de las
palabras, o la posición de una frase dentro de un documento, a las técnicas basadas
en conocimiento y recursos lingüísticos o en métodos estadísticos y de aprendizaje
automático.

• La base de todas las técnicas es el cómputo de la frecuencia de las palabras. A partir


de esta base estadística, se incorporan otras técnicas para dotar al programa de más
conocimiento y paliar la escasa coherencia del resultado, por ejemplo la resolución de
la anáfora o se aplican programas que proporcionen relaciones como las de sinonimia
o hiperonimia o mecanismos para detectar y eliminar la redundancia.

• Los expertos consideran que la tecnología actual no tiene problemas para detectar las
frases con más significado, pero sí para ordenarlas según su importancia.
CC-BY-NC-ND • PID_00143964 20 Análisis de contenido: resumen e indización

3. La indización

“Indizar es la acción de describir o identificar un documento con relación a su conteni-


do.”

Norma UNE 50-121-91.

Indizar es el resultado de examinar el documento, seleccionar los con-


ceptos y almacenarlos en una base de datos.

Esta definición implica tres acciones, de las cuales la más significativa es la


selección de los conceptos y su traducción al lenguaje documental.

Al igual que se ha tratado en el resumen, la indización la puede realizar una Ved también
persona o un programa.
La indización se estudia en los
módulos “Sistemas de clasifi-
Si la indización es intelectual, es decir, la llevan a cabo personas, estas personas cación documentales”, “Listas
de encabezamientos y listados
pueden ser: de autoridades”, “Los tesau-
ros” y “Listado de descriptores
libres y listado de palabras cla-
• Profesionales (documentalistas), que llevan a cabo la tarea de indización ve”.

de manera individual o en equipo. A su vez, los equipos pueden indizar


de manera centralizada o coordinada. Ved también

La forma de indizar de los


• Amateurs (usuarios de Internet que indizan de manera social o tagging equipos se trata en el apartado
–por ejemplo, en Delicious–). 5 del módulo “La cadena do-
cumental” de esta asignatura.

El elemento humano permite un análisis más rico del documento, captando


conceptos y matices que un programa no llegaría a detectar, pero tiene el in-
conveniente del tiempo que se tiene que dedicar y la coherencia entre indi-
zadores.

La indización automática se realiza a través de un programa informático. Su Ved también


funcionamiento es muy sencillo: extrae del título, resumen o texto completo
La indización automática se es-
las palabras más significativas. Es un método económico y muy rápido. tudia en el módulo “Listado de
descriptores libres y listado de
palabras clave”.
3.1. Lenguaje natural y lenguaje documental

Para indizar necesitamos los lenguajes documentales. ¿Qué diferencia hay en-
tre el lenguaje natural y el documental?
CC-BY-NC-ND • PID_00143964 21 Análisis de contenido: resumen e indización

Por lenguaje�natural entendemos el lenguaje que usamos de forma co-


tidiana: catalán, castellano, vasco, gallego, francés, etc.

Por lenguaje�documental entendemos el listado o vocabulario de tér-


minos que usamos para indizar y que puede estar en formato libre o
controlado.

¿Y por qué hay que controlar los términos del lenguaje natural? Porque el len- La riqueza del lenguaje
guaje natural es ambiguo, los conceptos se pueden representar de formas di- natural

versas, dando lugar a problemas de recuperación. El lenguaje natural es rico en • Ejemplos de sinónimos del
terminología, en formas (plurales y singulares), tiempos verbales, acrónimos, mismo concepto: Cosmos
/ Universo / Infinito / Firma-
sinónimos, polisemias, etc. mento / Cielo.
• Ejemplo del mismo concep-
to en formas diferentes, si-
La principal diferencia entre el lenguaje natural y el documental controlado es glas o frases, y en idiomas
diferentes: OTAN / NATO /
precisamente el control terminológico, que permite representar los conceptos Organització del Tractat de
l’Atlàntic Nord / Organiza-
de forma unívoca, sin ambigüedades. ción del Tratado del Atlán-
tico Norte / North Atlantic
Treaty Organization.
Para ser más concretos, las diferencias se dan en el número de términos del • Ejemplo de polisemia: Ban-
co / Planta / Carta / Sierra /
vocabulario, el control de las formas, el control del significado y las relaciones Estrella / Lengua / Capital.
de significado entre términos.

Univocidad
3.1.1. Número de términos
La univocidad consiste en re-
presentar un concepto con un
único término.
Los lenguajes documentales son entrópicos (Blanca Gil, 2004, pág. 20),
es decir, tienden a la selección, a la restricción del vocabulario. Es el
proceso contrario del lenguaje natural, que tiende a la abundancia, a la
reiteración de conceptos, a la sinonimia en beneficio de una expresión
más rica.

Los lenguajes documentales reducen considerablemente el número de térmi-


nos del lenguaje natural, ya que sólo tienen en consideración los sustantivos
y algunos sintagmas nominales, pero no adjetivos, preposiciones, conjuncio-
nes, adverbios, verbos, etc. Además, entre todos los sustantivos, escogen uno
que representará al resto cuando el significado sea el mismo. Y entre diversas
formas aceptadas por el mismo término, sólo una será la aceptada, como es
el caso de las siglas.

Los lenguajes documentales son en esencia sencillos, su eficacia aumenta a


medida que las reiteraciones y la redundancia son controladas en una única
forma que reúne conceptos afines.
CC-BY-NC-ND • PID_00143964 22 Análisis de contenido: resumen e indización

3.1.2. Control de las formas

Los lenguajes documentales controlan las formas plural/singular, el uso


de acrónimos y siglas y la construcción de las frases, y de esta manera
establecen unos modelos.

Ejemplo

Modelo Ejemplo

Sustantivo Pintura

Sustantivo + adjetivo Pintura medieval

Sustantivo + preposición + sustantivo Pintores de vitrales

Estas reglas gramaticales y sintácticas unifican las palabras seleccionadas y las Ved también
frases.
Los mejores ejemplos se ven
en los módulos “Listas de en-
Ejemplos en las listas de encabezamientos de materia cabezamientos y listados de
autoridades” y “Los tesauros”.
• Se acostumbra a usar el singular para expresar conceptos abstractos. Así, por ejemplo,
es solidaridad y no solidaridades.
(3)
SID es la sigla de servicio de infor-
• No se permite el uso de siglas; se prefiere la expresión entera del concepto y en la
3
mación y documentación.
lengua del servicio de información y documentación (SID ). Por ejemplo, Organiza-
ción del Tratado del Atlántico Norte.

• Es preferible la expresión natural del concepto compuesto, y no su forma inversa. Es


correcto Objetos de arte, y no Arte, objetos de.

3.1.3. Control del significado

Los problemas más importantes en cuanto al significado son la sinonimia y


la polisemia.

a)�Sinonimia: decimos que las palabras son sinónimas cuando tienen el mis-
mo significado. En un sistema documental, si no se controlan y se usan indis-
criminadamente, comportan silencio documental. En el caso de “alimento,
nutriente, comida, provisión”, el usuario puede estar buscando por “alimento”
y no recuperar documentos porque se encuentran indizados con otras formas,
como “nutriente”. La solución de los lenguajes controlados es recoger todos
los términos sinónimos y seleccionar uno para representar a todo el conjunto
de términos que tienen el mismo significado, porque dos sinónimos son sus-
tituibles el uno por el otro en cualquier contexto.
CC-BY-NC-ND • PID_00143964 23 Análisis de contenido: resumen e indización

Ejemplo (4)
A partir de ahora denotamos ser-
vicios de información y documenta-
Una lista de encabezamientos de materia como la del Consejo Superior de Investigaciones ción con la sigla SID.
Científicas (CSIC) recoge todos estos sinónimos:

• Hispanoamericanos.
• Iberoamericanos.
• Latinoamericanos.
• Sudamericanos.

Pero sólo da como término aceptado “Latinoamericanos”. Si al SID4 llegara un documen-


to titulado “Los sudamericanos del siglo XX”, el analista lo indizaría como Latinoameri-
canos, ya que es el término aceptado.

b)�Polisemia: decimos que dos palabras son polisémicas cuando el mismo sig-
no lingüístico, palabra o sonido tiene más de un significado. Habitualmente el
contexto de la conversación o lectura donde está insertada la palabra deshace
los problemas de ambigüedad, pero una palabra polisémica introducida en un
sistema documental, sin el contexto, puede dar lugar a ruido documental.

Ejemplo

Un usuario puede estar buscando sobre columnas en arquitectura y recuperar datos sobre
columnas tipográficas de diarios. Los lenguajes documentales controlan la polisemia di-
ferenciando cada significado con paréntesis, usando el plural o el singular, adjetivando,
etc.

Un tipo de polisemia es la homonimia. La diferencia entre ellas radica en la


etimología de la palabra. Si la etimología de las dos palabras es la misma, ha-
blamos de polisemia; si la etimología es diferente, hablamos de homonimia.

Ejemplos de polisemia y homonimia

Misma�etimología�=�polisemia

La polisemia se da cuando una palabra tiene un único origen etimológico y acaba te-
niendo significados diferentes sin cambiar su categoría gramatical: por ejemplo, no pasa
de sustantivo a verbo, como pasa en castellano entre el vino (bebida) y el vino (verbo
venir). Es una palabra que con el tiempo ha ido adquiriendo diferentes significados, pero
aun así, todos guardan entre sí una relación de significado; por ejemplo, en catalán y
castellano fulla/hoja, que viene del latín folia, tiene diversos significados, como hoja de
una planta, hoja de metal de una herramienta, página de un libro, cada una de las partes
de una puerta doble o ventana, etc. Y en todos los significados lleva implícita la idea de
una lámina.

Si queremos saber si una palabra es gramaticalmente polisémico, basta con consultar un


diccionario etimológico y ver si proviene de un mismo origen. Encontraremos la palabra,
un único origen y una lista de diferentes significados. En castellano podemos consultar
el Diccionario de la Real Academia.

Más ejemplos de polisemia:

• Servicio, del latín servitium, que ha dado lugar a oficios religiosos, lavabos, misiones
militares, cubiertos para comer y, en deportes, poner la pelota en juego. Y en todos
ellos permanece la idea de ser útil.

• Crucero, del latín crux, significando ‘cruz’, intersección entre las dos naves de una
iglesia, encargado de llevar la cruz a la cabeza de una procesión, viaje de placer por
el mar, etc. En estos significados la idea es la de la forma de cruz, el cruzar como ir
de un extremo a otro.

• Columna, del latín columna, que usamos para referirnos a los pilares arquitectónicos,
las partes verticales de una página impresa de un diario, en física la forma que adoptan

También podría gustarte

pFad - Phonifier reborn

Pfad - The Proxy pFad of © 2024 Garber Painting. All rights reserved.

Note: This service is not intended for secure transactions such as banking, social media, email, or purchasing. Use at your own risk. We assume no liability whatsoever for broken pages.


Alternative Proxies:

Alternative Proxy

pFad Proxy

pFad v3 Proxy

pFad v4 Proxy