El potencial discriminatorio de las secuencias de categorías gramaticales en la atribución forense de autoría de textos en español

María S. Spassova

El potencial discriminatorio de las secuencias de categorías gramaticales en la atribución forense de autoría de textos en español

Autores: María S. Spassova
Directores de la Tesis: María Teresa Turell Julià (dir. tes.)
Lectura: En la Universitat Pompeu Fabra ( España ) en 2009
Idioma: español
Tribunal Calificador de la Tesis: Enrique Bernárdez Sanchís (presid.) , Núria Bel Rafecas (secret.) , Jordi Cicres i Bosch (voc.) , Malcolm Coulthard (voc.) , Lawrence Solan (voc.)
Programa de doctorado: Doctorado en Ciencias del Lenguaje y Lingüística Aplicada
Materias:
- Matemáticas
  - Estadística
    - Análisis de datos
    - Análisis multivariante
- Lingüística
  - Lingüística aplicada
Enlaces
- Tesis en acceso abierto en: TDX
Dialnet Métricas: 9 Citas
Resumen
- El objetivo principal de esta tesis es evaluar el potencial discriminatorio de los n-gramas- esto es, combinaciones de secuencias de categorías gramaticales- como posibles marcas de autoría para los fines de la comparación forense de textos escritos en español. La tesis se centra en dos tipos específicos de n-gramas: los bigramas y los trigramas.
  
  Las principales hipótesis de la tesis son, por un lado, que los n-gramas poseen un potencial discriminatorio alto en el análisis de producciones escritas por diferentes autores (variación inter autor). Por otro lado, que la frecuencia de los n-gramas no varía de forma significativa entre las producciones escritas del mismo individuo en el transcurso del tiempo (variación intra autor).
  
  La evaluación del potencial discriminatorio de los n-gramas se ha llevado a cabo en dos corpus diferentes: a) un corpus general de la lengua española; y b) un corpus de casos forenses reales.
  
  Los resultados han indicado que los dos tipos de n-gramas tienen un potencial discriminatorio alto cuando se aplican a los dos corpus. Además, se ha demostrado que la frecuencia de los n-gramas no varía significativamente entre textos escritos producidos por el mismo autor en un intervalo temporal inferior a 20 años.

Mi Hispadoc

Selección

Opciones de tesis

Seleccionado

Opciones de compartir

Opciones de entorno

Sugerencia / Errata

Acceso de usuarios registrados

El potencial discriminatorio de las secuencias de categorías gramaticales en la atribución forense de autoría de textos en español

Mi Hispadoc

Opciones de tesis

Opciones de compartir

Opciones de entorno