Introducción Flashcards
¿Qué es el procesamiento de lenguaje natural?
Campo de las ciencias computacionales, de la inteligencia artificial y de la lingüística que estudia interacciones entre las computadoras y el lenguaje humano.
¿Qué es un fonema?
Articulación mínima de un sonido vocálico o consonántico, similar a una representación del sonido de una letra.
¿Qué es el tono?
Representación de distintos significados de una misma palabra por su tono.
¿Qué es entonación?
Sonido que cambia el sentido de una oración.
¿Qué es fonología?
Parte de la lingüística que estudia los fonemas.
¿Qué es fonos?
Forma única que tiene cada persona de articular los sonidos.
Morfología
Rama de la lingüística que se ocupa del estudio de la forma de las palabras.
Morfema
Átomo que construye las palabras
Morfemas derivativos
Prefijos, sufijos
Morfemas derivativos
Prefijos, sufijos
Morfema léxico
La raíz, éste tiene significado propio
Morfema libre
Aquel que puede ser una palabra por sí mismo
Lexicón
Todas las palabras que son comprendidas por una persona
Semántica
Estudio del significado en el lenguaje, incluyendo la relación entre palabras, frases y símbolos.
Tipos de morfemas
Ligados, derivativos, léxicos, gramaticales, cerrados.
Raíz
Morfema léxico que constituye el núcleo de la palabra.
Afijo (sufijo, prefijo)
Morfema gramatical, siempre ligado, no pertenecen a ninguna categoría lexica.
Relaciones semánticas lexicales
Significado a partir de las unidades lexicas que se rodean en oraciones.
Hiperónimo
Palabra cuyo significado está incluido en el de otras
Animal -> ( perro, vaca, gato )
Merónimos
Palabras dentro del mismo campo semántico.
Lema
Forma canónica o base de una palabra, en su forma más general y abstracta.
Lexema
Parte de la palabra que lleva el significado básico o central. Excluyendo afijos.
Homónimos
Misma pronunciación, diferente significado
Heterónimos
Diferente pronunciación, misma escritura, diferente significado
Homógrafos
Se escriben igual, pueden tener pronunciación diferente, significado diferente
Heterógrafos
Se escriben diferente, misma pronunciación, diferente significado.
Homófonos
Misma pronunciación, escritura y significado deferentes.
Normalización
Estandarización del texto para que pueda ser consumido por un sistema computacional.
Stemming
Obtención de raices, eliminando afijos
Lematización
Reducir las palabras a su forma canónica o lema
Tokenización
Dividir un texto en sus partes fundamentales (palabras, frases, símbolos)
Limpieza de texto
Eliminar elementos no relevantes en el texto (ruido, carácteres especiales, signos puntuación y palabras vacías)
Forma canónica del texto
Representación estándar o autorizada del texto