Text mining y Web mining Flashcards
Que es text mining?
La mineria de texto consiste en analizar grandes volumenes de texto e identificar relaciones y modelos en la informacion. La diferencia con la mineria de datos es que esta lo hace en informacion no cuantitava.
Cuales son los beneficios de text mining?
- Conocer el significado de un texto sin la necesidad de leer el texto completo.
- Poder leer resumenes exactos de los textos.
- Navegar eficientemente en grades bases con textos no estructuradas.
- Realizar una recuperacion efectiva de datos en el idioma original.
Cuales son las etapas del text mining?
La metodologia consta de dos etapas:
Preprocesamiento donde los textos se transforman a un tipo de representacion esctructurada mas sencilla de utilizar.
Descubrimiento: donde se analizan las representaciones para descubrir patrones.
Que es web mining?
Se utilizan las tecnicas de data mining -> para obtener conocimiento -> de la informacion disponible en internet.
Cuales son las 3 clases de web mining?
1. Web content
Text mining sobre el texto plano
Hipertext mining: sobre los enlaces
Markup mining sobre documentos semi-estructurados
Multimedia mining: sobre imagenes, audios y video
2. Web structure
Sobre la topologia de los enlaces (que sea facil de navegar)
3. Web usages
Sobre los habitos de los usuarios.
Ventajas y desventajas de Web Mining?
Ventajas
* Mejora la performance del server
* Permite optimizar la navegabilidad
* Descubrir potenciales clientes
* Identificar horas pico de acceso para colocar publicidades estrategias
Desventajas
* No forma exacta de determinar el inicio y fin de sesion de un usuario
* No se tiene informacion sobre el acceso a paginas almacenadas en la cache
* La informacion registrada puede ser ambigua si hay un cambio de nombre de servidores.