Introducción al Procesamiento del Lenguaje Natural
Curso 2006/2007
Titulación | Cuatrimestre | Horario | Créditos |
---|---|---|---|
Ingeniería Técnica en Informática de Gestión | segundo | 4.5 | |
Ingeniería Técnica en Informática de Sistemas | segundo | 4.5 | |
Ingeniería Informática | segundo | 4.5 |
Profesorado | Objetivos | Temario | Metodología | Evaluación | Bibliografía | Material docente
Profesorado
Objetivos
-
El objetivo general que se plantea en la asignatura es introducir al alumno en el desarrollo de aplicaciones que manipulen textos escritos en lenguaje natural. Este objetivo general se desglosa en los siguientes objetivos concretos:
-
- Presentar a los alumnos las aplicaciones básicas ligadas al procesamiento del lenguaje natural
- Introducir el concepto de "corpus de textos" y su utilidad en la implementación de sistemas de procesamiento del lenguaje natural
- Presentar técnicas básicas de aprendizaje automático que saquen partido de la información contenida en un "corpus"
- Utilizar herramientas de libre distribución en la implementación de alguna aplicación relacionada con el procesamiento del lenguaje natural
Temario
-
Bloque 1: Aplicaciones del procesamiento del lenguaje natural
-
- Clasificación de documentos
- Recuperación y extracción de información
- Búsqueda de respuestas
- Traducción automática
-
Bloque 2: Tratamiento basado en corpus
-
- Modelos de lenguaje
- Corpus etiquetados
- Treebanks
-
Bloque 3: Herramientas
-
- Etiquetadores
- Análisis sintáctico superficial
- Aprendizaje automático
Metodología
-
La asignatura se organizará en torno a sesiones de laboratorio de tres horas. La primera hora de cada sesión se dedicará a la exposición por parte del profesor de los conceptos o herramientas con los que se trabajarán en el resto de la sesión. A partir de ahí los alumnos dispondrán de unas dos horas para desarrollar un dichas ideas en un módulo de software que podrá ser integrado en la implementación del proyecto final de curso.
Evaluación
-
Se evaluará a los alumnos mediante un trabajo de curso. Dicho trabajo se podrá realizar en grupos de dos o tres personas. Los profesores propondrán una tarea relativa al procesamiento del lenguaje natural como tema del trabajo, aunque los alumnos podrán proponer tareas alternativas que serán valoradas por los profesores antes de ser asignadas como trabajo de curso.
Bibliografía
- Baeza-Yates, Ricardo, Berthier Ribeiro-Nieto, Modern Information Retrieval, Addison-Wesley.
- Charniak, Eugene, Statistical Language Learning, MIT Press.
- Jurafsky, Daniel, James H. Martin, Speech and Language Processing. An Introduction to Natural Language Processing, Computational Linguistics, and Speech Recognition, Prentice-Hall.
- Manning, Chris, Hinrich Schütze, Foundations of Statistical Natural Language Processing, MIT Press.