Conferenciantes invitados

De SEPLN 2007

  • Dr. D. Antal van den Bosch (Tilburg University) [1]

Reconocido investigador del área del aprendizaje automático y las tecnologías del lenguaje. Sus principales intereses se concentran en el aprendizaje basado en memoria, la relación entre el lenguaje escrito y el hablado, la minería de textos y el lenguaje holandés.

La charla que dará se titulo Explicit versus Implicit Computational Linguistics.

Abstract:

Most real-world natural language processing applications involve the mapping of surface strings to other surface strings. Much of computational linguistics, however, is focused on mapping surface strings to abstract representations such as syntactic or semantic analyses. In this talk I highlight the rift between the two belief systems in computational linguistics: the "explicit" system claiming that abstract representations are vital, and the "implicit" system that tries to prove the exact opposite. I defend the sometimes badly understood position of the implicit side.




  • Dr. D. Anselmo Peñas (UNED)[2]

Investigador en el área del Procesamiento del Lenguaje Natural. Ha participado en el proyecto WordNet en español que consiste en la construcción de un gran recurso léxico-semántico. Otros temas de su interés son la recuperación de información (incluída la recuperación de información multilingüe), los sistemas de acceso interactivo a la información, la evaluación de sistemas de respuesta a preguntas y la implicación textual.

Validación de Respuestas: Evaluación y Retos para las Tecnologías del Lenguaje

Resumen: En primer lugar se abordará la reformulación de la tarea de validación de respuestas de un sistema de pregunta-respuesta (Question Answering) en términos de Implicación Textual (Textual Entailment). A partir de ahí, se recorrerán los problemas que plantea la definición de una marco adecuado de evaluación que permita cuantificar el avance en la investigación. Se presentará la metodología de evaluación y los resultados obtenidos en el marco del Answer Validation Exercise 2006 y 2007 dentro del Cross-Language Evaluation Forum. Finalmente, se discutirán los retos, oportunidades y problemas abiertos que se presentan en la aplicación de las tecnologías del lenguaje para la resolución de esta tarea.




  • Dr. D. Ralf Steinberger (Joint Research Centre) [3]

Ralf Steinberger pertenece al Joint Research Centre de Ispra (JRC), Italia, desde 1998. Él y su equipo se dedican a las aplicaciones basadas en el análisis de textos multilingüe que proporcionan accesos a la información entre lenguas. El conjunto de herramientas de JRC incluye software para múltiples tareas del PLN: Named Entity Recognition, event scenario template filling, quotation detection, clustering, clasificación, visualización y generación automática de redes sociales basadas en noticias (ver http://langtech.jrc.it/).

Dentro de las Jornadas de la Red Temática en Tratamiento de la Información Multilingüe y Multimodal, Ralf Steinberger dará una charla titulada Multilingual and cross-lingual topic detection and tracking:

Abstract: The speaker will present the multilingual news aggregation and analysis system NewsExplorer and will focus on two prominent functionalities of the fully-automatic online application: (1) multilingual topic detection and tracking (TDT) and (2) cross-lingual topic tracking. While there are known solutions to the linking of historically related news in the same language (topic tracking), the state-of-the-art in linking related documents across languages is restricted to using bilingual approaches (such as using Machine Translation, bilingual dictionaries or bilingual vector space representations). When trying to link news across many languages, these bilingual approaches are not practical as the number of language pairs for n languages is (n2-n)/2. In NewsExplorer, an alternative approach has therefore been developed that makes use of monolingual analysis steps to produce a (nearly) language-independent content representation. This abstract representation allows to link related news across many languages in a quick and easy manner. In NewsExplorer, which to date analyses 19 languages, cross-lingual topic tracking is currently implemented and carried out daily for 10 languages (45 language pairs). The speaker will explain the underlying technology and demonstrate the system live. NewsExplorer, which is publicly accessible at http://press.jrc.it/NewsExplorer, is a product of the Europe Media Monitor (EMM) family of applications, which furthermore include NewsBrief (http://press.jrc.it/) and the Medical Information System MedISys (http://medusa.jrc.it).

Herramientas personales