Experimentos con noticias Septiempre 2008 El objetivo de este experimento es el de desarrollador un proceso para confeccionar mapas que permitan sintetizar los centros de interés de un conjunto de documentos extraidos (en este caso noticias de prensa extraidas de la web). Para ello se ha desarrollo un sistema capaz de recopilar documentos de la web, sugerir entidades y analizar las relaciones de co-ocurrencia entre un conjunto de entidades seleccionadas. Seguidamente se describe el proceso:
- Recopilar noticias (las noticias estan clasificadas en las categorias que proponen los medios: nacional, internacional, economia, etc)
- Seleccionar un conjunto de noticias (noticias de economias, noticias internacionales, noticias sobre Google, etc)
- Seleccionar un conjunto de entidades extraidas de las noticias seleccionadas
- Calcular las co-ocurrencias entre las entidades extraidas
- Filtrar la red de co-ocurrencias para obtener una visión más digerible
- Representar graficamente la red de co-ocurrencias
Colección de mapas: A la hora de interpretar los mapas hay que tener encuenta:
- Las noticias analizadas son las publicadas por diversos medios de presenta durante gran parte del més de septiembre de 2008.
- Que las redes obtenidas no forman una red social propiamente dicha pero si destacan los actores más relevantes dentro de los centros de interés y las relaciones de coocurencia que existen entre ellos.
- Se puede analizar las redes mediantes técnicas ARS y por ejemplo determinar los dirigentes más influyentes a nivel nacional o internacional, utilizando el algoritmo pagerank.
Nota: Para el desarrollo de este experimento se han utilizado TREDAR y BITUS. TREDAR es un entorno wiki para el desarrollo rápido de prototipos web y BITUS (Bits under surveillance) es un paquete que permite integrar distintas fuentes de información y extraer de ellas conocimiento (ambas herramienta están en fase de desarrollo). Para la visualización de los mapas se ha utilizado Guess.
|