Los objetivos que se pretenden conseguir con esta acción especial son:

· Puesta en común de los resultados de investigación
· Difusión y promoción en foros nacionales e internacionales
· Colaboración para la transferencia de resultados a la sociedad
· Petición de proyectos europeos
· Coordinación de docencia

Puesta en común

Los grupos que planteamos esta acción coordinada consideramos como primer objetivo la cooperación interuniversitaria en materia de investigación. La investigación en España en Minería de Datos y Aprendizaje Automático no tiene un foro específico de puesta en común de los resultados obtenidos y proyectos futuros. La Conferencia de la Asociación Española para la Inteligencia Artificial (CAEPIA) es un foro cercano, pero además de tener el inconveniente de celebrarse cada dos años (años impares), es una reunión de propósito más general que acoge investigadores de todos los campos de la Inteligencia Artificial. Otro foro relacionado son las Jornadas de Ingeniería del Software y Bases de Datos (JISBD) de celebración anual. En estas jornadas se reúnen los investigadores españoles de la red de Bases de Datos, con los que es nuestro propósito establecer una línea de colaboración para el intercambio de conocimientos. Desde nuestro punto de vista las áreas de BD y MD a pesar de la afinidad evidente, no han tenido hasta ahora una colaboración que en determinados puntos puede resultar de interés mutuo. Nuestro propósito es conformar un foro específico de Minería de Datos que se reúna una vez al año aprovechando bien la CAEPIA, bien las JISBD.

Estas reuniones deben cumplir un doble fin: por un lado la transmisión de primera mano de las líneas de investigación que los distintos grupos tienen abiertas, con exposiciones de los resultados obtenidos y ya publicados como de los trabajos de futuro. Por otro lado, la continuación natural de esta puesta en común es la colaboración entre los distintos grupos para la cooperación investigadora en publicaciones y/o proyectos de aquellos grupos que trabajen en campos afines.

Por otro lado, consideramos interesante la existencia de contactos bilaterales entre los investigadores de los distintos nodos de la red. Estos contactos deben servir para consolidar las colaboraciones entre los integrantes de la red, preparando proyectos conjuntos, publicaciones, etc. Las visitas de uno o dos miembros de un nodo a otro es la manera más flexible y económica de llevar a cabo estos contactos que permitan un conocimiento más profundo de las líneas de investigación del nodo receptor. El objetivo de estas visitas debe ser mucho más concreto que el de las reuniones generales, y por tanto, deberá venir precedida por un trabajo previo de establecimiento de una línea de trabajo común.

Difusión y promoción en foros nacionales e internacionales

Es objetivo básico de todo grupo de investigación la difusión de sus resultados. A nivel nacional los foros más adecuados para este objetivo son básicamente dos: uno más tradicional, la Conferencia de la Asociación Española para la Inteligencia Artificial (CAEPIA) y otro foro para el que se abren nuevas perspectivas son las Jornadas de Ingeniería del Software y Bases de Datos (JISBD). La red no pretende crear una nueva conferencia o congreso español sobre Minería de Datos y Aprendizaje sino utilizar los foros ya existentes como medio de difusión. El objetivo se podría conseguir mediante la modalidad de workshops o tutoriales en el seno de las conferencias ya citadas. Sobre todo, nos parece interesante, por novedosa, la colaboración con investigadores participantes en la ya existente red temática de Bases de Datos. El establecimiento de contactos previos en las últimas JISBD celebradas en El Escorial, permite intentar un acercamiento entre estas dos comunidades de investigadores que, a pesar de la evidente relación, no tenían en España contactos a este nivel.

Respecto a los foros internacionales, es objetivo de la red además de fomentar la participación de investigadores en los principales conferencias, potenciar la actividad de éstos en los comités de programa de foros internacionales de IA o BD para aumentar la presencia de los trabajos en los tópicos de Minería de Datos y Aprendizaje entre ellos. Las conferencias europeas como PKDD, ECML y ECAI, o internacionales como ICDM, KDD, ICML, ILP e IDA, así como revistas del área, como MLJ, IDA, JMLR, KDD Explorations, JAIR, etc. son objetivos principales para la publicación de resultados.

Transferencia de resultados

En EEUU la minería de datos es una herramienta de análisis relativamente común en el mundo científico y empresarial. La existencia de numerosas herramientas comerciales en el mercado (Intelligent Miner de IBM, Clementine de SPSS, Mine Set de Silicon Graphics, Enterprise Miner de SAS, "Darwin" de Oracle, etc) da idea de esta utilización. Sin embargo, en Europa y especialmente en España, todavía existen importantes nichos de aplicación que desconocen las posibilidades de estas metodologías, de manera muy especial en las pequeñas y medianas empresas, o en la administraciones locales, autonómicas o incluso estatales, donde el uso de estas técnicas es limitado o incluso inexistente. La minería de datos es un área de investigación especialmente agradecida en cuanto a la posible inmediatez de la transferencia de resultados a la sociedad en general y al mundo empresarial en particular.
La mayoría de los grupos que son peticionarios de esta ayuda colaboran con distintas empresas en la aplicación de sus líneas de investigación. Sin embargo, a menudo sucede que las necesidades de resultados a partir de las bases de datos proporcionadas por la empresa exceden la capacidad del grupo colaborador o bien, la línea de investigación no es adecuada para esos datos. Por tanto, otro objetivo de esta red es conseguir que el acceso de los distintos componentes de la red sobre las bases de datos reales disponibles por cada grupo, produzca una sinergia positiva que posibilite unos resultados novedosos. De esta forma se favorece la aceptación definitiva por parte de las empresas nacionales de la minería de datos como una herramienta de análisis válida.

Para conseguir este objetivo, entre otras acciones se pretende formar un repositorio donde los distintos grupos españoles puedan depositar las bases de datos reales de las que dispongan, para un acceso común. Este almacén consistiría no sólo en los datos, sino en descripciones de parámetros, literatura relevante, resultados de otros grupos, y todo el material necesario para un correcto trabajo sobre la base de datos, de datos, así como enlaces a los sistemas desarrollados por los grupos de esta red o de otros sistemas gratuitos o comerciales.

Participación en proyectos europeos

En la actualidad limitar el ámbito de cualquier área de investigación a un solo país es poco competitivo. Una desventaja que suelen tener los grupos nacionales de investigación universitaria es su reducido tamaño. La minería de datos no es ajena a este problema, donde el tamaño medio puede ser una decena de investigadores. Esta condición a menudo imposibilita la participación en proyectos europeos. El VI Programa Marco de la Unión Europea estima que los proyectos europeos y las redes de excelencia estarán constituidos por cinco o seis grupos de distintas nacionalidades que implicarán a más de un centenar de investigadores como masa crítica.

Es por ello, que consideramos como tercer objetivo de esta red la constitución de un foro nacional que sirva como base de apoyo para extender el reconocimiento de la investigación española en Europa. La existencia por parte de algunos grupos de contactos previos con distintos grupos europeos ha dado lugar a la participación en algunas expresiones de interés (conocidas por sus siglas en inglés EoI), paso previo para solicitar un proyecto europeo. Así, varios de los grupos solicitantes de esta ayuda están en la EoI Discover dirigida por el profesor Stefano Cagnoni de la Universidad de Parma. El objetivo es integrar las técnicas de soft computing, machine learning y optimización a problemas complejos de ingeniería. Otras EoIs en las que se participa son la dirigida por el profesor David Corne de la Universidad de Reading, para la aplicación de las técnicas de Minería de datos a la Bioinformática, o las dedicadas a "Relational Data Mining" o "R-GOUD: "Reaching Goals Using Data: Coupling Mining, Learning, and Evolution".

Las actividades a desarrollar para conseguir este objetivo son dos: por un lado, invitar a personas de reconocido prestigio en el ámbito europeo para conocer el estado de investigación en su grupo y, por otro lado, establecer nuevos contactos que puedan fructificar en forma de colaboraciones en un futuro inmediato.

Coordinación de docencia

Como beneficio colateral, los resultados de esta red pueden repercutir directamente en la mejora de la docencia de Minería de Datos y Aprendizaje Automático de las distintas Universidades representadas. Aunque la materia afectada no es actualmente asignatura obligatoria en las distintas titulaciones de Ingeniería Informática, sí que suele estar presente en los planes de estudio como asignatura optativa o de libre configuración configuración o puede reforzarse en los cursos de postgrado en los que ya existe. Pensamos que la creación de esta red puede favorecer una mayor coordinación docente entre los distintos departamentos implicados y crear un estado de opinión que favorezca un paulatino aumento de la presencia de la materia en los futuros planes de estudio, no solo de las titulaciones de Informática, sino de estudios como Económicas y Empresariales, Matemáticas, resto de Ingenierías, etc.

Esta coordinación se hace más necesaria en los estudios de tercer ciclo. La posibilidad de intercambio de conocimientos entre los distintos grupos, se puede llevar a cabo mediante seminarios o tutoriales integrados en los estudios de doctorado de cada grupo.