Grupo de Investigación Itálica

Descripción

Descripción del grupo de investigación Itálica

Miembros

Directorio de los miembros del grupo de investigación Itálica

Publicaciones

Publicaciones en revistas y congresos científicos

Proyectos

Proyectos de investigación desarrollados recientemente por el grupo

Tesis

Tesis doctorales leídas recientemente en el grupo

Descripción del grupo

El grupo de investigación ITÁLICA está englobado dentro del grupo Sistemas Informáticos TIC-134 (del Plan Andaluz de Investigación de la Junta de Andalucía), y centra su investigación en el Procesamiento del Lenguaje Natural, con especial énfasis en el análisis de redes sociales y la minería de opiniones. También abarcan sus trabajos distintos acercamientos a datos de naturaleza no textual, con el factor común de la aplicación de técnicas de aprendizaje automático y minería de datos.

En el campo de la minería de opiniones, se han desarrollado sistemas que permiten obtener las opiniones expresadas en un texto sobre las características de una determinada entidad. Las características de cada tipo de entidad están recogidas en una taxonomía, lo que permite la agregación de resultados para el cálculo de indicadores e informes. La aproximación seguida da una gran importancia a la adaptación a nuevos dominios de aplicación con el menor coste posible, lo que la hace especialmente interesante desde el punto de vista de la transferencia tecnológica. Estos sistemas han sido utilizados por la empresa ITelligent S.L. en el marco de varios proyectos de transferencia en los últimos años.

En el apartado del análisis de redes sociales, se han desarrollado diversos algoritmos de análisis de grafos para determinar indicadores de interés de los usuarios o elementos de la red. En concreto se han aplicado distintas variantes de algoritmos random-walk para la identificación de la relevancia y reputación de usuarios de una red, así como para la detección de spam. Esta experiencia previa ha dado lugar a una serie de trabajos y publicaciones en distintas temáticas y problemáticas como son el resumen de opiniones, extracción de información, minería de datos basada en grafos, generación asistida de recursos lingüísticos, procesamiento del lenguaje natural basado en grafos, extracción de opiniones, combinación de sistemas de aprendizaje, generación de recursos para el análisis de opinión, algoritmos de ranking basados en grafos, detección de spam y análisis de reputación en redes sociales.

Los miembros del grupo tienen un alto número de publicaciones de impacto y han participado con regularidad en comités de organización y de programa de varios congresos nacionales e internacionales del área. Los miembros del equipo también han participado en varios proyectos de transferencia tecnológica con empresa, y algunos de sus resultados de investigación están siendo explotados comercialmente en la actualidad. Todo lo expuesto anteriormente garantiza la capacidad del grupo para acometer el proyecto objeto de esta memoria.

Miembros

  • José Antonio Troyano Jiménez
    • e-mail: troyano{at}us{dot}es
    • Webpage
  • Fermín L. Cruz Mata
    • e-mail: fcruz{at}us{dot}es
    • Webpage
  • Fernando Enríquez de Salamanca Ros
    • e-mail: fenros{at}us{dot}es
    • Webpage
  • Carlos A. García Vallejo
    • e-mail: vallejo{at}us{dot}es
    • Webpage
  • Francisco Javier Ortega Rodríguez
    • e-mail: javierortega{at}us{dot}es
    • Webpage
  • Víctor J. Díaz Madrigal
    • e-mail: vjdiaz{at}us{dot}es
    • Webpage
  • Vicente Carrillo Montero
    • e-mail: carrillo{at}us{dot}es
    • Webpage
  • Francisco José Galán Morillo
    • e-mail: galanm{at}us{dot}es
    • Webpage
  • José Miguel Cañate Valdeón
    • e-mail: jmcv{at}us{dot}es
    • Webpage
  • Luisa María Romero Moreno
    • e-mail: mariaro{at}us{dot}es
    • Webpage

Proyectos

Proyecto: ANALISIS DE CONTENIDOS GENERADOS POR USUARIOS

Código: TIN2012-38536-C03-02

Financiado por: SUBPROGRAMA DE PROYECTOS DE INVESTIGACIÓN FUNDAMENTAL NO ORIENTADA. CONVOCATORIA 2012

Ámbito: nacional

Período: 2013-2015

Proyecto: AORESCU: Análisis de Opinión en REdes Sociales y Contenidos generados por Usuarios

Código: TIC 07684

Financiado por: Junta de Andalucía. Proyecto de Excelencia

Ámbito: autonómico

Período: 2013-2016

Proyecto: DOCUS: Destilado de Opiniones desde Contenidos generados por Usuarios

Código: TIN2011-14726-E

Financiado por: Ministerio de Ciencia e Innovación. Acciones Complementarias

Ámbito: nacional

Período: 2012-2015

Proyecto: TÉCNICAS INDUCTIVAS Y DEDUCTIVAS PARA LA EXTRACCIÓN DE INFORMACIÓN

Código: HUM2007-66607-C04-04

Financiado por: PROGRAMA DEL PLAN NACIONAL I+D, MINISTERIO DE CIENCIA Y TECNOLOGÍA

Ámbito: nacional

Período: 2007-2010

Tesis Doctorales

Título: Análisis de Contenidos Generados por Usuarios mediante la Integración de Información Estructurada y No Estructurada

Autor: Juan Manuel Cotelo Moya

Director: José A. Troyano, Fermín Cruz Mata

Fecha de lectura: 03/09/2015

Título: Detection of Dishonest Behaviors in On-line Networks Using Graph-based Ranking Techniques

Autor: Francisco Javier Ortega Rodríguez

Director: José A. Troyano

Fecha de lectura: 30/03/2012

Título: Selección de instancias y atributos en conjuntos de datos mediante algoritmos sobre grafos

Autor: Carlos A. García-Vallejo

Director: José A. Troyano

Fecha de lectura: 28/09/2012

Título: Combinación de Sistemas mediante Aprendizaje Automático en Tareas de Procesamiento de Lenguaje Natural

Autor: Fernando Enríquez de Salamanca-Ros

Director: José A. Troyano

Fecha de lectura: 14/07/2011

Título: Extracción de Opiniones sobre Características: Un Enfoque Práctico Adaptable al Dominio

Autor: Fermín Cruz Mata

Director: José A. Troyano

Fecha de lectura: 04/10/2011

Publicaciones

2015

Hassan Saif, F. Javier Ortega, Miriam Fernández, Iván Cantador. "Sentiment Analysis in Social Streams". Chapter to appear. Link.

JA Troyano, LA Ureña, M Maña, F Cruz, F Enríquez. “AORESCU: análisis de opinión en redes sociales y contenidos generados por usuarios”, Procesamiento del Lenguaje Natural 55, 153-156

E. Martínez-Cámara, FL Cruz, MD Molina-González, MT Martín-Valdivia, F.J. Ortega, L.A. Ureña-López. ”Improving Spanish Polarity Classification Combining Different Linguistic Resources”, Natural Language Processing and Information Systems 2015, 234-245

M Franco-Salvador, FL Cruz, JA Troyano, P Rosso. “Cross-domain Polarity Classification using a Knowledge-enhanced Meta-classifier”, Knowledge-Based Systems (2015)

J.M. Cotelo, F.L. Cruz, J.A. Troyano, F. Javier Ortega. "A modular approach for lexical normalization applied to Spanish tweets". Expert Systems with Applications, Volume 42, Issue 10, 15 June 2015, Pages 4743-4754, ISSN 0957-4174, Link

F. Javier Ortega, José A. Troyano, Fermín L. Cruz, Fernando Enríquez. "Enriching User Reviews Through An Opinion Extraction System". Procesamiento del Lenguaje Natural, [S.l.], v. 55, p. 119-126, sep. 2015. ISSN 1989-7553. Disponible en: Link

Juan M. Cotelo, Fermín Cruz, F. Javier Ortega, José A. Troyano. "Explorando Twitter mediante la Integración de Información Estructurada y No Estructurada". Procesamiento del Lenguaje Natural, [S.l.], v. 55, p. 75-82, sep. 2015. ISSN 1989-7553. Disponible en: Link

2014

JM Cotelo, FL Cruz, JA Troyano. “Dynamic topic‐related tweet retrieval”, Journal of the Association for Information Science and Technology,65(3), 513-523

Fermín L. Cruz, José A. Troyano, Beatriz Pontes, F. Javier Ortega. "ML-SentiCon: Un lexicón multilingüe de polaridades semánticas a nivel de lemas". Procesamiento del Lenguaje Natural, [S.l.], v. 53, p. 113-120, sep. 2014. ISSN 1989-7553. Disponible en: Link

Fermín L. Cruz, José A. Troyano, Beatriz Pontes, F. Javier Ortega. "Building layered, multilingual sentiment lexicons at synset and lemma levels". Expert Systems with Applications, Volume 41, Issue 13, 1 October 2014, Pages 5984-5994, ISSN 0957-4174, Link

2013

JM Cotelo, FL Cruz, JA Troyano. “Resource-based lexical approach to TWEET-NORM task”, Tweet-Norm@SEPLN 2013, 20-24

FL Cruz, R Haro R., FJ Ortega. “ITALICA at PAN 2013: An Ensemble Learning Approach to Author Profiling”, PAN at CLEF 2013

F. Javier Ortega. “Detection of Dishonest Behaviors in On-Line Networks Using Graph-based Ranking Techniques”. Colección de Monografías de la Sociedad Española para el Procesamiento del Lenguaje Natural. Número 12. ISBN: 978-84-616-5169-6. Editores: L. Alfonso Ureña y Emilio Sanchís. Disponible en: Link

Fermín L. Cruz; José A. Troyano; Fernando Enríquez; F. Javier Ortega; Carlos G. Vallejo. “‘Long autonomy or long delay?’ The importance of domain in opinion mining”. Expert Systems with Applications. Volume 40, Issue 8, 15 June 2013, Pages 3174–3184. ISSN 0957-4174. DOI: http://dx.doi.org/10.1016/j.eswa.2012.12.031

F. Javier Ortega. “Detection of Dishonest Behaviors in On-Line Networks Using Graph-based Ranking Techniques”. AI Communications. IOS Press. ISSN: 0921-7126 (Print) and 1875-8452 (Online) Volume 26, Number 3 / 2013. Pages 327-329. DOI: 10.3233/AIC-130564

2012

FL Cruz. “Feature-based opinion extraction: A practical, domain-adaptable approach”, AI Communications 25 (4), 369-371

JM Cotelo, FL Cruz, JA Troyano. “Generación adaptativa de consultas para la recuperación temática de tweets”, Procesamiento del lenguaje natural 48, 57-64

FL Cruz, CG Vallejo, JA Troyano. “PolarityRank: Finding an equilibrium between followers and contraries in a network”, Information Processing & Management 48 (2), 271-282

F. Javier Ortega; José A. Troyano; Fermín L. Cruz; Carlos G. Vallejo; Fernando Enríquez. “Propagation of Trust and Distrust for the Detection of Trolls in a Social Network”. Computer Networks. DOI: http://dx.doi.org/10.1016/j.comnet.2012.05.002

Fernando Enríquez; Fermín L. Cruz; F. Javier Ortega; Carlos G. Vallejo; José A. Troyano. “A Comparative Study of Classifier Combination Applied to NLP Tasks”. Information Fusion. ISSN 1566-2535. DOI: http://dx.doi.org/10.1016/j.inffus.2012.05.001

2011

F. Javier Ortega; José A. Troyano; Francisco J. Galán; Carlos G. Vallejo; Fermín L. Cruz. “STR:   A Graph-based Tagging Technique“. International Journal on Artificial Intelligence Tools. Vol. 20, No. 5. 2011. ISSN 1793-6349

Fernando Enríquez de Salamanca; José A.Troyano; Fermín L. Cruz; F. Javier Ortega. “A Comparative Study of Classifier Combination Methods Applied to NLP Tasks”, Natural Language Processing and Information Systems, Volume 6716/2011, pag 258-261

F. Javier Ortega; Craig MacDonald; José A. Troyano; Fermín L. Cruz; Fernando Enríquez de Slamanca. “Combining Textual Content and Hyperlinks in Web Spam Detection”, Natural Language Processing and Information Systems, Volume 6716/2011, pag 266-269

Fermín L. Cruz; José A. Troyano; F. Javier Ortega; Fernando Enríquez de Salamanca. “TOES: A Taxonomy-Based Opinion Extraction System”, Natural Language Processing and Information Systems, Volume 6716/2011, pag 262-265

Fermín L. Cruz; José A. Troyano; F. Javier Ortega; Fernando Enríquez de Salamanca. “Automatic Expansion of Feature-level Opinion Lexicons”. Proceedings of the Second Workshop on Computational Approaches to Subjetivity and Sentiment Analysis. Pages 125-131. Alicante, Spain

Fermín L. Cruz; José A. Troyano; F. Javier Ortega; Fernando Enríquez de Salamanca. “Extracción de opiniones sobre características adaptable al dominio”, Jornadas de la Red TIMM 2011. Jaén, Spain

F. Javier Ortega; José A. Troyano; Fermín L. Cruz; Fernando Enríquez de Salamanca. “Detección de Spam en la Web mediante el análisis de texto y de grafos”, Jornadas de la Red TIMM 2011. Jaén, Spain

Fernando Enríquez de Salamanca; José A. Troyano; Fermín L. Cruz; F. Javier Ortega. “Estudio Comparativo sobre Métodos de Combinación de Clasificadores en PLN”, Jornadas de la Red TIMM 2011. Jaén, Spain

F. Javier Ortega; José A. Troyano; Fermín L. Cruz; Fernando Enríquez de Salamanca. “PolarityTrust: Measuring Trust and Reputation in Social Networks”. Fourth International Conference on Internet Technologies and Applications (ITA’11). Wrexham, North Wales, United Kingdom

2010

Fermín L. Cruz; José A. Troyano; Fernando Enríquez de Salamanca; F. Javier Ortega; Carlos G. Vallejo. "A Knowledge-Rich Approach to Feature-based Opinion Extraction from Product Reviews”.  Proceedings of the Second International Workshop on Search and Mining User-Generated Contents, International Conference on Information and Knowledge Management. 2010. Toronto, Canadá

F. Javier Ortega; Craig Macdonald; José A. Troyano; Fermín L. Cruz. "Spam Detection with a Content-based Random-Walk Algorithm”. Proceedings of the Second International Workshop on Search and Mining User-Generated Contents, International Conference on Information and Knowledge Management. 2010. Toronto, Canadá

Carlos G. Vallejo; José A. Troyano; F. Javier Ortega. “InstanceRank: Bringing order to Datasets”. Pattern Recognition Letters. 31-2. pp. 133 - 142. 2010. Disponible en Internet en: http://dx.doi.org/10.1016/j.patrec.2009.09.022. ISSN 0167-8655

Fernando Enríquez de Salamanca; José A. Troyano; Fermín L. Cruz; F. Javier Ortega. “La Combinación de Sistemas y el PLN (System Combination and PLN)”. Boletín de la Sociedad Española para el Procesamiento del Lenguaje Natural.45,pp. 67 - 75.2010.ISSN 1135-5948

2009

Fermín L. Cruz; José A. Troyano; F. Javier Ortega; Carlos G. Vallejo. “Inducción de un Lexicón de Opinión Orientado al Dominio”. Boletín de la Sociedad Española para el Procesamiento del Lenguaje Natural. 43, pp. 5 - 12. 2009. ISSN 1135-5948

Fermín L. Cruz; José A. Troyano; F. Javier Ortega; Fernando Enríquez de Salamanca. “Hacia una metodología para la construcción de sistemas de extracción de información orientados al dominio”. 1st Workshop on Opinion Mining and Sentiment Analysis. Seville, Spain. pp. 52 - 61. 2009

FL Cruz, JA Troyano, F Enríquez, VJ Díaz. “Construcción de un sistema PLN usando el framework UIMA”, Procesamiento del lenguaje natural 43, 351-352

2008

Fermín L. Cruz; José A. Troyano; Fernando Enríquez de Salamanca; F. Javier Ortega. “Clasificación de Documentos Basada en la Opinión: Experimentos con un Corpus de Críticas de Cine en Español”. Boletín de la Sociedad Española para el Procesamiento del Lenguaje Natural.41,pp. 73 - 80. 2008. ISSN 1135-5948

José M. Cañete; Fernando Enríquez de Salamanca; F. Javier Ortega. “Clarifying the Semantics of Value in Use Cases Through Jackson’s Problem Frames”. Information Processing Letters. 107 - 6. pp. 221 - 229. 2008. ISSN 0020-0190

Fermín L. Cruz; José A. Troyano; F. Javier Ortega; Fernando Enríquez de Salamanca; "The ITALICA System at TAC 2008: Opinion Summarization Task”. Proceedings of Text Analysis Conference. 2008. Gaithersburg, Maryland, USA

A Ageno, D Farwell, D Ferrés, FL Cruz, H Rodríguez. “TALP at TAC 2008: A semantic approach to recognizing textual entailment”, Proceedings of the Fourth PASCAL Challenges Workshop on Recognizing Textual Entailment, Gaithersburg, USA.

2007

José A. Troyano; Fernando Enríquez de Salamanca; Fermín L. Cruz; José M. Cañete; F. Javier Ortega. “Improving the Performance of a Tagger Generator in an Information Extraction Application”. Journal of Universal Computer Science.13-9, pp. 1287 - 1299. 2007. ISSN 0948-6968

Fernando Enríquez de Salamanca; José A. Troyano; Fermín L. Cruz; F. Javier Ortega. "Generación Semiautomática de Recursos”. Boletín de la Sociedad Española para el Procesamiento del Lenguaje Natural. 39, pp. 173 - 180. 2007. ISSN 1135-5948

Adolfo A. Aumaitre; Vicente Carrillo; F. Javier Ortega. "ALGORITHM FOR SELECTION OF CONTENTS IN A LOCATION-BASED SYSTEM". Proceedings of the Second International Conference on eBusiness (ICE-B 2007). Barcelona. 2007. pp. 157 - 161. Disponible en Internet en: http://www.ice-b.org/ICE-B2007/index.html. ISBN 978-989-8111-11-1

Luisa Romero; F. Javier Ortega; José A. Troyano. "Obtaining Adaptation of Virtual Courses by Using a Collaborative Tool and Learning Design". Proceedings of the Euroamerican Conference on Telematics and Information Systems (EATIS 2007). Faro (Portugal). 2007. pp. 53 - 59. Disponible en Internet en: http://eatis.org/eatis2007. ISBN 978-1-59593-598-4

Francisco J. Galán; José M. Cañete; Vicente Carrillo; F. Javier Ortega. "Compiling a Class of Assertions Containing Infinite Quantification”. II CONGRESO ESPAÑOL DE INFORMATICA (CEDI 2007). Zaragoza. 2007. pp. 147 -156. Disponible en Internet en: http://www.congresocedi.es/2007/contenido.php?apartado=presentacion&menu=1

Carlos G. Vallejo; José A. Troyano; F. Javier Ortega. "WIRS: un Algoritmo de Reducción de Instancias Basado en Ranking"". XII Congreso de la Asociación Española para la Inteligencia Artificial. pp. 327 - 336.2007.ISBN 978-84-611-8846-8

2006

Fermín L. Cruz; José A. Troyano; Fernando Enríquez de Salamanca; F. Javier Ortega. “TextRank como motor de aprendizaje en tareas de etiquetado”. Boletín de la Sociedad Española para el Procesamiento del Lenguaje Natural. 37, pp. 33 - 42. 2006. ISSN 1135-5948

Fernando Enríquez de Salamanca; José A. Troyano; Fermín L. Cruz; F. Javier Ortega. “Ampliación Automática de Corpus Mediante la Colaboración de Varios Etiquetadores”. Boletín de la Sociedad Española para el Procesamiento del Lenguaje Natural. 37,pp. 11 - 17.2006.ISSN 1135-5948

F. Javier Ortega; Víctor J. Díaz; Luisa M. Romero. “Una herramienta para la edición y manipulación de corpus”. Boletín de la Sociedad Española para el Procesamiento del Lenguaje Natural. 37, pp. 365 - 366. 2006. ISSN 1135-5948

FL Cruz, JA Troyano, F Enríquez. “Supervised textrank”, Advances in Natural Language Processing, 632-639

2005

LMR Moreno, JAT Jiménez, FL Cruz. “Aportaciones de una formalización de las interacciones producidas en un entorno que integra aprendizaje colaborativo al diseño de un curso virtual”, Actas VII Simposio Internacional de Informática Educativa (pp. 245-249)

JA Troyano, VJ Díaz, F Enríquez, V Carrillo, F Cruz. ”Applying stacking and corpus transformation to a chunking task”, Computer Aided Systems Theory–EUROCAST 2005, 150-158

Contacto

Dirección: Avenida de la Reina Mercedes s/n. Código Postal: 41012. Sevilla. España