• El objetivo del proyecto X-Like es desarrollar la tecnología para monitorizar y agregar conocimiento al flujo de información social y a la información de los medios de comunicación, proporcionando servicios multilingües a los editores, con la monitorización de los mismos y Business Intelligence.
  • En cuanto a las aportaciones en I+D, el objetivo es combinar conocimientos científicos de varios campos para contribuir a la comprensión de textos en multilingües. Mediante la combinación de lingüística computacional, aprendizaje automático, minería de texto y tecnologías semánticas para hacer frente principalmente a dos problemas de investigación:
  • Por un lado extraer e integrar el conocimiento formal de textos en varios idiomas con bases de conocimiento multilingües.
  • Por otro lado, adaptar las técnicas lingüísticas y marcadores sociales para hacer frente a las irregularidades en el lenguaje informal, utilizado principalmente en los medios de comunicación social.
  • Las bases de conocimiento principales provendrán de Linked Data (http://linkeddata.org/) como recurso “interlingua”, en especial CycKB (http://www.cyc.com/). Para los idiomas en los que no estén disponibles recursos lingüísticos, se utilizará una representación interlingua probabilística a partir del entrenamiento de corpus comparables extraídos de la Wikipedia.
  • La solución se aplicará en dos casos de estudio sobre noticias. En Bloomberg con dominio de noticias financieras, y en la Agencia de Prensa eslovena con noticias generales. La tecnología desarrollada en el proyecto se utilizará para añadir multilingüismo y conocimiento en los medios de comunicación mediante distintos servicios para los editores y para los usuarios: resúmenes, personalización, dotación de contexto y detección de plagios. Prestando especial atención al análisis de noticias provenientes de fuentes multilingües. La tecnología desarrollada será independiente del idioma, aunque el proyecto que se centrará en el inglés, alemán, español y chino como idiomas principales del mundo y el catalán y el esloveno como las lenguas minoritarias.

Paquetes de trabajo en donde participa iSOCO

  • iSOCO participa activamente en diversos paquetes de trabajo, una parte del trabajo se centra en problemas de Big Data junto con la recolección y tratamiento de grandes volúmenes de información (WP1). Dentro del WP5 se investiga sobre técnicas de visualización de datos masivos mediante interfaces visuales que ayuden a interpretar los datos y técnicas de análisis de la información mediante la detección de eventos complejos. Dentro del WP6, iSOCO coordina el nexo de cada una de las investigaciones llevadas a cabo por todos los socios mediante la integración en un toolkit, sirviéndose de su experiencia en el desarrollo de soluciones inteligentes y proporcionando sus conocimientos sobre proyectos industriales. Cabe destacar también la participación en el WP8 donde iSOCO, como empresa de largo recorrido portando productos de software complejo al mercado, gestiona la explotación de los resultados gracias a su conocimiento estratégico en marketing.
  • Tipo de proyecto

    STREP

  • Duración

    Septiembre 2011 – Febrero 2013

  • Entidades financiadoras

    European Commission, Call 7

  • Coordinador del proyecto

    Jožef Stefan Institute (JSI) – Slovenia

  • Entidades participantes

    • Jožef Stefan Institute (JSI) – Slovenia
    • Karlsruhe Institute of Technology (KIT) – Germany
    • Universitat Politècnica de Catalunya (UPC) – Spain
    • University Zagreb (FFZG) – Croatia/li>
    • Tsinghua University (THU) – China
    • Intellligent Software Components (iSOCO) – Spain
    • Bloomberg (BB) – UK
    • Slovenska Tiskovna Agencija (STA) – Slovenia
Imprimir