Equipo israelí inventa método automatizado para resumir textos

Con el socio comercial adecuado, se espera que la solución tecnológica patentada esté pronto en el mercado.

Prof. Mark Last (Foto: Dani Machlis / BGU)

El mundo tiene una sobrecarga de información. Investigadores de la Universidad Ben-Gurion ayudarán a las personas a abrirse paso con un método automatizado, e independiente del idioma, para resumir textos.

Según el profesor Mark Last, quien ayudó a inventar la nueva tecnología, «la gente está tratando de consumir tanta información… esto ahorra tiempo a los lectores». No tienen que pasar demasiado tiempo leyendo un artículo largo; pueden ir al grano”.

Last trabajó con la Dra. Marina Litvak y el Dr. Menachem Friedman.

Específicamente, BGN Technologies, la compañía de transferencia de tecnología de BGU, introdujo una herramienta novedosa, automatizada e independiente del idioma para resumir textos que es aplicable para la extracción de artículos, revistas y bases de datos, tanto dentro de los medios en sí como por los usuarios de dichos medios. Los usuarios pueden ser organizaciones profesionales, como bibliotecas o motores de búsqueda académicos, o individuos.

Los resúmenes de texto se basan en un algoritmo genético que, según un comunicado, clasifica las oraciones de documentos utilizando características de oraciones estadísticas.

En la fase I, Last dijo a The Jerusalem Post, «calculamos un conjunto de métricas estadísticas para cada oración en el documento». Luego, el algoritmo asigna un peso a cada métrica. Basado en ese peso, el algoritmo calcula la importancia de cada oración en el documento. Las oraciones se reordenan y los usuarios reciben un resumen con el cual pueden decidir si están interesados en la pieza.

Y todo el proceso está automatizado.

«Algunos sitios web de noticias, como The New York Times, presentan un breve resumen o puntos destacados para cada uno de sus artículos de noticias», dijo Last. “Hasta donde sé, hoy en día, esos resúmenes se realizan manualmente. Nuestro método puede hacerlo automáticamente».

Aún más único es que el sistema funciona en al menos nueve idiomas: inglés, hebreo, árabe, persa, ruso, chino, alemán, francés y español. Su calidad de resumen ya se ha evaluado en cuatro de esos idiomas: inglés, hebreo, árabe y persa, mostrando un alto nivel de similitud con los resúmenes generados por humanos.

The first report on the method was published by the team in 2010. Since then, it has continued to perfect the system. Today, said Last, “people are quite happy with the results.”

Zafrir Levy, senior VP for business development at BGN Technologies, said that after filing a patent to protect the invention, it is now seeking an industry partner for the further development of the technology.

“We are currently looking for potential partners for further development and commercialization of this promising invention,” Levy said.

El primer informe sobre el método fue publicado por el equipo en 2010. Desde entonces, ha continuado perfeccionando el sistema. Hoy, dijo Last, «la gente está bastante contenta con los resultados».

Zafrir Levy, vicepresidente senior de desarrollo comercial de BGN Technologies, dijo que después de presentar una patente para proteger la invención, ahora está buscando un socio de la industria para el desarrollo de la tecnología.

«Actualmente estamos buscando socios potenciales para un mayor desarrollo y comercialización de este prometedor invento», dijo Levy.

 

Fuente: The Jerusalem Post
Traducido: Consulado General H. de Israel en Guayaquil