IBM invertirá dinero y personal en la tecnología libre para análisis de datos Apache Spark


IBM anunció su decisión de involucrarse a gran escala en la mejora de Apache Spark, una tecnología de código abierto nacida de un proyecto de investigación de la Universidad de Berkeley que permite analizar grandes volúmenes de datos a gran velocidad, con el fin de integrarlos más fácilmente a las aplicaciones de negocios y de la Internet de las Cosas (IoT).

El anuncio fue hecho este lunes a través de un comunicado de la compañía, en coincidencia con declaraciones de la gerente general de la división analítica, Beth Smith, informando que se invertirán “cientos de millones de dólares al año” para la consolidación de dicha tecnología libre para analizar y procesar la Big Data.

ibm spark

Precisamente Smith fue quien destacó la importancia de la vinculación de IBM con Spark, señalando que considera a dicha tecnología “como una plataforma de tecnología fundamental para acelerar la innovación y la conducción de análisis a través de todos los negocios de manera fundamental”.

Básicamente, Spark es un motor rápido y general basado en clúster, diseñado para el procesamiento de datos a gran escala y que es capaz de ejecutar programas hasta 100 veces más rápido que Hadoop MapReduce en memoria, o 10 veces más rápido en disco.

Este sistema permite, además, desarrollar aplicaciones basadas en el análisis y modelado de datos utilizando distintos lenguajes de computación, incluyendo Java, Scala, Phyton, y R.

Estas características, sumadas al uso de diferentes herramientas informáticas (SQL, Streaming, análisis gráfico complejo, etc.), posibilitan el uso de Spark para el desarrollo de aplicaciones creativas de análisis de datos sociales, análisis de datos móviles, y procesamiento de datos para la IoT, entre otros productos.

Como parte de la participación de IBM en la consolidación del proyecto, ésta planea integrar a Spark en sus plataformas de análisis y empresarial, además de incorporarlo a los distintos servicios disponibles en la nube de IBM. Asimismo, recurrirá a más de 3.500 de sus investigadores y desarrolladores, distribuidos en todo el mundo, para trabajar en proyectos relacionados con Spark.

IBM también ofrecerá esta tecnología como un servicio en su plataforma de innovación digital IBM Bluemix, a fin de permitir que los desarrolladores puedan cargar más rápidamente los datos, modelarlos y derivar al dispositivo para usar en sus aplicaciones.

Apache Spark: Creación de centro tecnológico e integración con plataforma de salud de IBM

El plan de la compañía informática prevé, además, la inauguración de un Spark Technology Center en San Francisco, para el cual ya se ha contratado a una veintena de especialistas, para fomentar la innovación de diseño dirigido a aplicaciones inteligentes.

De acuerdo con lo informado por IBM, uno de los destinatarios de la nueva tecnología será Watson Health Cloud, la plataforma en línea que pretende reunir la mayor cantidad de datos clínicos, de investigación y sociales que son suministrados diariamente por diferentes fuentes, incluidos los dispositivos conectados a la IoT como los monitores de salud o de actividad física portátiles.

Con la integración de Spark, se espera que los proveedores de los servicios de salud puedan disponer de nuevos análisis de toda esa información en tiempo real y más eficientemente.

Fuente: IBM




Ruben

Rubén es editor del sitio desde el año 2010. Colabora regularmente escribiendo noticias sobre tecnología, software, negocios, gadgets y ciencia. Sus intereses son Tecnología y Relaciones internacionales, tópico con el que también colabora en otros medios de publicación web.

Puede interesarte

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *