Archive for June, 2012

Reflexiones sobre VIG Data (Sí, con V de Volumen, Variedad, Velocidad, Valor…)

Alejandro Giménez

Alejandro Giménez

Alejandro Giménez, CTO EMC España. Un veterano con 20 años de experiencia tecnológica y comercial en el mundo de las TI. Sus clientes son su fuente favorita de información. Valora a EMC como un germen de innovación permanente @alexgimenezf

Ayer se presentó el estudio de IDC “Eclosión del mercado Big Data”, en el cual tuve la suerte de participar representando a EMC, uno de las empresas patrocinadoras de dicho estudio. Digo suerte porque el evento contaba con la asistencia de periodistas, y profesionales del mundo de TI, y estos eventos son siempre un interesante foro de intercambio de opiniones donde pulsar el estado de las iniciativas del mercado.

De este estudio me han interesado diversos aspectos, sobre los que querría compartir algunas reflexiones. No pretendo hacer un análisis exhaustivo, algo que IDC ya ha llevado a cabo de forma solvente, sino simplemente compartir algunas de mis interpretaciones personales.

¿Qué es Big Data?

Un primer aspecto que ha llamado mi atención es el del conocimiento acerca del concepto de Big Data. Aproximadamente un 20% de las empresas encuestadas declara que le resulta familiar. Es curioso, porque aquellos que estamos siguiendo de cerca el desarrollo de este concepto incipiente y tan interesante, a veces estamos tentados a pensar que el mercado está haciendo demasiado ruido con este concepto. Sin embargo, el grado de conocimiento o familiaridad me inclina hoy hacia el lado contrario, seguramente el concepto de Big Data no está llegando a las empresas con la velocidad y profundidad que debería por su potencialidad para el negocio.

Una rápida línea para comentar la dificultad de las definiciones formales. “Big Data es un concepto diferente a Business Intelligence pero ambos conceptos están relacionados”. He entrecomillado la cita porque no es mía, sino que ha sido la definición que las empresas encuestadas han encontrado más acertada. Ya he comentado en alguna entrada de este blog los distintos matices que a veces hacen difícil definir con precisión un concepto. Sucedió con Cloud, y otras muchas veces anteriormente. Todos tenemos un cierto concepto de Big Data, no es el mismo para un Banco, que para una Productora Cinematográfica o una empresa de Logística.

En cuanto a las ‘V’ que definen Big Data, y que han sugerido el título de este post,  la percepción es que el problema más acuciante es el del volumen que los datos están alcanzando, por encima de la velocidad a la que se generan o consumen y por encima incluso de la variedad de fuentes.  Esta sensación de crecimiento, a la que a veces nos referimos como la explosión digital, responde a una realidad sobradamente conocida y sobre la que IDC ya ha publicado estudios. Lidiar con esa V, la de volumen, almacenar y gestionar cantidades ingentes de información de forma sencilla forma parte del corazón de nuestro negocio desde hace más de tres décadas. Sin embargo yo hubiera apostado por la cuarta V, la extracción de Valor, como el driver más importante y más urgente en el mundo de Big Data. Potenciar y agilizar la extracción de valor para conocer mejor a mi cliente y a mi competidor, contener los costes, optimizar procesos… también a eso nos dedicamos en EMC desde hace un par de años.

Estructurados versus desestructurados

La analítica de datos estructurados continúa siendo más valorada que el análisis de datos desestructurados, al que las empresas asignan un cierto valor pero cuyo tratamiento se describe como, fundamentalmente, manual. Yo creo que éste es uno de los aspectos que más van a cambiar en los próximos meses. Por supuesto, no discuto la importancia del análisis generado alrededor de las bases de datos, que continuará creciendo, sino a la generalización del análisis de datos desestructurados junto con la búsqueda de herramientas y plataformas que nos permitan automatizar todo este proceso. Es cada vez más frecuente en las conversaciones con clientes e integradores discutir acerca de pilotos de este tipo, cuando no de proyectos en marcha.

Obstáculos para Big Data

Finalmente ¿Cuáles son los mayores obstáculos para la adopción de Big Data? Están muy relacionados con la falta de expertos y la carencia de presupuesto. Quiero pensar que los temas presupuestarios sean limitaciones temporales, fundamentalmente derivadas de la novedad del concepto y del complejo momento económico en que nos encontramos. En cuanto a la carencia de expertos en el mercado creo firmemente que Big Data es uno de los campos que va a generar nuevos y muy interesantes perfiles profesionales, tanto en los entornos puramente IT como de análisis de negocio o servicio.

 

Universos abiertos

Alejandro Giménez

Alejandro Giménez

Alejandro Giménez, CTO EMC España. Un veterano con 20 años de experiencia tecnológica y comercial en el mundo de las TI. Sus clientes son su fuente favorita de información. Valora a EMC como un germen de innovación permanente @alexgimenezf

Mi primer trabajo serio, tras varias experiencias como free-lance, me llevó a finales de los ’80 a trabajar en el departamento de informática de un gran banco, un entorno mainframe. Un mainframe no era un ordenador cualquiera. Los que trabajábamos en este entorno destilábamos entonces un cierto orgullo profesional, fruto de trabajar con los que se anunciaban como los ordenadores más grandes del mundo. 

En aquel momento y en aquel entorno, el mainframe era el centro de un universo alrededor del cual giraba todo. Y todo significa TODO. Los sistemas de almacenamiento en disco, las cintas y cartuchos, las impresoras, todos ellos tratados como subsistemas o periféricos. Los terminales y las comunicaciones (específicas),  los sistemas de alimentación eléctrica y la refrigeración por agua. Los analistas de sistemas, operadores, planificadores, desarrolladores, responsables de seguridad…e incluso los managers. El Datacenter orbitando alrededor de una única plataforma, un universo autocontenido y de fronteras conocidas.

Hoy el mainframe convive con sistemas abiertos que coexisten  a su vez con sistemas virtuales los cuales  pueden componerse en forma de nube. Los sistemas de almacenamiento proporcionan servicio a múltiples plataformas heterogéneas simultáneamente. Las redes de comunicaciones, los sistemas eléctricos y de climatización tienden a la estandarización, comunes para todas las plataformas. Y estas plataformas son ahora  las que orbitan alrededor de las personas, donde es común que un técnico de sistemas, por ejemplo, tenga a su cargo algunos centenares de sistemas virtuales.

En definitiva, se trata de un universo más abierto, donde las fronteras se expanden, no sólo en término de plataformas o localizaciones, sino incluso empresas distintas. Si utilizo uno o múltiples  proveedores de servicio, conceptualmente mi datacenter llega hasta allí e incluso alcanza a un usuario final cuyo terminal es heterogéneo, inteligente y móvil. Un espacio vasto y en permanente expansión.

En este nuevo entorno, algunas habilidades aparecen o se potencian en nuestras organizaciones.  La primera es, quizá la de pensar en nosotros mismos como parte del negocio y no solamente como un centro de costes, esto es, hacer nuevas propuestas, añadir valor a la cadena productiva. 

Hay que potenciar la visión estratégica, y más en este momento de presupuestos bajo presión, analizar las oportunidades de crecimiento del negocio a medio y largo plazo. Explorar nuevos modelos de arquitecturas y explotación. Conocer la oferta de servicios generada a nuestro alrededor, en infraestructura, plataforma y aplicaciones. Escoger las opciones más adecuadas para cada departamento o servicio, en función del  valor y coste.

Construir arquitecturas globales a través de distintas tecnologías.  Planificar la convivencia o integración entre los sistemas y arquitecturas. Medir la calidad de nuestro servicio y pasar la factura a quien corresponda.

Y hay que lidiar con los nuevos usuarios, nacidos digitales, innovadores, indisciplinados, y más productivos, acostumbrados a navegar por universos abiertos y difíciles de encerrar en el datacenter. Todo ello no sólo manteniendo sino incrementando la seguridad de nuestros datos y procesos.

Seguramente veremos aparecer nuevos perfiles para cubrir algunas de estas necesidades, pero en cualquier caso, algo queda claro: No nos vamos a aburrir.  

 

 

 

 

 

Videos Recomendados

Expand The Data Lake: New Data Lake, New Breakthroughs

Archivo del Blog

  • 2016 3
  • 2015 20
  • 2014 7
  • 2013 16
  • 2012 21
facebook
twitter
linkedin
youtube
rss