¿Qué es BigData?

En un mundo hipercompetitivo donde las empresas luchan con márgenes cada vez más estrechos, se busca en cualquier fuente de información que aporte una ventaja competitiva para sobrevivir. La compañía de servicios profesionales Deloitte ha predicho que a finales de este año, más el 90 por ciento de las empresas de Fortune 500 tendrá por lo menos algunas iniciativas de grandes datos, incipientes. Pero, ¿Qué es Big Data y por qué debemos estar al cabo de la calle de lo que ocurre?. Como  ocurre con el concepto de “cloud”  lo que una persona quiere decir cuando se habla de BigData podría no necesariamente coincidir con la compresión de otra.

La definición fácil

Etimológicamente hablando, podríamos pre suponer que se refiere a la manipulación y el análisis de grandes volúmenes de datos.

Según informe del Instituto de McKinsey “Big data: The next frontier for innovation, competition and productivity“ en referencia a unos  conjuntos de datos donde el tamaño va más allá de la capacidad de herramientas de software de base de datos típica para capturar, almacenar, administrar y analizar. Los repositorios de datos de todo el mundo, sin duda, han ido creciendo de una manera exponencial, sobre todo con la irrupción de las redes sociales y los dispositivos de movilidad que aportan una capacidad de generar gran cantidad de informacion en cualquier momento y en cualquier lugar. Tanto es así que, a mediados del año 2011 de IDC en su informe Digital Universe Study (patrocinado por EMC), predijo que serían creados y replicados en 2011 más de 1,8 zettabytes (1,8 trillones gigabytes) de datos — nueve veces más de lo que se produjo hasta 2006!.

all-you-need-to-know-about-big-data

La definición más complicada

Sin embargo, BigData es más que analizar grandes cantidades de datos. Ya que no sólo las  organizaciones crean una gran cantidad de información, sino que además mucha de ella, no se encuentra en un formato que cuadre con las  bases de datos tradicionales estructuradas;  weblogs, vídeos, documentos de texto, datos de máquina a máquina o datos geoespaciales, son un ejemplo de ello.

Estos datos también se encuentran en un número de diferentes sitios (a veces, incluso fuera de la organización), lo que significa que a pesar de que las empresas podrían tener acceso a una enorme cantidad de información, probablemente no tienen las herramientas para vincular los datos y sacar conclusiones.

Ha todo ello hay que añadir la frecuencia y la velocidad de actualizacion a la que toda esta informacion está sometida, acortándose los tiempos de actualización gracias a la alta velocidad, lo que implica al final más información variopinta en menos tiempos. La situación creada hace que los métodos tradicionales transaccionales de análisis de datos no pueden mantener estos grandes volúmenes  constantemente actualizados, allanando el camino a las tecnologías de BigData.

Una definición Intermedia, ni simple ni complicada.

En esencia se trata de liberar grandes volúmenes de datos, a alta velocidad y desde fuentes de datos heterogéneas, con el objetivo de crear nuevos desarrollos para incrementar la eficiacia y al competitivdad.  Y a todo ello nos surge una pregunta, pues hasta este momento BI solucionaba la gestion de gran cantidad de informacion, su histórico, ofreciendo a su vez una enorme capacidad para el análisis, entonces?;

¿Cúal es la diferencia entre  BI y BigData?

Segín Craig Baty Director general ejecutivo de Fujitsu Australia de marketing y CTO, el BI es descriptivo, analiza lo que ha hecho el negocio en un cierto período de tiempo. La velocidad de las tecnologías de BigData permiten ser predictivos, proporcionando información al negocio, sobre lo que pasará. BigData es capaz de analizar datos heterogéneos, mientras que BI gestiona comúnmente un  almacén de datos estructurados.

Matt Slocum de “O’Reilly Radar”  dijo que si bien ambas tecnologías tienen el mismo objetivo, responder preguntas, destacan tres grandes diferencias:

1.- BigData trata muchos más datos que BI, tanto en cantidad como tipología.

2.- Velocidad, el tratamiento de datos en cuanto  la interactividad y la exploración puede llegar a ser tan rápido como el equivalente a cargar una página Web.

3.- Trata datos no estructurados, los cuales sólo podemos decidir como utilizar una vez recopilados y  para ello son necesarios algoritmos de interactividad, que tengan como objetivo encontrar los patrones que contienen.

Y finalmente, según el whitepaper de Oracle titulado “Oracle Information Architecture: An Architect’s Guide to Big Data” (PDF) BigData, a diferencia de BI donde la simple suma de un valor conocido revela un resultado, el valor con BigData es descubierto a través de refinar procesos de modelado: hacer hipótesis, crear modelos estadísticos visuales o semánticos, validar y realizar de nuevo nuevas hipótesis. Se tarda lo mismo una persona  para interpretar visualizaciones que para realizar consultas basadas en conocimientos interactivos o mediante el desarrollo de algoritmos de adaptación de “machine learning”, que permitan descubrir su significado.

Sin duda nos encontramos ante otro de los grandes cambios tecnológicos sobrevenidos por la irrupcion de internert a todos los niveles de la sociedad.

Anuncios

Acerca de jaumemonserrat

Empresario TIC en la Inustria Turística

Publicado el 22/10/2012 en Innovacion y etiquetado en . Guarda el enlace permanente. Deja un comentario.

Responder

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión /  Cambiar )

Google+ photo

Estás comentando usando tu cuenta de Google+. Cerrar sesión /  Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión /  Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión /  Cambiar )

Conectando a %s

A %d blogueros les gusta esto: