Retos del Big Data

El concepto de Big data ha venido para quedarse y ofrecer a las empresas una visión tremenda. Pues manejando conceptos como terabytes y petabytes de datos a las organizaciones de hoy en día, las arquitecturas tradicionales y las infraestructuras, se les quedan muy pequeñas pues no están a la altura del los retos que plantean estas enormes cantidades de información heterogénea. La consecuencia es que los equipos de IT están en over-flow por, peticiones de datos, análisis e informes especiales. Por otra parte las personas cuya responsabilidad es la de tomar decisiones se frustran por la cantidad de tiempo que se tarda en obtener las respuestas a las preguntas que les plantea el negocio o el mercado y  cuya solución está escondida entre los millones y millones de bytes generados los SI de la empresa. Dicho de otra forma cada vez más usuarios esperan un autoservicio.

La visualización de datos se está convirtiendo en un componente cada vez más importante de la analítica, en la era de grandes volúmenes de datos así como acceder a la información en una forma que se pueda fácilmente, compartir.

Esto plantea la pregunta: ¿Cómo se puede presentar grandes volúmenes de datos de manera que los líderes empresariales pueden entender y usar de forma rápida y fiable? En ningún caso es una consideración menor. La minería de millones de filas de datos crea un gran dolor de cabeza para los analistas encargados de ordenar y presentar la información.

Las organizaciones suelen abordar el problema en una de dos maneras: Diseñan “muestras” de modo que sea más fácil analizar y presentar los datos, o bien creaa listas de plantillas y gráficos que pueden aceptar cierto tipo de información. En cualquier caso en ambas propuestas se pierde el potencial del Big Data.

Para aprovechar al máximo la analítica visual, las organizaciones tendrán que hacer frente a varios desafíos relacionados a la visualización y al Big Data. Veamos algunos de los principales desafíos  y sus potenciales soluciones

1 Satisfacer la necesidad de velocidad

En el entorno de los negocios es híper competitivo, las empresas no sólo tienen que buscar y analizar la información relevante que necesitan, tienen que encontrarla rápidamente. Las herramientas de visualización ayuda a las organizaciones realizar análisis y tomar decisiones con mayor rapidez, pero el reto está en la velocidad que se necesita para acceder al nivel de detalle de los datos relevantes escondidos volúmenes de datos enormes. Y este reto crece a medida que aumenta el grado de granularidad de la información. Una posible solución es hardware. Algunos proveedores están utilizando más memoria y procesamiento en paralelo de gran alcance para procesar grandes volúmenes de datos de manera extremadamente rápida. Otro método es poner los datos en memoria, utilizando un enfoque “grid computing”, donde muchas máquinas se utilizan para resolver un problema. Ambos enfoques permiten a las organizaciones a explorar grandes volúmenes de datos y obtener una visión de negocios en tiempo casi real.

2 Conocimiento de los datos

Se necesita mucho conocimiento para obtener los datos en la forma adecuada y que pueda ser utilizada para la visualización, como parte del análisis de datos. Por ejemplo, si los datos proceden de contenidos de los medios sociales, lo que necesita saber quién es el usuario en un sentido general – como un cliente utiliza un conjunto determinado de productos – y comprender qué es lo que está tratando de visualizar. Sin algún tipo de contexto, las herramientas de visualización es probable que sean de mucho menos valor para el usuario.

Asegúrese de que las personas que analizan los datos tienen un profundo conocimiento acerca de la procedencia de los datos, conocimiento acerca del tipo de público estará consumiendo los datos y la forma en el que éste va a interpretar la información.

3 Abordar la calidad de datos

En el escenario de que hayamos superado los retos de expuestos en los puntos anteriores, el valor de estos datos estará en peligro sino tiene en cuenta su exactitud. Incluso en el caso de que pueda encontrar y analizar datos de manera rápida puestos en el contexto adecuado para la audiencia que se consume la información, el valor de los datos para la toma de decisiones fines,  se pondrá en peligro si los datos no llegan en tiempo y forma, además de ser lo más exactos posibles. Este es un desafío es común en cualquier análisis de datos, pero cuando se consideran los volúmenes de información que participan en proyectos de Big Data, se vuelve aún más pronunciado. Una vez más, la visualización de datos sólo resultará ser una herramienta valiosa si la calidad de los datos está asegurada. Para solucionar este problema, las empresas deben tener un gobierno de datos o proceso de gestión de la información para garantizar que los datos están limpios. Es preferible, por tanto disponer de un método proactivo para abordar los problemas de calidad de datos para que los problemas y evitar que surjan a posteriori.

4 Mostrar resultados significativos

El trazado de puntos en un gráfico para el análisis, se vuelve difícil cuando se trata de cantidades extremadamente grandes de datos o bien una gran una variedad de categorías de información. Por ejemplo, imagine que tiene 10 mil millones de filas de datos que se quieren comparar. El usuario intenta ver 10 mil millones parcelas en la pantalla necesitará mucho tiempo y lo tendrá muy difícil. Una forma de solucionarlo es “clusterizar” los datos de forma que se cree una vista a alto nivel. Al agrupar los datos en conjunto, o “binning”, se puede visualizarlos con mayor eficacia.

5 Hacer frente a los valores atípicos

Las representaciones gráficas de los datos posibles gracias a la visualización, permiten comunicar las tendencias y los valores atípicos mucho más rápido que las tablas que contienen números y texto. Los usuarios pueden detectar problemas que necesitan atención simplemente echando un vistazo a un gráfico. Los datos atípicos o “Outliers” normalmente representan alrededor del 1 al 5 por ciento de los datos totales contenidos en un análisis. Cuando se trabaja con grandes cantidades de datos, mostrar este 1 al 5 por ciento, es bastante difícil. ¿Cómo se representan los puntos sin entrar en cuestiones de trazado? Las posibles soluciones son la eliminación de los valores anómalos o bien, crear un gráfico separado éstos. Los valores extremos pueden no ser representativos de los datos, pero podrían revelar puntos de vista inéditos y potencialmente valiosos.

Conclusión

Cada vez más y más empresas están descubriendo que la visualización de datos se está convirtiendo en un componente cada vez más importante de la analítica, en la era de grandes volúmenes de datos. La disponibilidad de la nueva tecnología en memoria de alto rendimiento y análisis que utilizan la visualización de datos, está proporcionando una mejor manera de analizar la información y con más rapidez que nunca. Sin embargo, estas herramientas cuando se enfrentan a Big Data están obligadas a superar algunos nuevos retos. Si se está preparado para hacer frente a estos obstáculos, la oportunidad para el éxito con una estrategia de visualización de datos es mucho mayor.

Anuncios

Acerca de jaumemonserrat

Empresario TIC en la Inustria Turística

Publicado el 29/03/2013 en Innovacion. Añade a favoritos el enlace permanente. Deja un comentario.

Responder

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión /  Cambiar )

Google+ photo

Estás comentando usando tu cuenta de Google+. Cerrar sesión /  Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión /  Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión /  Cambiar )

w

Conectando a %s

A %d blogueros les gusta esto: