¿Qué es y qué se entiende por Big Data? en palabras simples son las tecnologías que habilitan a las organizaciones para procesar grandes volúmenes de datos estructurados y no-estructurados, e integrar al procesamiento y análisis variadas fuentes de datos cambiantes en el tiempo; todo esto en forma eficiente.
Una de las primeras definiciones de Big Data hacía énfasis en que su característica principal era el cumplimiento de las 3V’s que se refieren a Volumen ya que hace posible llegar a procesar exabytes de datos; Variedad ya que permite el procesamiento de distintos formatos y fuentes de datos y Velocidad porque permite analizar grandes cantidades de datos en ventanas menores de tiempo, esto permite abordar problemas con mayor rapidez y muchas veces generar análisis en tiempo real, algunos agregan una cuarta V para referirse a Veracidad de la información.
Otra definición asocia Big Data directamente al uso de Hadoop. Hadoop es un sistema para almacenar grandes volúmenes de datos; la idea es distribuir varias copias de cada archivo en diferentes nodos de una red, para accederlos y procesarlos en forma paralela. Existen también sistemas de administración de bases de datos basados en este mismo sistema, que entran en la categoría de procesamiento paralelo masivo de datos, lo cual se asocia con Big Data.
Independiente de la definición, Big Data habilita a las organizaciones en el procesamiento masivo de datos estructurados y no-estructurados en forma eficiente y optimizada. Es importante notar que Big Data no es un reemplazo de los sistemas tradicionales de información en las empresas, si no que se incorpora como un complemento para necesidades que anteriormente no se cubrían o resultaba muy costoso la implementación.
El riesgo de las empresas grandes y medianas sobre todo, es el de incorporar nuevas tecnologías sin antes hacer un diagnóstico de necesidades actuales y futuras y las capacidades internas que tienen para estos desafíos; Big Data suena a la solución a todos los problemas pero con el tiempo las empresas se dan cuenta que resuelve bien una parte específica del procesamiento y almacenamiento de datos, no es la panacea que muchos piensan que podría ser.
El futuro se ve promisorio, se observa un incremento sostenido del volumen de datos presente en Internet debido a tecnologías como Internet of Things, aplicaciones móviles, Smart Cities, el fenómeno de Datafication, redes sociales, sensores que transmiten sus datos por la red y el auge del Open Data entre otras tendencias. Big Data hace posible abordar este tipo de nuevos desafíos futuro que se plantean con estas tendencias actuales. Pero asegurar la capacidad de procesamiento no lo es todo, en la misma línea de Big Data se viene trabajar en la visualización de esta gran cantidad de información disponible y el uso modelamiento predictivo incorporando no solamente datos internos de las empresas sino además masivas cantidades de datos desdes fuentes externas.