1
Toda preocupación de seguridad respecto a los datos. Se han dado muchos casos de hackeo y violación de macrodatos para posteriores actividades ilegales.
2
No se puede confiar en los gráficos tradicionales para trazar un billón de puntos de datos, por ejemplo, por lo que son necesarias diferentes formas de representarlos, como la agrupación o el uso de mapas, las coordenadas, los diagramas, etc.
3
Uno es el número de inconsistencias en los datos. Estos deben ser encontrados por métodos de detección de anomalías y valores atípicos para que ocurra cualquier análisis significativo. Otro es la multitud de dimensiones de datos que resultan de múltiples tipos y fuentes de datos dispares. También puede referirse a la velocidad inconsistente a la que se cargan grandes datos en bases de datos.
4
O el tiempo que deben conservarse los datos. Antes del Big Data, se tendía a almacenar datos indefinidamente debido a que a su pequeño volumen apenas suponía gastos. Incluso podía mantenerse en la base de datos en vivo sin causar problemas de rendimiento.
5
Se refiere a la procedencia o confiabilidad de la fuente de datos, su contexto y cuán significativo es para el análisis basado en ella.
6
La que se generan o actualizan los datos. Un ejemplo de ello es Google, que procesa unas ” 40,000 consultas de búsqueda por segundo “, lo que se traduce apróximadamente en más de 3,5 mil millones de búsquedas por día.
7
Cuando se trata de Big Data, no solo tenemos que manejar datos estructurados, sino también semiestructurados y principalmente no estructurados. Desde archivos de audio, imagen, video, actualizaciones de redes sociales y otros formatos de texto, hasta archivos de registro, datos de clics, de máquinas y sensores, etc.
8
Es la cantidad masiva de datos que se generan cada segundo, minuto, hora o cualquier otra cifra de tiempo estimada. Han de ser grandes cifras de datos para considerarse Big Data. Por ejemplo, Youtube almacena 18.000 segundos de vídeo por minuto de sus usuarios.
9
Se refiere a la limpieza que tienen los datos, a cuán precisos y correctos son para su uso. El beneficio del análisis de Big Data es tan bueno como sus datos subyacentes, por lo que se deben adoptar buenas prácticas de gobernanza de datos para garantizar una calidad de datos coherente, definiciones comunes y metadatos.
10
La propiedad más importante... Las otras características no tienen sentido si no se obtiene un valor, como puede ser: comprender mejor a los clientes, optimizar procesos, mejorar el rendimiento, …