¿Existe información sobre tu organización consistente en texto, video, imágenes, tanto en la web como en redes sociales y plataformas? ¿Dispones de herramientas para identificar, recolectar y procesar toda esta información? ¿Dispones de almacenamiento necesario para todo este volumen de información a unos costes razonables? ¿Crees que normalizar y compartir esta información entre los distintos estamentos de tu organización puede transformar la forma de gestión?
El término “Big data” sugiere el tratamiento de grandes volúmenes de datos, estructurados o no, que se obtienen de cientos de miles de fuentes distintas, tanto físicas como digitales.
Pero “big data” no solo se trata de volumen…
De datos que superan la capacidad de las herramientas a nivel de usuario
En el procesamiento y análisis de los datos
En el origen y tipología de los datos
Y calidad del conjunto de datos
Aportado a la organización a través de información útil
Las aplicaciones más típicas con grandes conjuntos de datos, y aplicando modelos complejos basados en un conjunto de variables, nos permiten abordar problemáticas analíticas complejas, con un alto nivel de granularidad en los resultados.
Analizar y entender comportamientos
Tomar decisiones complejas
Análisis de sentimientos
Asegurar la fidelización de los clientes
Detectar ineficiencias
Determinar tendencias de compra
Caracterización de clientes
Recomendaciones de consumo
Las principales plataformas tecnológicas que están en la base de las arquitecturas de datos, herramientas y servicios asociados son Hadoop y Spark.
Hadoop es un proyecto de código abierto de la fundación Apache creado en 2011 que permite procesar grandes volúmenes de datos beneficiándose de la computación distribuida
En la actualidad la mejor opción para trabajar con Big Data es aprovechar la simbiosis entre Haddop y Spark, haciendo uso de la potencia de Hadoop (Hadoop YARN, HDFS…) y la inteligencia de Spark
En el más reciente informe de Forrester sobre soluciones comerciales de plataformas basadas en Hadoop y Spark, aparecen como líderes:
AWS (ERM, RDS, ...)
Hortonworks
Cloudera
Microsoft (Azure HDInsight)
Seguidos de cerca por Google con DataProc y servicios Cloud Platform como BigQuery y BigTable
Elegir la plataforma tecnológica de Big Data más adecuada a tus necesidades analíticas, construimos una arquitectura optimizada para dar respuesta a tus requerimientos de negocio y definimos el framework compuesto de plataforma, metodologías y herramientas para abordar tus proyectos de analítica avanzada.
¿Empezamos?
Envíanos un mensaje y te responderemos lo antes posible. También puedes contactarnos: