La aparición hace algunos años de nuevas arquitecturas de información (bases de datos de propósitos específicos, desacoplamiento cada vez mayor entre aplicaciones y la capa de datos, arquitecturas masivamente distribuidas como Hadoop) hacen que estemos transitando un proceso con todos los condimentos de una revolución: paradigmas que se vuelven obsoletos, alternativas nuevas (y no tan nuevas) se vuelven prometedoras y, principalmente, una necesidad de información cada vez mayor y por primera vez procesable en los tiempos necesarios.

El futuro pertenece a aquellos que entienden cómo recolectar, almacenar y utilizar sus datos de manera efectiva

Dado este estadio de ebullición actual de nuevas tecnologías de almacenamiento, procesamiento y explotación de información acompañamos, relevamos y estructuramos esta clase de proyectos en fases acotadas que permiten el crecimiento sin perder de vista la flexibilidad y escalabilidad originalmente buscados. Utilizamos un esquema iterativo, donde cada nuevo módulo se monta sobre el anterior incorporando nueva funcionalidad.

Con esto en mente, desde Datalytics utilizamos el siguiente esquema para abordar estas iniciativas:

  1. Revisión detallada de la arquitectura actual de información
  2. Definición y homologación de objetivos analíticos buscados
  3. Definición de arquitecturas de información necesarias
  4. Definiciones tecnológicas

Para todo esto, utilizamos una arquitectura elástica basada en Amazon:  EC2, EMR y S3. Esto nos permite disponibilizar del hardware (EC2), storage (S3) y la capacidad de cálculo (Hadoop, EMR) de manera 100% flexible, on-demand y sin costos excesivos.