Tecnologías

Datasalt goza de un gran conocimiento en el área del Big Data, los sistemas distribuidos, la escalabilidad, los motores de búsqueda y el rastreo y extracción de información de la web. Nuestra filosofía se basa en el continuo reciclaje de conocimientos y la intensa investigación de nuevas técnicas junto con la consolidación de las mejores prácticas aprendidas. Entre la variedad de tecnologías que sirven de base para las soluciones de Datasalt se encuentran:

Hadoop y su ecosistema

Google revolucionó el mundo de los sistemas de procesamiento masivo en paralelo (MPP) con la invención del paradigma MapReduce, desarrollado para la gestión y el procesamiento de las cantidades monstruosas de datos agregadas en su buscador. Hadoop es una implementación de código abierto que abre las puertas del paradigma MapReduce al resto de la industria. Hadoop es una tecnología madura, usada por cientos de compañías entre las que se encuentran Yahoo, con clusters de más de 4000 nodos, y Facebook. Hadoop es la tecnología que está detrás del concepto de Big Data.

Más información sobre Hadoop →

Spark y su ecosistema

Spark es un framework de procesamiento Big Data innovador desarrollado originalmente en la University of Berkeley. Provée un modelo de programación flexible y hace mejor uso del hardware moderno. Spark representa un paso adelante en las tecnologías Big Data y lo vemos como la tecnología clave de referencia para las aplicaciones Big Data en los siguientes años. Actualmente ya está siendo adoptado por varias compañías.

Más información sobre Spark →


Procesamiento en tiempo real

Actualmente, ser capaz de proveer respuestas rápidas al procesamiento Big Data se está conviertiendo en algo más y más valuable. Los sistemas de procesamiento en tiempo real como Storm, junto con sistemas de colas escalables como Kafka provéen los medios necesarios para limpiar, pre-agregar y desvelar el valor en flujos masivos de eventos que han de ser procesados de forma escalable y fiable. Muchas compañías están ya integrando sus sistemas con procesos en tiempo real usando Storm.

Más información sobre procesamiento en tiempo real →

Análisis interactivo

Las tecnologías Big Data están poco a poco cerrando la brecha entre lo que era posible hacer en el pasado y lo que es posible hacer hoy en dia. Ya es posible integrar aplicaciones Big Data con tecnologías de análisis interactivo que facilitan el análisis complejo y rápido a través de medios familiares como el lenguaje de consultas SQL.

Más información sobre tecnologías de análisis interactivo

Bases de datos NoSQL

La corriente de bases de datos NoSQL surgió debido a las limitaciones en cuanto a escalabilidad y flexibilidad de las bases de datos relacionales. Las bases de datos NoSQL prescinden de ciertos requisitos, como garantías ACID, esquemas fijos, índices secundarios o claves foráneas, para ganar en flexibilidad y escalabilidad. No suelen soportar consultas SQL, de ahí su nombre “no SQL”. Las bases de datos NoSQL demuestran su utilidad para el desarrollo de aplicaciones escalables y el almacenamiento masivo de datos.

Más información sobre NoSQL →

Sistemas de búsqueda

Hacen falta métodos fáciles y potentes para consultar y extraer información de los grandes repositorios de Big Data. Los motores de búsqueda basados en índices invertidos permiten buscar en la marea de datos de manera sencilla y rápida. En Datasalt confiamos en el poder de ElasticSearch y Solr como sistemas de búsqueda.

Más información sobre Sistemas de búsqueda →