Tecnologías

Datasalt goza de un gran conocimiento en el área del Big Data, los sistemas distribuidos, la escalabilidad, los motores de búsqueda y el rastreo y extracción de información de la web. Nuestra filosofía se basa en el continuo reciclaje de conocimientos y la intensa investigación de nuevas técnicas junto con la consolidación de las mejores prácticas aprendidas. Entre la variedad de tecnologías que sirven de base para las soluciones de Datasalt se encuentran:

Hadoop y su ecosistema

Google revolucionó el mundo de los sistemas de procesamiento masivo en paralelo (MPP) con la invención del paradigma MapReduce, desarrollado para la gestión y el procesamiento de las cantidades monstruosas de datos agregadas en su buscador. Hadoop es una implementación de código abierto que abre las puertas del paradigma MapReduce al resto de la industria. Hadoop es una tecnología madura, usada por cientos de compañías entre las que se encuentran Yahoo, con clusters de más de 4000 nodos, y Facebook. Hadoop es la tecnología que está detrás del concepto de Big Data.

Más información sobre Hadoop →

Procesamiento en tiempo real

Actualmente, ser capaz de proveer respuestas rápidas al procesamiento Big Data se está conviertiendo en algo más y más valuable. Los sistemas de procesamiento en tiempo real como Storm, junto con sistemas de colas escalables como Kafka provéen los medios necesarios para limpiar, pre-agregar y desvelar el valor en flujos masivos de eventos que han de ser procesados de forma escalable y fiable. Muchas compañías están ya integrando sus sistemas con procesos en tiempo real usando Storm.

Más información sobre procesamiento en tiempo real →


Bases de datos NoSQL

La corriente de bases de datos NoSQL surgió debido a las limitaciones en cuanto a escalabilidad y flexibilidad de las bases de datos relacionales. Las bases de datos NoSQL prescinden de ciertos requisitos, como garantías ACID, esquemas fijos, índices secundarios o claves foráneas, para ganar en flexibilidad y escalabilidad. No suelen soportar consultas SQL, de ahí su nombre “no SQL”. Las bases de datos NoSQL demuestran su utilidad para el desarrollo de aplicaciones escalables y el almacenamiento masivo de datos.

Más información sobre NoSQL →

Sistemas de búsqueda Lucene y Solr

Hacen falta métodos fáciles y potentes para consultar y extraer información de los grandes repositorios de Big Data. Los motores de búsqueda basados en índices invertidos permiten buscar en la marea de datos de manera sencilla y rápida. En Datasalt confiamos en el poder de Lucene y Solr como sistemas de búsqueda.

Más información sobre Sistemas de búsqueda →