Splout SQL


logo-notext
Splout provée una “vista” SQL sobre tu Big Data con latencias por debajo del segundo y alto rendimiento.

Splout es a Hadoop y las bases de datos SQL lo que Voldemort o Elephant DB son a Hadoop y las bases de datos llave / valor.

Principales características

Servicio Big Data

Hay muchos problemas Big Data cuyo output también es Big Data. Splout permite servir un conjunto de datos arbitrariamente grande gracias a poder particionarlo.

SQL

Hay muchas bases de datos que permiten el servicio de Big Data como las NoSQL, pero no tienen un lenguaje rico de consulta como SQL. Generalmente no se puede agregar datos en tiempo real como se haría con una cláusula GROUP BY. Dado que no se puede precomputar todo, SQL es una característica muy conveniente a disponer en una solución de servicio Big Data.

Para Hadoop

Hadoop es hoy en día la plataforma de software libre de-facto para el procesamiento por lotes Big Data. Cuando el output de un proceso Hadoop es grande, no hay una solución plenamente satisfactoria que pueda servirlo. Por ejemplo, en el caso de recomendaciones precomputadas, donde el conjunto entero de datos puede cambiar de un día a otro. Splout desacopla la creación de la base de datos de su servicio y hace que sea eficiente y seguro desplegar conjuntos de datos generados por Hadoop.

Latencia “web”

Splout no es un producto para consultas analítica rápidas. Splout está hecho para poder servir aplicaciones web o móviles exigentes donde el rendimiento de cada query es crucial.. Cualquier agregación en tiempo real debería poder ejecutarse en menos de 200 milisegundos aun con muchos usuarios concurrentes.

Escalable

Splout escala horizontalmente. Añadiendo más nodos se puede incrementar el rendimiento linealmente. Splout coordina un clúster de máquinas para proveer tolerancia a fallos en caso de particiones de red o hardware corrupto.

Flexible

Aunque Splout es relacional, es también muy flexible. Como los datos se despliegan de forma atómica, se puede cambiar el modelo de datos de un día para otro sin problema alguno.

Fácil de manejar

Splout sirve lo que llamamos “tablespaces”. Cada “tablespace” puede tener una o más “tables”. Las “tables” o bien se particionan o bien se replican en cada partición. Usando líneas de comandos se puede indexar y desplegar cualquier conjunto de datos en el HDFS, sistema local o sistema de ficheros S3. También se puede usar la API avanzada Java para controlar más el proceso a bajo nivel.

“RESTful”

Splout provée una interfaz REST que devuelve JSON para cualquier query SQL.

Características
  • Servicio Big Data
  • SQL
  • Para Hadoop
  • Latencias web
  • Escalable
  • Flexible
  • Fácil de manejar
  • “RESTful”
Para más información
La web de Splout SQL