Amazon Redshift

Amazon Redshift es un almacén de datos rápido y totalmente gestionado a escala de petabytes que permite analizar todos los datos empleando de forma sencilla y rentable sus herramientas de inteligencia empresarial existentes. Comience con poca capacidad por 0,25 USD por hora sin asumir ningún compromiso y escale hasta varios petabytes por 1 000 USD por terabyte al año, menos de la décima parte del coste de las soluciones tradicionales. Por lo general, los clientes se benefician del triple de compresión, lo que reduce sus costes a 333 USD por terabyte sin comprimir al año.

Introducción a los almacenes de datos de Amazon Redshift (3:22)

Obtenga información acerca del almacenamiento de datos en AWS con Amazon Redshift. Amazon Redshift es un servicio sólido, rápido y totalmente gestionado de almacenamiento de datos que funciona con las herramientas de análisis existentes. Con tan solo unos clics en AWS Management Console puede disponer de un almacén de datos configurado totalmente funcional listo para aceptar datos sin necesidad de tener que aprender nuevos lenguajes. Amazon Redshift se complementa perfectamente con todas las herramientas existentes de inteligencia empresarial y puede empezar a funcionar en cuestión de minutos.

Historias de clientes

Almacenamiento de datos a escala petabyte, cumpliendo con los requisitos de seguridad. Ver caso práctico »

Finra analiza 30 mil millones de eventos de mercado financiero al día. Ver caso práctico »

Análisis más rápido y completo y capacidades de almacenamiento de datos con un reducción de los costes del 57%. »

Un proveedor de carteras Bitcoin convierte 1 TB de datos al día en conocimientos empresariales accionables. »

Reducción de los costes de contratación de personal de urgencias. »

Analítica a gran escala habilitada para teléfonos estándar en cualquier lugar del mundo. »

Rápida escalabilidad y un ahorro del 60% »

Costos reducidos y rendimiento mejorado significativamente »

Disposición inmediata de los datos para la toma de decisiones »

Analíticas empresariales mejoradas para juegos »

Obtuvimos un rendimiento de 25-100X. »

Analice registros web para entender por completo el comportamiento de los clientes »

Informes en tiempo real habilitados para el sector comercial sobre miles de millones de interacciones a través del móvil y del ordenador. »

Gestión de gran cantidad de datos con rapidez y eficacia. »

Pruebe Amazon Redshift de forma gratuita

Realice una prueba gratuita
Más información

Consiga 750 horas gratis de DC1.Large al mes durante un periodo de dos meses. Para iniciar la prueba:

Cree una cuenta de AWS e inscríbase en la consola de Amazon Redshift

Lance un clúster de Amazon Redshift y seleccione DC1.Large como tipo de nodo.

Registre e incorpore datos de manera gratuita con las pruebas gratuitas para socios

Publicaciones recientes en el blog

Funciones definidas por el usuario para Amazon Redshift | 11/9/2015 | AWS

Understanding Interleaved Sorting – Part 2 | 8/27/2015 | Chartio

Extending Seven Bridges Genomics with Amazon Redshift and R | 8/20/2015 | AWS

Connecting R with Amazon Redshift | 7/29/2015 | AWS

Ver todas las publicaciones >

Novedades de Amazon Redshift

Características y beneficios

Amazon Redshift ofrece un rendimiento de consulta rápido gracias a la utilización de la tecnología de almacenamiento en columnas para mejorar la eficacia de E/S y realizar consultas en paralelo entre varios nodos. Amazon Redshift dispone de controladores JDBC y ODBC personalizados que puede descargar de la pestaña Connect Client de nuestra consola y que le permiten utilizar una amplia gama de clientes SQL. También puede utilizar controladores JDBC y ODBC PostgreSQL estándar. La velocidad de carga de los datos aumenta de manera lineal con respecto al tamaño del clúster, con integraciones en Amazon S3, Amazon DynamoDB, Amazon Elastic MapReduce, Amazon Kinesis o en cualquier otro host con SSH habilitado.

La arquitectura de almacenamiento de datos de Amazon Redshift le permite automatizar la mayoría de las tareas administrativas asociadas con el aprovisionamiento, la configuración y la supervisión de un almacén de datos en la nube. Las copias de seguridad en Amazon S3 son constantes, incrementales y automáticas. Las restauraciones son rápidas; puede empezar a consultar en cuestión de minutos mientras los datos se agrupan en segundo plano. Habilitar la recuperación de desastres entre regiones es una tarea que solo requiere unos cuantos clics.

La seguridad está integrada. Puede cifrar los datos en reposo y en tránsito con AES-256 acelerado por hardware y SSL, aislar los clústeres con Amazon VPC e incluso gestionar las claves mediante AWS Key Management Service (KMS) y módulos de seguridad de hardware (HSM). Se realiza un registro y una auditoría de todas las llamadas a las API, los intentos de conexión, las consultas y los cambios del clúster. Puede usar AWS CloudTrail para realizar una auditoría de las llamadas a la API de Redshift.

Rapidez

Almacenamiento de datos optimizado

Amazon Redshift utiliza una serie de innovaciones para obtener un rendimiento muy alto de consulta en conjuntos de datos con una capacidad que oscila entre cien gigabytes y un petabyte o incluso más. Utiliza un almacenamiento en columna, compresión de datos y asignaciones de zona para reducir la cantidad de E/S necesaria para realizar consultas. Amazon Redshift cuenta con una arquitectura de almacenamiento de datos de procesamiento paralelo de forma masiva (MPP), que paraleliza y distribuye operaciones SQL para que pueda beneficiarse de todos los recursos disponibles. El hardware subyacente está diseñado para un procesamiento de datos de alto rendimiento, por lo que utiliza almacenamiento conectado local para maximizar el rendimiento entre las unidades y las CPU, y una red de maya 10 GigE para maximizar el rendimiento entre los nodos.

Escalabilidad

Con tan solo unos clics en AWS Management Console o con una sencilla llamada a una API, puede cambiar fácilmente el número o el tipo de nodos del almacén de datos en la nube a medida que cambian las necesidades de rendimiento o capacidad. Los nodos de almacenamiento denso (DS) le permiten crear almacenes de datos muy grandes con unidades de disco duro (HDD) por un precio muy bajo. Los nodos de informática densa (DC) le permiten crear almacenes de datos de rendimiento muy elevado con CPU rápidas, grandes cantidades de RAM y discos de estado sólido (SSD). Amazon Redshift le permite comenzar con un único nodo DC1.Large de 160 GB y, posteriormente, escalar a un petabyte o más de datos de usuario comprimidos mediante la utilización de nodos DS2.8XLarge de 16 TB. A medida que se adapta el tamaño, Amazon Redshift activará el modo de solo lectura en el clúster existente, aprovisionará un clúster nuevo del tamaño que desee y, a continuación, realizará copias paralelas en el nuevo clúster de los datos del clúster anterior. Puede continuar realizando consultas al clúster anterior mientras se aprovisiona el nuevo. Después de que los datos se hayan copiado al nuevo clúster, Amazon Redshift redirigirá las consultas automáticamente al nuevo clúster y eliminará el clúster anterior.

Rentabilidad

Ningún coste anticipado

Solo tendrá que pagar por la capacidad que utilice. Puede elegir precios de instancias bajo demanda sin costos anticipados ni compromisos a largo plazo, o bien beneficiarse de tarifas significativamente reducidas con los precios aplicables a las instancias reservadas. Los precios bajo demanda comienzan desde tan solo 0,25 USD por hora para nodos DC1.Large de 160 GB o 0,85 USD por hora para nodos DS2.XLarge de 2 TB. En el caso de las instancias reservadas con pago parcial anticipado, puede reducir el precio efectivo a 0,10 USD por hora para los nodos DC1.Large (5 500 USD/TB/año) o a 0,228 USD por hora para nodos DS2.XLarge (999 USD/TB/año). Encontrará más detalles en la página de precios de Amazon Redshift.

Sencillez

Comience en cuestión de minutos

Con tan solo unos clics en AWS Management Console o sencillas llamadas a la API, puede crear un clúster y especificar su tamaño, el tipo de nodo subyacente y el perfil de seguridad. Amazon Redshift aprovisionará los nodos, configurará las conexiones entre ellos y protegerá el clúster. El almacén de datos debe empezar a funcionar en pocos minutos.

Totalmente gestionado

Amazon Redshift procesa todo el trabajo necesario para gestionar, supervisar y escalar el almacén de datos, desde la supervisión del estado del clúster y la realización de copias de seguridad hasta la aplicación de revisiones y actualizaciones. A medida que sus necesidades de rendimiento y capacidad cambien, podrá cambiar el tamaño de su clúster fácilmente. Al ocuparse de la gestión de todas estas tareas que tanto trabajo y tiempo requieren, Amazon Redshift le permite concentrarse en los datos y en su empresa.

Fiabilidad

Amazon Redshift presenta varias características que mejoran la fiabilidad del clúster de almacén de datos. Todos los datos escritos en un nodo del clúster se replican automáticamente en los demás nodos del clúster y se realiza una copia de seguridad automática y constante de todos los datos en Amazon S3. Amazon Redshift supervisa constantemente el estado del clúster y automáticamente vuelve a replicar los datos desde unidades defectuosas y reemplaza los nodos según proceda.

Copias de seguridad automatizadas

La características de instantáneas automatizadas de Amazon Redshift realiza copias de seguridad constantemente de los nuevos datos del clúster en Amazon S3. Las instantáneas son constantes, incrementales y automáticas. Amazon Redshift almacena las instantáneas durante períodos definidos por el usuario, que pueden oscilar entre 1 y 35 días. También puede hacer sus propias instantáneas cuando lo desee, para lo que se sirve de las instantáneas existentes en el sistema y, además, se conservan hasta que las elimine explícitamente. Redshift también puede replicar de forma asíncrona las instantáneas en S3 en otra región para casos de recuperación de desastres. Después de eliminar un clúster, las instantáneas del sistema se eliminan, pero las instantáneas de usuario están disponibles hasta que se eliminan explícitamente.

Restauraciones rápidas

Puede utilizar cualquier instantánea del sistema o del usuario para restablecer el clúster con AWS Management Console o con las API de Amazon Redshift. El clúster se encuentra disponible en cuanto se restablecen los metadatos del sistema, y puede comenzar a ejecutar consultas mientras los datos de usuario se ponen en cola en segundo plano.

Seguridad

Cifrado

Con tan solo ajustar un par de parámetros, puede configurar Amazon Redshift para utilizar SSL a fin de proteger los datos activos y el cifrado AES-256 acelerado por hardware de los datos inactivos. Si decide habilitar el cifrado de los datos inactivos, todos los datos que se graben en el disco se cifrarán de la misma forma que las copias de seguridad. De forma predeterminada, Amazon Redshift se encarga de gestionar las claves, pero puede optar por gestionarlas con módulos de seguridad de hardware (HSM) propios, AWS CloudHSM o AWS Key Management Service.

Aislamiento de red

Amazon Redshift le permite configurar las reglas del firewall para controlar el acceso de red al clúster de almacén de datos. Puede ejecutar Amazon Redshift en Amazon Virtual Private Cloud (Amazon VPC) para aislar el clúster de almacenamiento de datos en su propia red virtual y conectarlo a la infraestructura de TI existente empleando conexiones IPsec VPN cifradas estándar del sector.

Auditoría y conformidad

Amazon Redshift se integra con AWS CloudTrail para que pueda auditar todas las llamadas a las API de Redshift. Amazon Redshift también registra todas las operaciones SQL, entre otras, los intentos de conexión, las consultas y los cambios realizados en la base de datos. Puede acceder a estos registros realizando consultas SQL en las tablas del sistema u optar por descargarlos en una ubicación segura de Amazon S3. Amazon Redshift cumple los requisitos SOC1, SOC2, SOC3 y PCI DSS Nivel 1. Para obtener más detalles, visite el Centro de conformidad de AWS.

Compatible

SQL

Amazon Redshift es una solución de almacén de datos SQL y utiliza las conexiones estándar del sector ODBC y JDBC. Puede descargar nuestros controladores JDBC y ODBC personalizados de la pestaña Connect Client de nuestra consola. Muchos proveedores populares de software han certificado Amazon Redshift con sus ofertas para permitirle seguir utilizando las herramientas que utiliza hoy en día. Consulte la página de socios de Amazon Redshift para obtener información detallada.

Integración

Amazon Redshift está integrado con otros servicios de AWS e incorpora comandos para cargar datos en paralelo en cada nodo de Amazon S3, Amazon DynamoDB o en los servidores de EC2 y de sus propias instalaciones con la utilización de SSH. AWS Data Pipeline, Amazon Kinesis y AWS Lambda se integran con Amazon Redshift como un destino de datos.

Jan	FEB	Mar
	10
2015	2016	2017