Amazon Redshift es un almacén de datos rápido y totalmente gestionado a escala de petabytes que permite analizar todos los datos empleando de forma sencilla y rentable sus herramientas de inteligencia empresarial existentes. Comience con poca capacidad por 0,25 USD por hora sin asumir ningún compromiso y escale hasta varios petabytes por 1 000 USD por terabyte al año, menos de la décima parte del coste de las soluciones tradicionales. Por lo general, los clientes se benefician del triple de compresión, lo que reduce sus costes a 333 USD por terabyte sin comprimir al año.

Pruebe Amazon Redshift de forma gratuita

Realice una prueba gratuita
Más información

Consiga 750 horas gratis de DC1.Large al mes durante un periodo de dos meses.  Para iniciar la prueba:

Cree una cuenta de AWS e inscríbase en la consola de Amazon Redshift

Lance un clúster de Amazon Redshift y seleccione DC1.Large como tipo de nodo.

Registre e incorpore datos de manera gratuita con las pruebas gratuitas para socios




Amazon Redshift ofrece un rendimiento de consulta rápido gracias a la utilización de la tecnología de almacenamiento en columnas para mejorar la eficacia de E/S y realizar consultas en paralelo entre varios nodos. Amazon Redshift dispone de controladores JDBC y ODBC personalizados que puede descargar de la pestaña Connect Client de nuestra consola y que le permiten utilizar una amplia gama de clientes SQL. También puede utilizar controladores JDBC y ODBC PostgreSQL estándar. La velocidad de carga de los datos aumenta de manera lineal con respecto al tamaño del clúster, con integraciones en Amazon S3, Amazon DynamoDB, Amazon Elastic MapReduce, Amazon Kinesis o en cualquier otro host con SSH habilitado.

La arquitectura de almacenamiento de datos de Amazon Redshift le permite automatizar la mayoría de las tareas administrativas asociadas con el aprovisionamiento, la configuración y la supervisión de un almacén de datos en la nube. Las copias de seguridad en Amazon S3 son constantes, incrementales y automáticas. Las restauraciones son rápidas; puede empezar a consultar en cuestión de minutos mientras los datos se agrupan en segundo plano. Habilitar la recuperación de desastres entre regiones es una tarea que solo requiere unos cuantos clics.

La seguridad está integrada. Puede cifrar los datos en reposo y en tránsito con AES-256 acelerado por hardware y SSL, aislar los clústeres con Amazon VPC e incluso gestionar las claves mediante AWS Key Management Service (KMS) y módulos de seguridad de hardware (HSM). Se realiza un registro y una auditoría de todas las llamadas a las API, los intentos de conexión, las consultas y los cambios del clúster. Puede usar AWS CloudTrail para realizar una auditoría de las llamadas a la API de Redshift.

Amazon Redshift utiliza una serie de innovaciones para obtener un rendimiento muy alto de consulta en conjuntos de datos con una capacidad que oscila entre cien gigabytes y un petabyte o incluso más. Utiliza un almacenamiento en columna, compresión de datos y asignaciones de zona para reducir la cantidad de E/S necesaria para realizar consultas. Amazon Redshift cuenta con una arquitectura de almacenamiento de datos de procesamiento paralelo de forma masiva (MPP), que paraleliza y distribuye operaciones SQL para que pueda beneficiarse de todos los recursos disponibles. El hardware subyacente está diseñado para un procesamiento de datos de alto rendimiento, por lo que utiliza almacenamiento conectado local para maximizar el rendimiento entre las unidades y las CPU, y una red de maya 10 GigE para maximizar el rendimiento entre los nodos.

Con tan solo unos clics en AWS Management Console o con una sencilla llamada a una API, puede cambiar fácilmente el número o el tipo de nodos del almacén de datos en la nube a medida que cambian las necesidades de rendimiento o capacidad. Los nodos de almacenamiento denso (DS) le permiten crear almacenes de datos muy grandes con unidades de disco duro (HDD) por un precio muy bajo. Los nodos de informática densa (DC) le permiten crear almacenes de datos de rendimiento muy elevado con CPU rápidas, grandes cantidades de RAM y discos de estado sólido (SSD). Amazon Redshift le permite comenzar con un único nodo DC1.Large de 160 GB y, posteriormente, escalar a un petabyte o más de datos de usuario comprimidos mediante la utilización de nodos DS2.8XLarge de 16 TB. A medida que se adapta el tamaño, Amazon Redshift activará el modo de solo lectura en el clúster existente, aprovisionará un clúster nuevo del tamaño que desee y, a continuación, realizará copias paralelas en el nuevo clúster de los datos del clúster anterior. Puede continuar realizando consultas al clúster anterior mientras se aprovisiona el nuevo. Después de que los datos se hayan copiado al nuevo clúster, Amazon Redshift redirigirá las consultas automáticamente al nuevo clúster y eliminará el clúster anterior.

Solo tendrá que pagar por la capacidad que utilice. Puede elegir precios de instancias bajo demanda sin costos anticipados ni compromisos a largo plazo, o bien beneficiarse de tarifas significativamente reducidas con los precios aplicables a las instancias reservadas. Los precios bajo demanda comienzan desde tan solo 0,25 USD por hora para nodos DC1.Large de 160 GB o 0,85 USD por hora para nodos DS2.XLarge de 2 TB. En el caso de las instancias reservadas con pago parcial anticipado, puede reducir el precio efectivo a 0,10 USD por hora para los nodos DC1.Large (5 500 USD/TB/año) o a 0,228 USD por hora para nodos DS2.XLarge (999 USD/TB/año). Encontrará más detalles en la página de precios de Amazon Redshift.

Con tan solo unos clics en AWS Management Console o sencillas llamadas a la API, puede crear un clúster y especificar su tamaño, el tipo de nodo subyacente y el perfil de seguridad. Amazon Redshift aprovisionará los nodos, configurará las conexiones entre ellos y protegerá el clúster. El almacén de datos debe empezar a funcionar en pocos minutos.

Amazon Redshift procesa todo el trabajo necesario para gestionar, supervisar y escalar el almacén de datos, desde la supervisión del estado del clúster y la realización de copias de seguridad hasta la aplicación de revisiones y actualizaciones. A medida que sus necesidades de rendimiento y capacidad cambien, podrá cambiar el tamaño de su clúster fácilmente. Al ocuparse de la gestión de todas estas tareas que tanto trabajo y tiempo requieren, Amazon Redshift le permite concentrarse en los datos y en su empresa.

Amazon Redshift presenta varias características que mejoran la fiabilidad del clúster de almacén de datos. Todos los datos escritos en un nodo del clúster se replican automáticamente en los demás nodos del clúster y se realiza una copia de seguridad automática y constante de todos los datos en Amazon S3. Amazon Redshift supervisa constantemente el estado del clúster y automáticamente vuelve a replicar los datos desde unidades defectuosas y reemplaza los nodos según proceda.

La características de instantáneas automatizadas de Amazon Redshift realiza copias de seguridad constantemente de los nuevos datos del clúster en Amazon S3. Las instantáneas son constantes, incrementales y automáticas. Amazon Redshift almacena las instantáneas durante períodos definidos por el usuario, que pueden oscilar entre 1 y 35 días. También puede hacer sus propias instantáneas cuando lo desee, para lo que se sirve de las instantáneas existentes en el sistema y, además, se conservan hasta que las elimine explícitamente. Redshift también puede replicar de forma asíncrona las instantáneas en S3 en otra región para casos de recuperación de desastres. Después de eliminar un clúster, las instantáneas del sistema se eliminan, pero las instantáneas de usuario están disponibles hasta que se eliminan explícitamente.

Puede utilizar cualquier instantánea del sistema o del usuario para restablecer el clúster con AWS Management Console o con las API de Amazon Redshift. El clúster se encuentra disponible en cuanto se restablecen los metadatos del sistema, y puede comenzar a ejecutar consultas mientras los datos de usuario se ponen en cola en segundo plano.

Con tan solo ajustar un par de parámetros, puede configurar Amazon Redshift para utilizar SSL a fin de proteger los datos activos y el cifrado AES-256 acelerado por hardware de los datos inactivos. Si decide habilitar el cifrado de los datos inactivos, todos los datos que se graben en el disco se cifrarán de la misma forma que las copias de seguridad. De forma predeterminada, Amazon Redshift se encarga de gestionar las claves, pero puede optar por gestionarlas con módulos de seguridad de hardware (HSM) propios, AWS CloudHSMAWS Key Management Service.

Amazon Redshift le permite configurar las reglas del firewall para controlar el acceso de red al clúster de almacén de datos. Puede ejecutar Amazon Redshift en Amazon Virtual Private Cloud (Amazon VPC) para aislar el clúster de almacenamiento de datos en su propia red virtual y conectarlo a la infraestructura de TI existente empleando conexiones IPsec VPN cifradas estándar del sector.

Amazon Redshift se integra con AWS CloudTrail para que pueda auditar todas las llamadas a las API de Redshift. Amazon Redshift también registra todas las operaciones SQL, entre otras, los intentos de conexión, las consultas y los cambios realizados en la base de datos. Puede acceder a estos registros realizando consultas SQL en las tablas del sistema u optar por descargarlos en una ubicación segura de Amazon S3. Amazon Redshift cumple los requisitos SOC1, SOC2, SOC3 y PCI DSS Nivel 1. Para obtener más detalles, visite el Centro de conformidad de AWS.

Amazon Redshift es una solución de almacén de datos SQL y utiliza las conexiones estándar del sector ODBC y JDBC. Puede descargar nuestros controladores JDBC y ODBC personalizados de la pestaña Connect Client de nuestra consola. Muchos proveedores populares de software han certificado Amazon Redshift con sus ofertas para permitirle seguir utilizando las herramientas que utiliza hoy en día. Consulte la página de socios de Amazon Redshift para obtener información detallada.

Amazon Redshift está integrado con otros servicios de AWS e incorpora comandos para cargar datos en paralelo en cada nodo de Amazon S3, Amazon DynamoDB o en los servidores de EC2 y de sus propias instalaciones con la utilización de SSH. AWS Data Pipeline, Amazon Kinesis y AWS Lambda se integran con Amazon Redshift como un destino de datos.