📚 Tutorial: AWS | Análisis de Big Data y almacenamiento en la nube

Los científicos, desarrolladores y muchos otros tecnólogos de diferentes sectores se benefician de Amazon Web Services para realizar análisis de big data y afrontar los desafíos que plantean el aumento del volumen, la variedad y la velocidad de la información digital. Amazon Web Services ofrece un conjunto exhaustivo e integral de servicios de informática en la nube para ayudar a gestionar big data gracias a la reducción de costos, el escalado para atender la demanda y el aumento de la velocidad de la innovación.

Cree una cuenta gratuita

Contactar con el departamento de ventas

Consulte las soluciones de big data de AWS para cada fase del ciclo de vida de big data:

Recopilar > Transmitir > Almacenar > RDBMS | Almacén de datos | NoSQL > Análisis > Archivado

Nunca ha sido tan sencillo ponerse al día con los big data en la nube. Explore la sección Introducción, donde encontrará tutoriales y recursos para ayudarle a comenzar con sus primer proyecto.

Descubra cómo puede utilizar AWS para big data

En este breve vídeo se describe cómo utilizar Amazon Web Services para ayudarle a comprender mejor cómo funciona el negocio con ayuda de la tecnología de big data. Aprenderá cómo puede utilizar las tecnologías de big data que mejor conoce, como Pig, Hive, Spark y Hadoop, entre otras, para que tarde menos tiempo en terminar su proyecto de big data

Big Data Video Still — Big data en Amazon Web Services

"La implementación automatizada de infraestructura es esencial para nosotros". »

Illumina utiliza AWS para cargar datos de secuenciadores de ADN y para almacenar datos. »

Ahorraron 55 000 USD en costos anticipados y pusieron el sistema en funcionamiento en cuestión de días. »

"Gracias a AWS, cada mes dedicamos tan solo dos días a la infraestructura". »

Nokia analiza las sensaciones de los usuarios de redes sociales en decenas de TB de datos con ayuda de AWS. »

Se han cargado 37 millones de registros en 90 minutos »

CAL AMP Lab construye tecnologías escalables para aprendizaje automático y análisis de datos en AWS »

En menos de 30 segundos, Sumo Logic puede procesar datos y utiliza AWS para almacenar TB de datos a diario. »

Novedades

Documento técnico sobre las opciones de análisis de big data en AWS

pp_img_3_col_img_whitepaper_1_378x171 — Descargue una copia del documento técnico Big Data Analytics Options on AWS

Este nuevo documento técnico ofrece un resumen de las diferentes opciones de big data disponibles en la nube de AWS para arquitectos, científicos de datos y desarrolladores. En cada una de las opciones de análisis de big data, este documento describe lo siguiente : Patrones de uso ideal, Rendimiento, Durabilidad y disponibilidad, Modelo de costos, Escalabilidad, Elasticidad, Interfaces y Antipatrones. Este documento describe dos supuestos que demuestran el uso de las opciones de análisis y ofrecen recursos adicionales para empezar con los análisis de big data en AWS.

Descargue este documento técnico »

Consulte el blog sobre big data de AWS

El blog de big data de AWS está pensado para que arquitectos de soluciones, científicos de datos y desarrolladores aprendan prácticas recomendadas para big data, para que descubran qué servicios gestionados de big data de AWS son la mejor opción para cada uso, y para empezar a profundizar en los servicios de big data de AWS. El objetivo de este blog es convertirse en un lugar de encuentro para descubrir nuevas maneras de recopilar, almacenar, procesar y visualizar datos a cualquier escala. Los lectores encontrarán tutoriales cortos con ejemplos de código, casos prácticos que demuestran las ventajas específicas de trabajar con big data en AWS, anuncios de nuevas características, demostraciones y tutoriales elaborados por socios y clientes, además de consejos y prácticas recomendadas para el uso de los servicios de big data de AWS.

Ver el blog de big data de AWS »

Capacidades

Recopile big data en la nube con facilidad

Da la impresión que de que hoy en día todo y todos generan datos, desde sus clientes de las redes sociales a las instancias que ejecutan sus aplicaciones web. AWS facilita la provisión de los servicios de almacenamiento, informática y bases de datos necesarios para convertir dichos datos en información para su empresa. AWS también tiene servicios de transferencia de datos que pueden desplazar big data dentro y fuera de la nube con rapidez, como AWS Direct Connect y nuestro servicio Import/Export. Además, todo el tráfico de datos entrante en AWS es gratuito.

Obtenga información sobre cómo transferir discos duros a la nube con AWS Import/Export »

Obtenga información sobre cómo disponer de línea de fibra privada en la nube con AWS Direct Connect »

integ-cloud-backup — RDS está disponible para MySQL, PostgreSQL, Oracle y SQL Server.

Análisis y transmisión de big data en tiempo real

kinesis-thumb2 — Vea el vídeo de introducción a Amazon Kinesis

Amazon Kinesis es un servicio gestionado para el procesamiento en tiempo real de big data de transmisión. Amazon Kinesis admite el rendimiento de datos de megabytes a gigabytes de datos por segundo y permite escalar sin problemas para gestionar transmisiones de cientos de miles de orígenes distintos. Diseñado para proporcionar una alta disponibilidad y durabilidad de manera rentable, ahora puede centrarse en evaluar sus datos, lo que le permitirá tomar mejores decisiones más rápido y con un coste menor.

Más información acerca de Amazon Kinesis »

Soluciones de almacenamiento en la nube de big data

Independientemente de que almacene datos farmacéuticos para análisis, datos financieros para cálculos y precios o archivos multimedia como fotos y vídeos, Amazon Simple Storage Service (S3) es la solución de almacenamiento en la nube de big data ideal para guardar contenido original de forma duradera. Amazon S3 se ha diseñado para ofrecer un 99,9999999999% de durabilidad sin ni un solo punto de fallo, por lo que se trata del almacén de objetos fundamental para big data.

Más información sobre Amazon S3 »

Amazon Elastic Block Store (EBS) ofrece discos duros para un almacenamiento persistente de máquinas virtuales. Los volúmenes de Amazon EBS ofrecen el rendimiento estable y de baja latencia necesario para ejecutar cargas de trabajo de big data, como bases de datos relacionales propias o bases de datos NoSQL, aplicaciones empresariales y sistemas de archivos de red distribuidos de alto rendimiento.

Más información sobre Amazon EBS »

Discos duros de estado sólido a su servicio

El almacenamiento de datos NoSQL se beneficia en gran medida de la velocidad de las unidades de estado sólido (SSD). Amazon DynamoDB las utiliza de forma predeterminada, pero si está empleando una opción distinta a AWS Marketplace, como Cassandra o MongoDB, puede acelerar el acceso mediante terabytes de almacenamiento de estado sólido bajo demanda, con la clase de instancias de E/S elevada.

Más información sobre las opciones con los tipos de instancias de EC2 »

Escale su base de datos NoSQL sin límites ni problemas

Si necesita una base de datos NoSQL sin la carga operativa para ejecutarla, Amazon DynamoDB es la mejor opción. Se trata de un servicio de bases de datos NoSQL rápido y totalmente gestionado que permite almacenar y recuperar de manera fácil y económica cualquier cantidad de datos, así como atender cualquier nivel de tráfico de solicitudes.

Amazon DynamoDB ofrece rendimiento garantizado aprovisionado y una latencia de milisegundos de un solo dígito, lo que lo convierten en la opción ideal para aplicaciones de juegos, de tecnología publicitaria, móviles y muchas otras aplicaciones de big data.

Más información sobre Amazon DynamoDB »

Los big data no se limitan a NoSQL; las bases de datos relacionales también trabajan a lo grande

test-database — Más información de Amazon RDS

La innovación en los big data va más allá de NoSQL, versa más sobre ofrecer la tecnología apropiada para utilizarla con sus datos en función de las necesidades empresariales. Las bases de datos relacionales ofrecen un rendimiento rápido, predecible y coherente; de hecho, están optimizadas para cargas de trabajo transaccionales como puntos de venta o historiales financieros. Las bases de datos relacionales desempeñan una función complementaria para las bases de datos NoSQL en numerosas arquitecturas integrales de big data.

Amazon RDS le facilita las tareas de configuración, utilización y escalado de bases de datos relacionales en la nube. Proporciona capacidad rentable y de tamaño modificable y, al mismo tiempo, gestiona las tediosas tareas de administración de la base de datos, lo que le permite centrarse en sus aplicaciones y en su negocio.

Más información sobre Amazon RDS »

Almacenamiento de datos con escalado de petabytes en cuestión de minutos

Amazon Redshift proporciona un almacén de datos con escalado de petabytes rápido y completamente gestionado por menos de 1 000 USD por terabyte/año. Amazon Redshift ofrece un rápido rendimiento de consulta y E/S para conjuntos de datos de prácticamente cualquier tamaño mediante la utilización de la tecnología de almacenamiento en columnas y la paralelización y distribución de consultas entre varios nodos. En cuestión de minutos, puede aprovisionar con facilidad un almacén de datos completamente gestionado con copias de seguridad automatizadas y cifrado integrado. Conéctelo de forma sencilla a sus herramientas de inteligencia empresarial existentes.

Más información acerca de Amazon Redshift »

Análisis de big data con Hadoop en AWS

Amazon Elastic MapReduce (EMR) ofrece la potente estructura de Apache Hadoop en Amazon EC2 como un servicio gestionado fácil de utilizar. Con Amazon EMR, puede centrarse en las solicitudes de asignación/reducción y beneficiarse de las ventajas del amplio ecosistema de herramientas de Hadoop, a la vez que realiza la implementación en la plataforma de una infraestructura segura y a gran escala. Ejecute trabajos de análisis de big data en la nube de forma sencilla; deje que Amazon EMR se encargue de gestionar los clústeres de Hadoop.

Más información sobre Amazon EMR »

Ahorre costes: ponga precio al uso de servidores desocupados

¿Qué rapidez adquiriría su proyecto con otras 1 000 máquinas virtuales? ¿Y con 10 000? Amazon Spot Market, integrado en Amazon Elastic MapReduce, le permite escoger su propio precio para los recursos informáticos que necesite para realizar análisis con la informática en la nube. Esto quiere decir que puede buscar su propio equilibrio entre coste y rendimiento, recurriendo al overclocking de la analítica cuando sea necesario o reduciendo los costos significativamente.

Introducción a instancias puntuales »

Archive datos COLD a un precio muy reducido

Amazon Glacier le permite liberarse de la tediosa tarea administrativa de operar y calcular el almacenamiento de archivos y dejarla en manos de AWS y, a su vez, hace que conservar los datos por largos períodos, ya sean años o décadas, sea una tarea sencilla. Amazon Glacier es un servicio de almacenamiento en la nube por un coste sumamente bajo a partir de 0,01 USD por GB al mes. No existen compromisos de tarifas a largo plazo y todos los gastos operativos constantes están incluidos en el precio.

Más información sobre Amazon Glacier »

Jan	FEB	Mar
	11
2015	2016	2017