Los científicos, desarrolladores y muchos otros tecnólogos de diferentes sectores se benefician de Amazon Web Services para realizar análisis de big data y afrontar los desafíos que plantean el aumento del volumen, la variedad y la velocidad de la información digital. Amazon Web Services ofrece un conjunto exhaustivo e integral de servicios de informática en la nube para ayudar a gestionar big data gracias a la reducción de costos, el escalado para atender la demanda y el aumento de la velocidad de la innovación.
Consulte las soluciones de big data de AWS para cada fase del ciclo de vida de big data:
Recopilar > Transmitir > Almacenar > RDBMS | Almacén de datos | NoSQL > Análisis > Archivado
Nunca ha sido tan sencillo ponerse al día con los big data en la nube. Explore la sección Introducción, donde encontrará tutoriales y recursos para ayudarle a comenzar con sus primer proyecto.
En este breve vídeo se describe cómo utilizar Amazon Web Services para ayudarle a comprender mejor cómo funciona el negocio con ayuda de la tecnología de big data. Aprenderá cómo puede utilizar las tecnologías de big data que mejor conoce, como Pig, Hive, Spark y Hadoop, entre otras, para que tarde menos tiempo en terminar su proyecto de big data
Este nuevo documento técnico ofrece un resumen de las diferentes opciones de big data disponibles en la nube de AWS para arquitectos, científicos de datos y desarrolladores. En cada una de las opciones de análisis de big data, este documento describe lo siguiente : Patrones de uso ideal, Rendimiento, Durabilidad y disponibilidad, Modelo de costos, Escalabilidad, Elasticidad, Interfaces y Antipatrones. Este documento describe dos supuestos que demuestran el uso de las opciones de análisis y ofrecen recursos adicionales para empezar con los análisis de big data en AWS.
El blog de big data de AWS está pensado para que arquitectos de soluciones, científicos de datos y desarrolladores aprendan prácticas recomendadas para big data, para que descubran qué servicios gestionados de big data de AWS son la mejor opción para cada uso, y para empezar a profundizar en los servicios de big data de AWS. El objetivo de este blog es convertirse en un lugar de encuentro para descubrir nuevas maneras de recopilar, almacenar, procesar y visualizar datos a cualquier escala. Los lectores encontrarán tutoriales cortos con ejemplos de código, casos prácticos que demuestran las ventajas específicas de trabajar con big data en AWS, anuncios de nuevas características, demostraciones y tutoriales elaborados por socios y clientes, además de consejos y prácticas recomendadas para el uso de los servicios de big data de AWS.
Obtenga información acerca de cómo implementar un panel con ventana desplegable en tiempo real con Amazon Kinesis y Apache Storm
Da la impresión que de que hoy en día todo y todos generan datos, desde sus clientes de las redes sociales a las instancias que ejecutan sus aplicaciones web. AWS facilita la provisión de los servicios de almacenamiento, informática y bases de datos necesarios para convertir dichos datos en información para su empresa. AWS también tiene servicios de transferencia de datos que pueden desplazar big data dentro y fuera de la nube con rapidez, como AWS Direct Connect y nuestro servicio Import/Export. Además, todo el tráfico de datos entrante en AWS es gratuito.
Obtenga información sobre cómo transferir discos duros a la nube con AWS Import/Export »
RDS está disponible para MySQL, PostgreSQL, Oracle y SQL Server.
Amazon Kinesis es un servicio gestionado para el procesamiento en tiempo real de big data de transmisión. Amazon Kinesis admite el rendimiento de datos de megabytes a gigabytes de datos por segundo y permite escalar sin problemas para gestionar transmisiones de cientos de miles de orígenes distintos. Diseñado para proporcionar una alta disponibilidad y durabilidad de manera rentable, ahora puede centrarse en evaluar sus datos, lo que le permitirá tomar mejores decisiones más rápido y con un coste menor.
Independientemente de que almacene datos farmacéuticos para análisis, datos financieros para cálculos y precios o archivos multimedia como fotos y vídeos, Amazon Simple Storage Service (S3) es la solución de almacenamiento en la nube de big data ideal para guardar contenido original de forma duradera. Amazon S3 se ha diseñado para ofrecer un 99,9999999999% de durabilidad sin ni un solo punto de fallo, por lo que se trata del almacén de objetos fundamental para big data.
Más información sobre Amazon S3 »
Amazon Elastic Block Store (EBS) ofrece discos duros para un almacenamiento persistente de máquinas virtuales. Los volúmenes de Amazon EBS ofrecen el rendimiento estable y de baja latencia necesario para ejecutar cargas de trabajo de big data, como bases de datos relacionales propias o bases de datos NoSQL, aplicaciones empresariales y sistemas de archivos de red distribuidos de alto rendimiento.
El almacenamiento de datos NoSQL se beneficia en gran medida de la velocidad de las unidades de estado sólido (SSD). Amazon DynamoDB las utiliza de forma predeterminada, pero si está empleando una opción distinta a AWS Marketplace, como Cassandra o MongoDB, puede acelerar el acceso mediante terabytes de almacenamiento de estado sólido bajo demanda, con la clase de instancias de E/S elevada.
Más información sobre las opciones con los tipos de instancias de EC2 »
Si necesita una base de datos NoSQL sin la carga operativa para ejecutarla, Amazon DynamoDB es la mejor opción. Se trata de un servicio de bases de datos NoSQL rápido y totalmente gestionado que permite almacenar y recuperar de manera fácil y económica cualquier cantidad de datos, así como atender cualquier nivel de tráfico de solicitudes.
Amazon DynamoDB ofrece rendimiento garantizado aprovisionado y una latencia de milisegundos de un solo dígito, lo que lo convierten en la opción ideal para aplicaciones de juegos, de tecnología publicitaria, móviles y muchas otras aplicaciones de big data.
La innovación en los big data va más allá de NoSQL, versa más sobre ofrecer la tecnología apropiada para utilizarla con sus datos en función de las necesidades empresariales. Las bases de datos relacionales ofrecen un rendimiento rápido, predecible y coherente; de hecho, están optimizadas para cargas de trabajo transaccionales como puntos de venta o historiales financieros. Las bases de datos relacionales desempeñan una función complementaria para las bases de datos NoSQL en numerosas arquitecturas integrales de big data.
Amazon RDS le facilita las tareas de configuración, utilización y escalado de bases de datos relacionales en la nube. Proporciona capacidad rentable y de tamaño modificable y, al mismo tiempo, gestiona las tediosas tareas de administración de la base de datos, lo que le permite centrarse en sus aplicaciones y en su negocio.
Amazon Redshift proporciona un almacén de datos con escalado de petabytes rápido y completamente gestionado por menos de 1 000 USD por terabyte/año. Amazon Redshift ofrece un rápido rendimiento de consulta y E/S para conjuntos de datos de prácticamente cualquier tamaño mediante la utilización de la tecnología de almacenamiento en columnas y la paralelización y distribución de consultas entre varios nodos. En cuestión de minutos, puede aprovisionar con facilidad un almacén de datos completamente gestionado con copias de seguridad automatizadas y cifrado integrado. Conéctelo de forma sencilla a sus herramientas de inteligencia empresarial existentes.
Amazon Elastic MapReduce (EMR) ofrece la potente estructura de Apache Hadoop en Amazon EC2 como un servicio gestionado fácil de utilizar. Con Amazon EMR, puede centrarse en las solicitudes de asignación/reducción y beneficiarse de las ventajas del amplio ecosistema de herramientas de Hadoop, a la vez que realiza la implementación en la plataforma de una infraestructura segura y a gran escala. Ejecute trabajos de análisis de big data en la nube de forma sencilla; deje que Amazon EMR se encargue de gestionar los clústeres de Hadoop.
¿Qué rapidez adquiriría su proyecto con otras 1 000 máquinas virtuales? ¿Y con 10 000? Amazon Spot Market, integrado en Amazon Elastic MapReduce, le permite escoger su propio precio para los recursos informáticos que necesite para realizar análisis con la informática en la nube. Esto quiere decir que puede buscar su propio equilibrio entre coste y rendimiento, recurriendo al overclocking de la analítica cuando sea necesario o reduciendo los costos significativamente.
Amazon Glacier le permite liberarse de la tediosa tarea administrativa de operar y calcular el almacenamiento de archivos y dejarla en manos de AWS y, a su vez, hace que conservar los datos por largos períodos, ya sean años o décadas, sea una tarea sencilla. Amazon Glacier es un servicio de almacenamiento en la nube por un coste sumamente bajo a partir de 0,01 USD por GB al mes. No existen compromisos de tarifas a largo plazo y todos los gastos operativos constantes están incluidos en el precio.

