Upload
dinhkhue
View
227
Download
0
Embed Size (px)
Citation preview
Ediciones de Informatica Big Data Management
Beneficios• Comercialice productos y servicios
innovadores con más rapidez y mejore las operaciones del negocio
• Rebaje los costes de gestión del Big Data, al tiempo que gestiona el aumento en la complejidad y los volúmenes de datos
• Obtenga beneficios económicos y de rendimiento al ampliar la adopción de Hadoop a todos los proyectos
• Reduzca los riesgos al invertir en un software de integración de datos de probada eficacia que disimula la complejidad que conllevan las tecnologías emergentes y protege los datos sensibles
Conversión de petabytes en beneficiosConforme aumentan el ritmo del negocio y la abrumadora presión de la competencia sobre
las organizaciones para que transformen su actividad, se presenta la oportunidad de modernizar
y optimizar las arquitecturas de datos con el fin de convertir los datos en un activo estratégico
a la hora de tomar decisiones organizativas.
Las organizaciones se sirven de los datos para marcar la diferencia e impulsar su crecimiento;
de ellos extraen información única que permite aumentar la rentabilidad, detectar oportunidades,
acelerar la entrega de productos o servicios y ofrecer experiencias excepcionales a los clientes. Los
datos también incrementan la eficacia operativa, al mismo tiempo que reducen los riesgos derivados
de fraudes, actividades delictivas, el tiempo de inactividad del sistema o los fallos de seguridad.
Informatica Big Data Management constituye la primera y más completa solución del sector
para la gestión de datos, con una arquitectura idónea para la incorporación, el procesamiento,
la limpieza, la gobernanza y la protección del Big Data a escala. Informatica ofrece una solución
única e integrada que aúna la integración, la calidad, la gobernanza y la seguridad del Big Data.
Integración dinámica y optimizada del Big Data
Informatica Big Data Management facilita la incorporación de datos de gran rendimiento
y el procesamiento a escala de la integración de datos para que los analistas de negocio tomen
decisiones más acertadas con herramientas de análisis de última generación. Los centenares
de conectores preintegrados de gran rendimiento, las transformaciones de integración de datos
y los analizadores permiten que prácticamente cualquier tipo de dato se incorpore y procese
con rapidez en plataformas de Big Data como Hadoop, NoSQL y dispositivos de procesamiento
paralelo masivo. La parametrización y los mappings dinámicos permiten la automatización
de los programas de los procesos de integración de datos.
La productividad y la facilidad del mantenimiento también se mejoran al generar automáticamente
tipos de flujo de datos en tiempo de ejecución basados en patrones de diseño que utilizan solo
unas cuantas plantillas. La compatibilidad con los esquemas dinámicos facilita el procesamiento
de formatos de datos flexibles. Los motores optimizados ofrecen una utilización de recursos
y un rendimiento máximos para conseguir la integración de datos a escala. Por ejemplo,
Informatica optimiza las cargas de trabajo del Big Data al utilizar MapReduce y el nuevo motor
Blaze de Informatica a través de YARN.
1
Hoja de datos
Gobernanza y calidad del Big Data de principio a fin
La gobernanza y la calidad del Big Data de principio a fin implica que los usuarios tanto
de TI como del negocio pueden emplear los datos con total confianza. Informatica Big Data
Management ofrece una experiencia intuitiva a los usuarios sin conocimientos técnicos, lo que
facilita la eficaz colaboración entre especialistas en datos, analistas de datos y usuarios del
negocio. La detección y el perfilado de datos, incluido el perfilado de reglas de negocio, ponen
de manifiesto las anomalías y los problemas relacionados con la calidad de los datos; además,
resulta sencillo crear reglas y alertas de supervisión que señalen los problemas de calidad
y faciliten su seguimiento.
Es posible implantar en Hadoop reglas de calidad de datos y validación de direcciones con
el fin de limpiar y preparar los datos a escala, de modo que sirvan a su finalidad concreta.
Live Data Map, que es un gráfico de conocimientos y un catálogo de metadatos universal, permite
buscar, detectar y comprender los datos empresariales, así como aprovechar Spark para crear
gráficos de conocimientos a escala con rapidez. El linaje de datos de principio a fin más allá
de Hadoop respalda el cumplimiento y permite tanto realizar análisis de impacto como detectar
las principales causas de los problemas de la calidad de datos de forma eficaz.
Seguridad del Big Data centrada en los riesgos
La seguridad del Big Data centrada en los riesgos analiza todos los datos a fin de detectar
enseguida los riesgos o las vulnerabilidades y actuar en consecuencia. Para hacerlo, hace falta
una visión integral de los datos sensibles, sustentada con análisis de riesgos y protección basada
en políticas de los datos en riesgo. La seguridad del Big Data emprende, entonces, la disociación
de la información controlada tanto por las políticas empresariales como por la normativa del
sector. Informatica Big Data Management ofrece un enmascaramiento de datos persistente
y no intrusivo como opción para proteger los datos sensibles en los entornos de desarrollo
y producción de Hadoop y, por ende, minimizar los posibles fallos en la seguridad.
“El cliente es el foco donde centramos toda nuestra actividad. Western Union
tiene en sus manos la oportunidad única de aprovechar el potencial de los
análisis de datos para identificar las tendencias que deben moldear nuestro
negocio y mejorar la experiencia de los clientes en lo sucesivo. Esperamos
seguir colaborando con Informatica para aprovechar el auténtico potencial
de la escala mundial de nuestro negocio y nuestra base de clientes”.
— Sanjay Saraf, vicepresidente sénior y director tecnológico Western Union
Ediciones de Informatica Big Data Management 2
Funciones principalesIntegración de datos (ETL) en Hadoop
Esta solución ofrece una amplia biblioteca de funcionalidades preintegradas de transformación
e integración de datos que se ejecutan de forma nativa en Hadoop para que se pueda procesar
todo tipo de datos a cualquier escala, de terabytes a petabytes. El equipo de TI puede desarrollar
con rapidez flujos de datos en Hadoop utilizando un entorno de desarrollo visual que hasta
quintuplica la productividad con respecto a la codificación manual.
Esquemas dinámicos y plantillas de mapping
Informatica Big Data Management permite generar centenares de flujos de datos de tiempo
de ejecución sobre la base de apenas unos cuantos patrones de diseño gracias a las plantillas
de mapping. Estos mappings resultan fáciles de parametrizar de modo que gestionen esquemas
dinámicos (como los archivos de registro web y automáticos), que aparecen con frecuencia
en los proyectos de Big Data. Así, puede crear de forma rápida flujos de datos con un mantenimiento
sencillo y flexibilidad para adaptarse a los cambios en los esquemas.
Perfilado de datos en Hadoop
Los datos de Hadoop se pueden perfilar mediante la herramienta de desarrollo de Informatica
y una herramienta de análisis basada en navegador. Esto facilita que los desarrolladores, analistas
y expertos en datos puedan comprender los datos, identificar antes los conflictos relacionados
con los datos, colaborar en las especificaciones del flujo de datos y validar la transformación
de mapeo y la lógica de las reglas.
Informatica Big Data Management hasta quintuplica la productividad con respecto a la codificación manual gracias al entorno de desarrollo visual que ofrece transformaciones preintegradas y que favorece la reutilización.
Ediciones de Informatica Big Data Management 3
Calidad de datos en Hadoop
Realice la limpieza, la correspondencia y la estandarización de datos de cualquier tipo y volumen
de forma nativa en Hadoop para ofrecer datos fidedignos y fiables. Use un amplio conjunto
de reglas de calidad de datos preintegradas o cree las suyas propias con el entorno de desarrollo
visual. Ejecute la validación de direcciones para analizar, limpiar, estandarizar y enriquecer
los datos de direcciones globales.
Análisis de datos complejos en Hadoop
Informatica Big Data Management facilita tanto el acceso a datos complejos, multiestructurados,
no estructurados y estándar del sector (como registros web, JSON, XML o datos automáticos)
como su análisis. También incluye analizadores preintegrados para datos de mercado y estándares
del sector como SWIFT, ACORD, HL7, HIPAA y EDI.
Catálogo de metadatos universal
Ahora, los analistas de datos y los especialistas en datos cuentan con una visión integral de sus
datos con Live Data Map, un catálogo de metadatos universal y un gráfico de conocimientos para
buscar, detectar y comprender los datos empresariales. Live Data Map aprovecha Spark para
crear gráficos de conocimientos a escala con rapidez.
Linaje de datos de principio a fin
A fin de garantizar la fiabilidad y el cumplimiento de las normativas, los analistas de datos y los
usuarios de negocio pueden consultar el completo linaje de datos de principio a fin. Este linaje de
datos visual incluye un historial detallado de todas las transferencias y transformaciones de datos
(en Hadoop y en los sistemas tradicionales) en su recorrido completo desde las aplicaciones
de destino hasta los sistemas de origen originales. Tanto la búsqueda como la colaboración
entre los equipos de TI y de negocio se mejoran con el glosario de términos de negocio comunes,
los cuales guardan relación con los objetos de datos y su linaje de datos correspondiente.
Enmascaramiento de datos persistente en Hadoop
La opción Persistent Data Masking aumenta la seguridad y la privacidad de los datos mediante
la desensibilización y la disociación de los datos sensibles. Los datos enmascarados conservan
el contexto y la integridad referencial sigue siendo coherente, por lo que los datos enmascarados
se pueden utilizar en entornos de pruebas, análisis o soporte.
Acceso universal a datos
El equipo de TI tiene acceso a todos los tipos de Big Data de transacciones, incluidos RDBMS,
OLTP, OLAP, ERP, CRM, mainframe y cloud, entre otros. También puede acceder a los datos
de redes sociales, archivos de registro, sensores de máquinas, Hadoop, formatos NoSQL,
documentos o mensajes de correo electrónico, así como otros tipos y almacenes de datos
no estructurados o multiestructurados.
Ediciones de Informatica Big Data Management 4
Incorporación y extracción de datos a gran velocidad
Puede acceder al Big Data, cargarlo, transformarlo y extraerlo entre sistemas de origen
y de destino o directamente en Hadoop, en almacenes de datos de NoSQL o en su data
warehouse. La conectividad de alto rendimiento a través de API nativas con los sistemas
de origen y de destino con procesamiento paralelo garantiza la incorporación y extracción
de los datos a alta velocidad.
Detección de datos en Hadoop
Automatice la detección de relaciones y dominios de datos en Hadoop. Por ejemplo, detecte los
datos sensibles o los conjuntos de datos relacionados con clientes y productos (como números
de la seguridad social o números de tarjetas de crédito) a fin de enmascararlos con fines
de cumplimiento.
Procesamiento de lenguaje natural en Hadoop
Use una lista de palabras clave o frases para extraer y clasificar fácilmente entidades
relacionadas con los clientes y los productos a partir de datos no estructurados (como mensajes
de correo electrónico, datos de redes sociales, reclamaciones de seguros, registros de servicios
y documentos) mediante el análisis de textos y el reconocimiento de entidades con nombre.
Podrá enriquecer los datos maestros con información detallada del comportamiento de los
clientes o con información sobre productos, como pueden ser precios competitivos.
Diseño único para una implantación más rápida
El ecosistema de Hadoop varía de forma acelerada con las innovaciones que aporta sin cesar
la comunidad de código abierto. Big Data Management se basa en la estructura de código abierto
de Hadoop y conserva la lógica entera de transformación en los procesos de datos. Por eso,
los desarrolladores solo tienen que realizar un diseño, aunque no posean ningún conocimiento
especializado de los conceptos y los lenguajes de Hadoop, para después implantar sin problemas
los procesos de datos sin necesidad de realizar modificaciones cada vez que cambie Hadoop.
Como consecuencia, las innovaciones en Hadoop se implementan antes, pero con menos
impacto y menos riesgos para los sistemas de producción.
Ediciones de Informatica Big Data Management 5
Compare estas ediciones de Informatica Big Data Management para seleccionar la que mejor se ajuste a sus necesidades.
Enterprise Advanced
Conectividad con bases de datos, Hadoop, redes sociales y aplicaciones
● ●
Incorporación de datos de alta velocidad ● ●
Integración de datos en Hadoop ● ●
Optimización de pushdown de bases de datos ● ●
Detección de dominios y perfilado de datos en Hadoop ● ●
Análisis de datos complejos ● ●
Análisis de textos: reconocimiento de entidades con nombre
● ●
Esquemas dinámicos y plantillas de mapping ● ●
Catálogo de metadatos universal ● ●
Linaje de datos de principio a fin. ● ●
Calidad de datos en Hadoop ●
Validación de direcciones en Hadoop ●
Business GlossaryLimitado a entornos
de Big Data
Cien (100) usuarios identificados por analistas de datos de Informatica
● ●
Soporte (incluido solo con la licencia de suscripción) 8 x 5 24 x 7
Ediciones de Informatica Big Data Management 6
IN06_1012_02194Informatica en España, José Echegaray 8, edif. 3, PB 3, 28232 Las Rozas, Madrid Teléfono: 902 882 062www.informatica.com/es www.informatica.com linkedin.com/company/informatica twitter.com/Informatica
© Copyright Informatica LLC 2018. Todos los derechos reservados. Informatica® y Put potential to work™ son marcas comerciales o marcas comerciales registradas de Informatica Corporation en Estados Unidos y en jurisdicciones de todo el mundo. Todos los demás nombres de compañías y productos pueden ser nombres comerciales o marcas comerciales.
Acerca de Informatica
Informatica es un proveedor de software independiente líder centrado en ofrecer innovaciones transformadoras para el futuro de todos los aspectos relacionados con los datos. Empresas de todo el mundo confían en Informatica para aprovechar su potencial de información y cumplir los principales imperativos de negocio. Más de 5.800 empresas dependen de Informatica para aprovechar al máximo sus activos de información guardados en entornos locales, en el cloud y en Internet, incluidas las redes sociales.
Beneficios principalesComercialice productos y servicios innovadores con más rapidez
Con Informatica Big Data Management, los analistas de datos y los especialistas en datos se
pueden centrar en la información nueva que aportan los datos (en lugar de en la integración de
datos), la cual sirve a la empresa para desarrollar productos y servicios innovadores. Proporciona
un entorno de desarrollo de integración de datos en el que se pueden importar los mappings
existentes de PowerCenter® y reutilizar los conocimientos de los recursos de Informatica. Ofrece
un entorno de desarrollo visual fácil de usar y un paradigma de procesos de desarrollo repetibles.
Amplía la integración de datos y la calidad de datos para incluir datos de redes sociales, registros
web, datos de sensores de dispositivos, documentos, mensajes de correo electrónico y otros datos
multiestructurados o no estructurados sin requerir codificación manual. El resultado es que esta
solución aumenta de forma considerable la productividad del equipo de TI y agiliza la implantación.
Rebaje los costes de los proyectos de Big Data
Informatica Big Data Management rebaja los costes del Big Data. Puede descargar los datos
del warehouse y los sistemas de origen, además de descargar el procesamiento en hardware de
bajo coste. Al abandonar la codificación manual en favor de estas herramientas de productividad
de eficacia probada para la integración de datos, hasta quintuplica la productividad. Basta con
realizar el diseño una vez e implantarlo después en cualquier lugar, lo que mantiene controlados
los costes al optimizar la utilización del procesamiento de datos tanto en las plataformas
de datos existentes como en las tecnologías emergentes como Hadoop.
Amplíe la adopción de Hadoop a toda la empresa
Informatica Big Data Management permite generalizar la adopción de Hadoop en múltiples
proyectos. Ya no hace falta recurrir a la codificación manual en Java MapReduce, Python
o lenguajes de creación de secuencias para obtener los beneficios económicos y de rendimiento
de Hadoop: puede acudir a los más de 100.000 desarrolladores formados por Informatica de todo
el mundo para que se encarguen de sus proyectos de Big Data. Esta solución es más fácil de
administrar y admite varios proyectos de Big Data. Garantiza un rendimiento óptimo de principio
a fin, refuerza la confianza gracias al linaje de datos de principio a fin, aporta seguridad para
minimizar los riesgos y acelera la implantación.
Minimice el riesgo de adoptar nuevas tecnologías
Informatica Big Data Management minimiza los riesgos asociados a las tecnologías más modernas
como Hadoop. Su organización de IT únicamente realizará una inversión que funcionará tanto
con las tecnologías emergentes como con las infraestructuras de datos tradicionales. Esta solución
minimiza tanto el impacto como los riesgos de los esquemas dinámicos, ya que asegura la protección
de los datos sensibles. Ofrece un método único y coherente de integración de datos para todos
los tipos de datos. Dado que las nuevas tecnologías como Hadoop no dejan de evolucionar,
Informatica Big Data Management garantiza la fácil adopción de cualquier innovación sin tener
que crear de nuevo los mappings ni los flujos de datos.