Éditions Informatica Big Data Management

7
Éditions Informatica Big Data Management Bénéfices • Commercialisation plus rapide des produits et services innovants et amélioration des opérations métiers • Réduction du coût de gestion des Big Data et capacité à gérer la complexité accrue des données et l'explosion des volumes de données • Amélioration des performances et réduction des coûts via l'adoption de Hadoop sur l'ensemble des projets • Réduction des risques via un logiciel éprouvé d'intégration des données qui masque la complexité des nouvelles technologies et protège les données sensibles Transformez les pétaoctets en bénéfices Alors que le rythme des activités s'accélère et que les entreprises font face à une pression considérable de la part de leurs concurrents qui les oblige à transformer leurs activités, elles ont aujourd'hui l'opportunité de moderniser et d'optimiser leurs architectures de données et de faire de leurs données des ressources stratégiques pour leurs prises de décisions organisationnelles. Les entreprises utilisent les données pour se démarquer et prospérer. Les données sont en effet des mines de renseignements qui leur permettent d'accroître leur rentabilité, de découvrir de nouvelles opportunités, d'accélérer la livraison de leurs produits et services et d'offrir à leurs clients une expérience d'une qualité exceptionnelle. Les données peuvent également augmenter l'efficacité opérationnelle et atténuer les risques associés à la fraude, à la criminalité, aux temps d'arrêt système ou aux atteintes à la sécurité. Informatica Big Data Management est la solution de gestion de données du marché la plus complète et la première dont l'architecture est conçue pour ingérer, traiter, nettoyer, gouverner et sécuriser les Big Data à grande échelle. La solution Informatica conjugue intégration, qualité, gouvernance et sécurité des Big Data sous la forme d'une solution intégrée unique. Intégration dynamique et optimisée des Big Data Informatica Big Data Management offre une ingestion haut débit des données et un traitement à grande échelle, afin que les analystes métiers puissent prendre des décisions éclairées à l'aide d'outils d'analyse de nouvelle génération. Des centaines de connecteurs prédéfinis hautement performants, de transformations d'intégration de données et d'analyseurs permettent d'ingérer et de traiter rapidement quasiment tous types de données sur les plates-formes Big Data, telles que Hadoop, NoSQL et les appliances MPP. Un paramétrage et des mappings dynamiques favorisent l'automatisation de la programmation des processus d'intégration de données. La génération automatique de classes complètes de flux de données lors de l'exécution, basée sur des schémas de conception n'utilisant qu'une poignée de modèles, augmente considérablement la productivité et la facilité de maintenance. Le support des schémas dynamiques permet de traiter des formats de données flexibles. Les moteurs optimisés offrent des performances et une utilisation des ressources maximales pour une intégration de données à grande échelle. Par exemple, pour optimiser les charges de travail des Big Data, Informatica utilise MapReduce et le nouveau moteur Blaze d'Informatica via YARN. 1 Fiche technique

Transcript of Éditions Informatica Big Data Management

Page 1: Éditions Informatica Big Data Management

Éditions Informatica Big Data Management

Bénéfices• Commercialisation plus rapide

des produits et services innovants et amélioration des opérations métiers

• Réduction du coût de gestion des Big Data et capacité à gérer la complexité accrue des données et l'explosion des volumes de données

• Amélioration des performances et réduction des coûts via l'adoption de Hadoop sur l'ensemble des projets

• Réduction des risques via un logiciel éprouvé d'intégration des données qui masque la complexité des nouvelles technologies et protège les données sensibles

Transformez les pétaoctets en bénéficesAlors que le rythme des activités s'accélère et que les entreprises font face à une pression

considérable de la part de leurs concurrents qui les oblige à transformer leurs activités, elles ont

aujourd'hui l'opportunité de moderniser et d'optimiser leurs architectures de données et de faire

de leurs données des ressources stratégiques pour leurs prises de décisions organisationnelles.

Les entreprises utilisent les données pour se démarquer et prospérer. Les données sont en effet

des mines de renseignements qui leur permettent d'accroître leur rentabilité, de découvrir

de nouvelles opportunités, d'accélérer la livraison de leurs produits et services et d'offrir à leurs

clients une expérience d'une qualité exceptionnelle. Les données peuvent également augmenter

l'efficacité opérationnelle et atténuer les risques associés à la fraude, à la criminalité, aux temps

d'arrêt système ou aux atteintes à la sécurité.

Informatica Big Data Management est la solution de gestion de données du marché la plus complète

et la première dont l'architecture est conçue pour ingérer, traiter, nettoyer, gouverner et sécuriser

les Big Data à grande échelle. La solution Informatica conjugue intégration, qualité, gouvernance

et sécurité des Big Data sous la forme d'une solution intégrée unique.

Intégration dynamique et optimisée des Big Data

Informatica Big Data Management offre une ingestion haut débit des données et un traitement

à grande échelle, afin que les analystes métiers puissent prendre des décisions éclairées à l'aide

d'outils d'analyse de nouvelle génération. Des centaines de connecteurs prédéfinis hautement

performants, de transformations d'intégration de données et d'analyseurs permettent d'ingérer

et de traiter rapidement quasiment tous types de données sur les plates-formes Big Data, telles

que Hadoop, NoSQL et les appliances MPP. Un paramétrage et des mappings dynamiques

favorisent l'automatisation de la programmation des processus d'intégration de données.

La génération automatique de classes complètes de flux de données lors de l'exécution, basée sur

des schémas de conception n'utilisant qu'une poignée de modèles, augmente considérablement

la productivité et la facilité de maintenance. Le support des schémas dynamiques permet de traiter

des formats de données flexibles. Les moteurs optimisés offrent des performances et une utilisation

des ressources maximales pour une intégration de données à grande échelle. Par exemple, pour

optimiser les charges de travail des Big Data, Informatica utilise MapReduce et le nouveau moteur

Blaze d'Informatica via YARN.

1

Fiche technique

Page 2: Éditions Informatica Big Data Management

Gouvernance et qualité des Big Data de bout en bout

La gouvernance et la qualité des Big Data de bout en bout signifient que les utilisateurs métiers

et informatiques peuvent avoir confiance dans les données qu'ils utilisent. Informatica Big Data

Management offre une expérience intuitive non technique à ses utilisateurs : les experts en données,

les analystes de données et l'entreprise peuvent donc collaborer efficacement : profiling, découverte

et envoi d'alertes – Le profiling et la découverte des données, notamment le profiling de règle métier,

mettent en lumière les problèmes et anomalies de qualité des données. Il est également facile

de créer des règles de surveillance et des alertes pour suivre et signaler les problèmes de qualité.

Les règles de qualité des données et la validation des adresses se déploient dans Hadoop pour

nettoyer et préparer les données à grande échelle et assurer qu'elles sont adaptées à leur finalité.

La Cartographie de données en temps réel, catalogue de métadonnées universel et graphe de

connaissances, vous permet de rechercher, de découvrir et de comprendre les données d'entreprise.

Cette cartographie utilise Spark pour créer rapidement des graphes de connaissances à grande

échelle. La traçabilité des données de bout en bout au-delà de Hadoop répond aux exigences

de conformité et permet une analyse efficace des causes et impacts de la qualité des données.

Sécurité des Big Data axée sur les risques

La sécurité des Big Data axée sur les risques analyse toutes les données afin de détecter et d'agir sur

les risques et les vulnérabilités clés. Cela nécessite une vue à 360 degrés des données sensibles, ainsi

qu'une analyse des risques et une protection des données à risque basée sur des règles. La sécurité

des Big Data agit ensuite pour anonymiser les informations contrôlées par des règles d'entreprise

et des réglementations sectorielles. Informatica Big Data Management offre une option de masking

permanent et non intrusif des données qui protège les données sensibles dans les environnements de

production et de développement Hadoop et contribue à minimiser les risques d'atteinte à la sécurité.

« Nous plaçons les clients au coeur de tout ce que nous faisons

et Western Union a cette incroyable opportunité de pouvoir mettre à profit

toute la puissance d'analyse des données pour identifier les tendances qui

l'aideront à façonner son activité et à améliorer l'expérience de ses clients.

Nous sommes impatients de continuer notre travail avec Informatica car

il nous permet de révéler le véritable potentiel de notre activité et de notre

base clients à l'échelle globale. »

— Sanjay Saraf, Senior Vice President et Chief Technology Officer,

Western Union

Éditions Informatica Big Data Management 2

Page 3: Éditions Informatica Big Data Management

Principales fonctionnalitésIntégration de données (ETL) dans Hadoop

Cette solution contient une bibliothèque étendue de capacités prédéfinies de transformation

d'intégration des données. Ces capacités s'exécutent en natif sur Hadoop, ce qui vous permet de traiter

tous les types de données, à toute échelle : des téraoctets aux pétaoctets. Votre équipe informatique

peut développer rapidement des flux de données dans Hadoop grâce à un environnement de

développement visuel qui offre une productivité jusqu'à cinq fois supérieure à celle du codage manuel.

Schémas dynamiques et modèles de mappings

Informatica Big Data Management vous permet de générer des centaines de flux de données

d'exécution à l'aide de quelques schémas de conception, via les modèles de mappings. Ces mappings

se paramètrent facilement pour gérer les schémas dynamiques tels que les fichiers journaux

de machine et du Web, fréquents dans le cadre des projets de Big Data. Vous pouvez donc élaborer

rapidement des flux de donnés faciles à gérer et résistants face aux changements de schémas.

Profilage des données sur Hadoop

Vous pouvez effectuer le profilage des données dans Hadoop à l'aide de l'outil de développement

Informatica et d'un outil d'analyse reposant sur un navigateur. De cette manière, les développeurs,

analystes et experts peuvent facilement comprendre les données, identifier plus tôt les problèmes

de qualité des données, collaborer sur les spécifications de flux de données et valider les

transformations de mapping et les logiques de règles.

Informatica Big Data Management offre un environnement de développement visuel avec transformations prédéfinies qui favorise la réutilisation pour une productivité jusqu'à cinq fois supérieure au codage manuel.

Éditions Informatica Big Data Management 3

Page 4: Éditions Informatica Big Data Management

Qualité des données sur Hadoop

Nettoyez, rapprochez et normalisez des données de tout type, quel que soit leur volume, en natif

sur Hadoop et obtenez des données fiables et sûres. Utilisez un ensemble complet de règles

de qualité des données prédéfinies ou créez votre propre ensemble à l'aide de l'environnement

de développement visuel. Exécutez la validation des adresses pour analyser, nettoyer, normaliser

et enrichir les données d'adresses à l'échelle globale.

Analyse des données complexes sur Hadoop

Informatica Big Data Management simplifie l'accès et l'analyse des données complexes, multi-

structurées, non structurées et régies par les normes du secteur, telles que les données de journaux

Web, JSON, XML et issues d'objets connectés. Des analyseurs prédéfinis pour les données de marché

et les normes du secteur telles que SWIFT, ACORD, HL7, HIPAA et EDI sont également disponibles.

Catalogue de métadonnées universel

Les experts en données et analystes de données disposent à présent d'une vision à 360° de leurs

données grâce à la Cartographie de données en temps réel. Il s'agit d'un catalogue de métadonnées

universel et d'un graphe de connaissances qui permettent de rechercher, de découvrir et de comprendre

les données d'entreprise. Cette Cartographie utilise Spark pour créer rapidement des graphes

de connaissances à grande échelle.

Traçabilité des données de bout en bout

Les analystes de données et les utilisateurs métiers peuvent afficher une vue complète de la traçabilité

des données de bout en bout, ce qui est un gage de confiance et de conformité réglementaire.

Cette traçabilité des données visuelle contient un historique détaillé de l'ensemble des mouvements

et transformations des données (dans Hadoop et les systèmes traditionnels), des applications cibles

jusqu'aux systèmes sources d'origine. La recherche et la collaboration métier/informatique sont

améliorées par un glossaire métier de termes communs portant sur les objets de données et leur

traçabilité.

Masking permanent des données sur Hadoop

L'option de masking permanent des données améliore la sécurité et la confidentialité des données

en rendant anonymes et non identifiables les données sensibles. Les données obscurcies conservent

leur contexte et leur intégrité référentielle persiste, de sorte que les données masquées peuvent être

utilisées dans des environnements de test, d'analyse ou de support.

Accès universel aux données

Votre équipe informatique peut accéder à tous les types de Big Data de transaction, notamment

RDBMS, OLTP, OLAP, ERP, CRM, mainframe, Cloud, etc. Vous pouvez également accéder aux données

suivantes : réseaux sociaux, fichiers journaux, données de capteurs de machines, Hadoop, formats

NoSQL, documents, e-mails et autres types de données non structurées ou multi-structurées

et magasins de données.

Éditions Informatica Big Data Management 4

Page 5: Éditions Informatica Big Data Management

Ingestion et extraction haute vitesse des données

Vous pouvez accéder aux Big Data, les charger, les transformer et les extraire entre les systèmes

sources et cibles, ou directement dans Hadoop, les magasins de données NoSQL ou dans votre

data warehouse. La connectivité hautes performances par le biais d'API natives vers les systèmes

source et cible avec traitement en parallèle assure une ingestion et une extraction haute vitesse

des données.

Découverte des données dans Hadoop

Automatisez la découverte des domaines de données et des relations entre les données dans Hadoop.

Découvrez par exemple des ensembles de données ou des données sensibles en lien avec les clients

et les produits, comme les numéros de sécurité sociale et de carte crédit, qui nécessitent d'être

masquées à des fins de conformité.

Traitement du langage naturel dans Hadoop

À l'aide d'une liste de mots ou d'expressions clés et en utilisant l'analyse de texte et la reconnaissance

d'entités nommées, vous pouvez facilement extraire et classifier vos entités clients et produits à partir

de données non structurées, telles que les e-mails, les données de réseaux sociaux, les demandes

d'indemnisation, les fiches du service client et les documents. Vous pouvez enrichir les données

de référence avec des analyses du comportement des clients ou des informations produits, telles

que des tarifs de la concurrence.

Conception unique déploiement accéléré

L'écosystème Hadoop évolue rapidement : la communauté open source enchaîne les innovations sans

temps mort. Informatica Big Data Management s'appuie sur la structure Hadoop open source

et préserve toute la logique de transformation de vos pipelines de données. Les développeurs peuvent

donc élaborer une fois pour toutes une conception unique, sans connaissances spécifiques des

concepts et langages Hadoop, et déployer facilement des pipelines de données sans devoir réintégrer

à chaque fois les changements Hadoop. Résultat : les innovations Hadoop sont implémentées

plus rapidement avec un impact et un risque moindres sur les systèmes de production.

Éditions Informatica Big Data Management 5

Page 6: Éditions Informatica Big Data Management

Comparez ces éditions d'Informatica Big Data Management pour sélectionner celle qui vous convient.

Entreprise Advanced

Connectivité avec les bases de données, Hadoop, les réseaux sociaux et les applications

● ●

Ingestion très rapide de données ● ●

Intégration de données dans Hadoop ● ●

Optimisation Pushdown des bases de données ● ●

Profilage des données et découverte des domaines sur Hadoop

● ●

Analyse des données complexes ● ●

Analyse du texte - Reconnaissance d'entités nommées

● ●

Schémas dynamiques et modèles de mappings ● ●

Catalogue de métadonnées universel ● ●

Traçabilité des données de bout en bout ● ●

Qualité des données sur Hadoop ●

Validation des adresses sur Hadoop ●

Glossaire métierLimité aux

environnements Big Data

100 utilisateurs nominatifs analystes de données Informatica

● ●

Support (inclus avec la licence d'abonnement uniquement)

8 h/24 et 5 j/7 24 h/24 et 7 j/7

Éditions Informatica Big Data Management 6

Page 7: Éditions Informatica Big Data Management

IN06_1012_02194Siège mondial, 2100 Seaport Blvd., Redwood City, CA 94063, États-Unis Téléphone : +33 1 42 04 89 00 (France) Numéro gratuit aux États-Unis : 1.800.653.3871www.informatica.com/fr www.informatica.com linkedin.com/company/informatica twitter.com/InformaticaFr© Copyright Informatica LLC 2018. Tous droits réservés. Informatica® et Put potential to work™ sont des marques ou des marques déposées d'Informatica Corporation aux États-Unis et dans d'autres pays. Tous les autres noms de sociétés et de produits peuvent avoir fait l'objet d'un dépôt de marque.

À propos d'Informatica

Informatica est un éditeur de logiciels indépendant de premier plan. Sa mission : soutenir une innovation centrée sur la transformation afin d'appréhender l'avenir de l'univers des données. Les sociétés du monde entier font confiance à Informatica pour exploiter le potentiel de leurs informations et répondre à leurs principaux impératifs métiers. Plus de 5 800 entreprises font confiance à Informatica pour tirer pleinement profit de leurs ressources en matière d'informations hébergées sur site, dans le Cloud et sur Internet, y compris sur les réseaux sociaux.

Bénéfices clésCommercialisation plus rapide des produits et services innovants

Grâce à Informatica Big Data Management, vos experts en données et analystes de données

peuvent se focaliser sur de nouvelles informations exploitables — non sur l'intégration de données —

utiles à votre entreprise pour développer des produits et services innovants. Cette solution fournit

un environnement de développement d'intégration de données permettant l'importation des mappings

PowerCenter® existants ainsi que la réutilisation des compétences Informatica. Elle fournit un

environnement de développement visuel convivial ainsi qu'un modèle de processus de développement

réutilisable. Elle étend l'intégration de données et la qualité des données aux données de réseaux

sociaux, journaux Web, données de capteurs, documents, e-mails et autres données multi-structurées

ou non structurées, sans codage manuel. Par conséquent, cette solution augmente considérablement

la productivité de votre équipe informatique et accélère sensiblement le déploiement.

Réduction du coût des projets de Big Data

Informatica Big Data Management réduit le coût des Big Data. Vous pouvez télécharger des données

à partir de votre warehouse et de vos systèmes sources et les traiter sur du matériel meilleur

marché. En passant du codage manuel aux outils éprouvés de productivité d'intégration de données,

vous pouvez multiplier votre productivité par cinq. Vous pouvez concevoir vos flux de données une

seule fois et les déployer partout, ce qui vous permet de réduire les coûts en optimisant l'utilisation

du traitement de données à la fois sur les platesformes de données existantes et les technologies

en pleine évolution, telles que Hadoop.

Adoption de Hadoop à travers l'entreprise

Informatica Big Data Management permet une plus large adoption de Hadoop sur une multitude

de projets. Pas besoin de procéder à un codage manuel en Java MapReduce, Python ou langages

de script pour profiter des avantages de Hadoop en termes de performances et de coûts — il existe

déjà plus de 100 000 développeurs formés par Informatica et disponibles à travers le monde pour

travailler sur vos projets Big Data. Cette solution est plus facile à administrer et peut prendre en charge

plusieurs projets Big Data à la fois. Elle offre en outre les garanties suivantes : performances optimales

de bout en bout, fiabilité grâce à la traçabilité des données de bout en bout, sécurité pour minimiser les

risques et accélération des déploiements.

Réduction des risques associés à l'adoption de nouvelles technologies

Informatica Big Data Management minimise les risques associés aux toutes dernières technologies

telles que Hadoop. En effet, votre service informatique investit dans un logiciel à la fois compatible

avec les technologies émergentes et les infrastructures de données traditionnelles. Cette solution

minimise l'impact des schémas dynamiques et les risques connexes grâce à la possibilité de protéger

les données sensibles. Elle offre une approche unique et cohérente de l'intégration pour tous les types

de données. Alors que les technologies les plus récentes telles que Hadoop continuent d'évoluer,

Informatica Big Data Management vous garantit de pouvoir facilement adopter les innovations sans

avoir à redéfinir vos mappings et flux de données.