Talend 5.5 : détail des nouveautés

12/06/2014
Talend logo

Talend publie la version 5.5 de plusieurs de ses solutions, complétant ainsi le panel d'outils destinés aux développeurs. Focus sur les évolutions essentielles de cette nouvelle version.

Le point majeur de cette nouvelle version de Talend est la fonctionnalité permettant aux développeurs de générer nativement du code performant sur Hadoop sans être experts en MapReduce et Pig. Par ailleurs, la plate-forme a été optimisée pour offrir de hautes performances aux distributions Hadoop, avec un gain de rapidité de 45% selon les tests de l'éditeur.

On peut également noter trois autres grandes nouveautés :

1) Augmentation de la performance et de la scalabilité concernant l’intégration Big Data

  • Optimisation du code MapReduce pour améliorer la performance en termes de rapidité ; ainsi, il n’est plus nécessaire de consacrer du temps de programmation à ces problématiques.
  • Disponibilité d’Apache Spark comme projet d’incubation dans le Talend Forge Community, ce qui offre la possibilité de générer des jobs Spark dans le Studio Talend et de les déployer dans une infrastructure Spark, par opposition à Hadoop.

2) Élargissement des possibilités d’intégration et de qualité de données

  • Mise à jour des supports aux plates-formes Big Data et des connecteurs dans l’optique d’optimiser le temps à l’utilisation des systèmes plutôt qu'à leur intégration ; connecteurs concernés : Cloudera 5, Hortonworks 2.1, MapR 3.1, Pivotal HD 2.0, HP Vertica 7 et Teradata 15 ; nouveau connecteur : Windows Azure Blob Storage. Par ailleurs, il est possible d’intégrer et de « profiler » les données de la plate-forme Vertica’s Big Data Analytics afin d’obtenir un aperçu de la manière dont les données peuvent être utilisées et si elles sont conformes aux standards.
  • Support Talend Data Mapper pour plus de messages d’échange de données informatisées EDI.

3) Amélioration de la productivité et support de nouveaux protocoles de sécurité

  • Amélioration du support Kerberos au niveau de la sécurité pour l’accès aux données Hive, ce qui permet de minimiser les efforts de configuration de la sécurité pour le « profiling », la standardisation et le « matching » des données dans les jobs.
  • Support d'Apache Sentry : les utilisateurs peuvent contrôler la gestion avancée des autorisations dans les jobs Big Data, qui fournissent un niveau plus élevé de sécurité et moins de programmation.
  • Le Talend Data Mapper Component (tHMap) permet désormais de transformer du contenu XML, JSP, EDI. La transformation en est ainsi simplifiée pour un grand nombre de sources, simples ou multiples.
  • Le Talend Data Mapper Component (cMap) pour ESB apporte de riches fonctions de mapping et de transformation pour des formats de données complexes passant par une ESB route.

Solutions

comments powered by Disqus
top