Pentaho 5.4 pour l’entreprise et la communauté

09/06/2015
logo pentaho

Une semaine après l’annonce du rachat de Pentaho par Hitachi Data, après que les craintes sur l’avenir de l’édition communautaire de Pentaho se soient dissipées, la suite décisionnelle est mise à jour. Comme à l’habitude ce sont deux versions qui sont présentées Pentaho 5.4 Enterprise Edition et Community Edition.

Ces deux versions sont disponibles immédiatement par les canaux de distribution habituels : le site web principal de Pentaho pour la version Pentaho 5.4 EE et le site communautaire pour Pentaho 5.4 CE. Faisons le tour des nouveautés marquantes de ces deux versions.

Nouvelle ergonomie pour l’intégration des données

Pour les versions CE et EE, une nouvelle interface est disponible pour l’intégration des données. L’ancien « Kettle » est revu dans son aspect esthétique et fonctionnel et supporte en plus des icônes le format de graphisme vectoriel SVG.

Capture1_pdi

Extension de l’API d’analyse

Disponibles sur la version entreprise de Pentaho, les extensions permettent aux développeurs de mieux contrôler les styles et l’interactivité de l’analyse embarquée. Ce travail, entamé depuis la version 5.3, aboutit dans cette nouvelle version.

 

Capture2_analyzer

Documentation de l’API REST pour l’intégration de donnée

Bien que la documentation de Pentaho soit totalement ouverte et disponible, le server d’intégration des données reste un composant de la version entreprise de la suite décisionnelle.

Utilitaires pour le serveur d’analyse business

Disponibles pour les deux versions, les plug-ins permettent au module PDI d’intégration de communiquer avec l’ensemble de la plateforme, de récupérer la liste des points de terminaison et d’exécuter simplement des actions sur la plateforme. Quand elles sont publiées sur le serveur, les transformations de données intégrées qui utilisent cette étape peuvent s’exécuter localement avec les permissions de l’utilisateur courant.

Support Ctools pour Require.js

Pour les deux versions à nouveau, le support de Require.JS est mis en place, notamment pour les modules CDE et CDT, respectivement « Community Dashboard Framework » et Community Dashboard Editor ». Cette amélioration est une fondée sur une très grande refactorisation de Ctools restructurant les composants comme un framework de définition de modules asynchrone avec l’utilisation de Require.js.

Nommage des clusters Hadoop

Pentaho simplifie ici pour ses deux versions l’interface Hadoop pour le nommage des nœuds, des ports et des traqueurs dans une seule fenêtre de dialogue où les utilisateurs peuvent entrer chacune des informations requises pour la définition du cluster.

Support pour Amazon WEB SEervice Elastic MapReduce

Pour les deux versions, le support  intégral du « shim » Amazon EMR inclut S3. La scalabilité de l’ETL est assurée sur cette plateforme très populaire.

SAP HANA pour l’intégration des données

SAP HANA est une base de données orientée colonne en mémoire résidente qui supporte à la fois les transactions à haute vitesse et les requêtes d’analyses complexes. Maintenant supportée par Pentaho en version entreprise, cette base est la fondation pour les prochaines générations d’application SAP d’analyse et de portail d’entreprise.

Intégration de Spark

Pour les deux versions, le moteur de calcul en mémoire résidente qui peut être mis en grappe avec Hadoop est intégré. Il peut être exécuté par dessus Hadoop avec le système de fichier distribuer HDFS et est pressenti comme le remplaçant de MapReduce comme moteur de calcul distribué associé à Hadoop. Pour améliorer les capacités d’orchestration, l’équipe Pentaho a créé une nouvelle étape dans les tâches PDI permettant l’exécution du code Java compilé et proposé par les développeurs de Spark.

Amélioration du raffinage et de la modélisation des données

Dans la version entreprise de Pentaho 5 .4, l’approche de la modélisation des données permet d’injecter des informations business dès la source des données : Metastore permet la réutilisation des métadonnées pour le partage entre les transformations ; le support pour les dimensions partagées dans le modeleur automatique permet la mise en place de schémas plus complexes et la réutilisation de tables dimensionnelles (comme le temps) ; le schéma en étoile est supporté dans le modeleur automatique.

Localisation de la console utilisateur Pentaho

Les traductions de Pentaho se sont professionnalisées et les paquetages de langage étendent maintenant le travail effectué jusqu’à présent par la communauté. Le français, l’allemand et le japonais sont totalement pris en charge.

Source : community.pentaho.com

Solutions

comments powered by Disqus
top