Services de visualisation des données AWS : tableaux de bord et BI bien conçus
Services de visualisation de données AWS pour les tableaux de bord et la BI. Ce qu'il faut pour créer des analyses fiables sur AWS et le pipeline qui...
Une équipe financière nous a montré un jour un magnifique tableau de bord AWS créé par son dernier fournisseur. Des graphiques épurés, les bonnes couleurs, les cadres ont adoré. C'était également faux : deux des premiers chiffres provenaient d'un tableau qui n'avait pas été actualisé depuis des semaines, et personne ne pouvait le dire car le tableau de bord ne le disait jamais. C'est toute la leçon de la visualisation des données sur AWS en une seule histoire : le graphique est la partie la plus facile, et un joli graphique construit sur un pipeline défectueux est pire que pas de tableau de bord du tout.
Le pipeline derrière un bon tableau de bord
Chaque visualisation fiable se trouve au sommet d'une chaîne que la plupart des gens ne voient jamais. Les données sont ingérées à partir de vos sources : bases de données, outils SaaS, fichiers. Il atterrit dans le stockage, généralement S3. Il est nettoyé et remodelé, car les données brutes sont toujours plus compliquées qu'on ne l'admet. Il est modélisé sous forme de métriques qui signifient une chose cohérente. Ce n'est qu'alors qu'il atteint un graphique.
Ignorez ou accélérez l'une de ces étapes et le tableau de bord s'affiche toujours. Il affiche simplement quelque chose de faux. La valeur technique réside dans les couches inférieures, et c'est exactement là que le travail peu coûteux sur les tableaux de bord constitue un avantage.
À quoi ressemble une pile AWS
Les services spécifiques dépendent de vos données, mais leur forme est cohérente :
- S3 en tant que solution durable et économique pour les données brutes et traitées
- Un entrepôt ou un moteur de requête (Redshift ou Athena interrogeant directement S3) pour une analyse à grande échelle
- Une étape de transformation qui nettoie et modélise les données selon un calendrier
- Une couche de visualisation : QuickSight pour la BI standard, ou un tableau de bord intégré personnalisé lorsque les données appartiennent à votre propre produit
- Planification et surveillance pour que les actualisations soient prévisibles et que les défaillances soient détectées
En les assemblant sur AWS plutôt que sur une seule plateforme tout-en-un, vous pouvez contrôler les coûts à mesure que les données augmentent et permet à chaque couche d'être le bon outil, plutôt que le bundle inclus.
BI autonome ou intégrée
Certains clients souhaitent disposer d'un espace de travail BI auquel leurs analystes se connectent. D'autres souhaitent que les graphiques soient intégrés à leur propre application ou portail, afin que les utilisateurs ne quittent jamais le produit pour voir leurs numéros. Nous faisons les deux : la route intégrée signifie un front-end personnalisé dans React et Node situé sur le même pipeline AWS, ce qui correspond au type de travail de données complet que nous créons régulièrement.
Comment distinguer un tableau de bord fonctionnel d'un joli tableau de bord
Trois chèques permettent de régler le problème rapidement. Les chiffres concordent-ils avec une source en laquelle vous avez déjà confiance ? S'actualise-t-il selon un calendrier que vous pouvez nommer et vous indique-t-il la date de sa dernière mise à jour ? Une métrique donnée se lit-elle de la même manière partout où elle apparaît ? Un tableau de bord qui les transmet fait son travail. Un diaporama avec cosplay en direct échoue, et vous ne le découvrirez que lorsqu'une décision sera prise sur un numéro obsolète.
Questions fréquemment posées
Le graphique visible constitue la dernière étape. Avant qu'il ne soit question d'ingérer des données provenant de vos sources, de les stocker, de les nettoyer et de les transformer, puis de les modéliser en métriques fiables. Un tableau de bord construit sur un pipeline fragile a l'air bien et repose en toute confiance. La majeure partie de l'effort d'ingénierie est consacrée aux couches que personne ne voit.
Une pile classique utilise S3 pour le stockage, un entrepôt comme Redshift ou des requêtes via S3 pour l'analyse, une étape de traitement pour nettoyer et remodeler les données, et une couche de visualisation telle que QuickSight ou un tableau de bord personnalisé intégré. Les éléments exacts dépendent de votre volume de données et de la durée de vie des chiffres.
Vérifiez si les chiffres correspondent à une source fiable, s'ils sont actualisés selon un calendrier connu et si la même métrique se lit de la même manière partout où elle apparaît. Un tableau de bord qui ne peut pas être lié aux données sources ou qui définit les « revenus » différemment sur deux écrans est une décoration, pas une analyse.
Oui Au-delà des outils de BI autonomes, les visualisations peuvent être intégrées directement à votre produit ou à votre portail interne afin que les utilisateurs ne quittent jamais votre application pour consulter leurs données. Cela signifie généralement un front-end personnalisé soutenu par le même pipeline AWS, que nous développons dans React et Node.