Comment Édifice utilise l’Object Storage de Scaleway pour servir plus de 4 millions d'élèves français

Gérer de grandes quantités de données de façon sûre, simple et flexible est un enjeu de plus en plus crucial pour de nombreux acteurs aujourd’hui. Notamment pour les élèves du système scolaire public français, qui comptent sur la plateforme ENT (espace numérique de travail) pour le suivi de leur vie éducative : devoirs, cours, exercices, échanges avec enseignants et parents, etc.

Utilisée par quatre millions d’élèves par jour, la plateforme génère une quantité de données considérable, qui doit être sauvegardée en continu. C’est pour ce besoin précis qu’Édifice, éditeur des ENT, compte sur les solutions Object Storage de Scaleway. Nous avons échangé avec Thomas Dannenmuller, Lead SRE chez Édifice, lors d’un webinar, pour en savoir plus.

Mais d’abord, pourquoi les solutions Object Storage s'adaptent-elles bien aux besoins du secteur éducatif ?

  1. pour le stockage et la gestion de contenus éducatifs, comme des vidéos, des PDF, des présentations ou encore des ressources interactives
  2. pour archiver des données sur de longues périodes, de manière économique
  3. pour diffuser des vidéos ou des podcasts de manière efficace en utilisant des services de streaming intégrés à l'objet storage.

Pour tous ces usages, et bien plus encore, les utilisateurs peuvent bénéficier de la scalabilité et de la flexibilité nécessaire en fonction de l’évolution de leurs besoins.

Et maintenant, place à l’interview !

Scaleway Blog: Pouvez-vous expliquer ce qui fait que la plateforme éducative Édifice est utilisée par des millions d’élèves ?

Thomas Dannenmuller: Édifice est une société qui a 13 ans aujourd’hui, qui édite un ENT, un espace numérique de travail pour les écoles, les collèges et les lycées. On a commencé sur le marché plutôt primaire, puis on s’est installé sur le segment de l’enseignement secondaire, pour arriver à terme en 2021 leader en France sur ce secteur.

Depuis, on développe les géographies Mexique, Espagne et Amérique latine, pour aller chercher d’autres utilisateurs, puisqu’en France, la plupart des élèves sont déjà sur la plateforme.

Aujourd'hui, on fournit le service ENT à plus de quatre millions d’élèves. Cela représente 16 000 écoles et 3 300 collèges. Et puisqu’on fournit l’ENT au Ministère de l'Éducation, et donc aux collèges et lycées français à l’international, on est présents dans plus de 20 pays aujourd’hui.

Pour 4 millions d'élèves, on a à peu près 11 millions de comptes utilisateurs, puisqu'il y a également les parents et le personnel enseignant sur nos plateformes. D’un point de vue KPI, infrastructure technique, c'est plus de 1 000 machines virtuelles hébergées et infogérées par Édifice.

Cela représente plus d’un pétaoctet de stockage. Sur les plus grosses journées, on va avoir des pics à 3 gigabits de bande passante montante pour fournir l'accès à nos plateformes. Nous avons en moyenne un million et demi de visiteurs par jour et pouvons aller jusqu'à cinq millions de connexions par jour. Tout ça, en assurant un niveau de disponibilité supérieur à 99,95 %.

Pourquoi Édifice a-t-elle choisi Scaleway pour ses besoins en Object Storage ?

Pour la partie Object Storage, c'est une implémentation qu’on vient de re-designer et d’aboutir. Historiquement, on cherchait un fournisseur cloud (CSP), complémentaire à notre CSP historique, sur lequel on pouvait avoir des ressources public cloud, bare metal et Object Storage, typiquement pour des use cases de CI/CD mobile, pour faire du load testing sur nos infrastructures qui sont hébergées chez notre CSP historique. Nous avions un besoin fort d'externalisation des sauvegardes, et c'est ce dont on va parler plus particulièrement aujourd’hui.

Comment se passe la réplication et la reprise après sinistre chez Scaleway ?

Historiquement, on utilise depuis longtemps les services Object Storage de Scaleway sur la classe de stockage historique qui est la One Zone IA, sur lequel on va mettre nos sauvegardes de logs et nos sauvegardes de bases de données ; le type de données que l’on veut garder longtemps.

On fait ça avec du Rclone : on chiffre et on garde une copie en zone tiède chez notre hébergeur historique, ce qui nous permet d'avoir une redondance et un cycle de vie complet.

On voulait aller plus loin, principalement pour le périmètre de sauvegarde des fichiers de nos utilisateurs. C’est une volumétrie assez importante : on avoisine les 500 téraoctets de données. On a toujours des enjeux de réduction des coûts - des coûts de run et des coûts récurrents - donc des coûts de possession de la solution de stockage. Pour atteindre cet objectif-là, on s’orientait plutôt vers une solution Serverless, donc naturellement plutôt vers de l’Object Storage. On souhaitait, au passage, avoir une solution plus performante, puisqu’on a un très gros volume de données à sauvegarder tous les jours. On voulait s’assurer que la durée des sauvegardes soit la plus courte possible, pour avoir un recovery time objective ou un recovery point objective le plus court possible, en cas d'incident.

Comment Scaleway facilite-t-il la gestion des données éducatives à grande échelle ?

S'ajoute aux points précédents la notion de réplication inter-sites qu'on faisait historiquement, en mixant différents types de ressources et différents datacenters. Et bien sûr, externaliser cela, quand je dis externaliser, c'est ne pas stocker les sauvegardes chez notre CSP historique pour des situations de disaster recovery, pour avoir les données bien au chaud en cas d’incident grave.

Comment Édifice a-t-elle réussi à réduire ses coûts et optimiser ses performances grâce à Scaleway ?

On a réussi à atteindre 40 % de réduction des coûts sur le périmètre expliqué ci-dessus. On a une fiabilité aussi bien meilleure, puisqu’avant, on avait un cocktail de serveurs, de réplication de données sur du Block Storage et de l’Object Storage. C’était un petit peu plus complexe, un petit peu moins fiable.

Aujourd’hui, on a une situation qui est beaucoup plus efficiente, et beaucoup plus stable. On a réussi à se débarrasser de 14 serveurs et de centaines de téraoctets au passage. Cela évite pas mal de run, des soucis liés à la stabilité des serveurs de stockage en moins à gérer, ce qui est un gros bénéfice.

On a une durée globale de sauvegarde qui est deux fois plus rapide qu'avant. On est capable d'optimiser les coûts, principalement grâce aux différentes classes de stockages qui sont mis à disposition par Scaleway.

Si on compare avec notre solution de sauvegarde historique (ci-dessus), on avait trois zones:

  • une zone production dans laquelle on a toutes nos instances de ENT et le stockage NFS qu’on utilise actuellement, ce qu'on appelle NAS sur le schéma
  • une zone secondaire dans laquelle on va avoir à la fois les machines qui orchestraient les sauvegardes, qui stockaient la version primaire et qui répliquaient cette version-là…
  • … sur une troisième zone aussi, sur des serveurs dédiés, chez notre provider cloud principal.

Donc aujourd’hui (ci-dessus), pour la partie NAS, on n’a plus du tout de zone primaire et zone secondaire de sauvegarde. On a juste des serveurs qui font tourner des batches. C'est une application qu’on a développée qui gère tous nos cas d’usage, de cycle de vie, de nos sauvegardes de stockage et qui va directement aller pousser ça dans la classe Multi-AZ, qui va faire une rotation journalière, et qui va archiver en changeant la classe des objets en Glacier pour économiser les coûts.

Pourquoi les lifecycle policies sont-elles importantes dans la sauvegarde des données éducatives ?

Sur la partie sauvegarde des bases de données, on n’a pas changé. Mais ce qu’on a gagné dans le temps, c’est l’ajout des lifecycle policies, chose qu’on n’avait pas au démarrage et qui nous a permis aussi d’optimiser les coûts. Cet ajout nous a aussi permis d’avoir une rétention beaucoup plus longue avec des coûts modiques par rapport à ce que ça représenterait sur la classe de stockage One-Zone IA. Maintenant c'est géré automatiquement par l'offre Object Storage de Scaleway. Et on a toujours cette capacité de de récupération des données au fil de l’eau, ce qui nous permet de valider notre chaîne complète de sauvegarde et de s’assurer qu’en cas de Disaster Recovery, si on perd la production, on peut basculer sur la Zone 2 et remonter les données assez rapidement.

Conclusion: Scaleway, la solution Object Storage adaptée aux besoins de l'éducation

Scaleway Blog: Merci Thomas de vos réponses ! Pour revoir en entier le webinar dont cet article est extrait, c’est par ici. Pour répondre à toutes vos questions ou pour avoir une explication sur les différents produits qui peuvent répondre à vos cas d’usage, n’hésitez pas à nous contacter ici. A bientôt !