Vue dimensionnement

Sommaire

1. Introduction
- 1.1. Documentation de Référence
2. Non statué
- 2.1. Points soumis à étude complémentaire
- 2.2. Hypothèses
3. Contraintes
4. Exigences
5. Dimensionnement cible
- 5.1. Estimation des besoins en ressources par composant technique
- 5.2. Dimensionnement des machines

Dernière modification : 2024-09-28

Date dernière revue globale : <Faire régulièrement des revues globale de la vue (au moins une fois par an tant que le projet est actif) et mentionner la date ici>

Statut du document : <Donner ici le statut de la vue, par exemple 'DRAFT', 'FINALISÉ',…>

1. Introduction

Ceci est la vue dimensionnement du projet. Il permet de déterminer la taille de l’infrastructure nécessaire au projet.

Les autres vues du dossier sont accessibles d’ici.

Le glossaire du projet est disponible ici. Nous ne redéfinirons pas ici les termes fonctionnels ou techniques utilisés.

1.1. Documentation de Référence

Table 1. Références documentaires dimensionnement

N°	Version	Titre/URL du document	Détail
1	1.2	Rapport_benchmark_xyz.pdf
2	2019	Rapport INSEE sur les entreprises françaises

2. Non statué

2.1. Points soumis à étude complémentaire

Table 2. Points soumis à étude complémentaire

ID	Détail	Statut	Porteur du sujet	Échéance
1	Capacité disques SSD	EN_COURS	XYZ	01/01/2022

2.2. Hypothèses

Tip	Donner ici les hypothèses structurantes prises pour le dimensionnement

Exemple:

Table 3. Hypothèses

ID	Détail
1	Nous estimons que 10M de personnes téléchargeront l’application StopCovid

3. Contraintes

Tip	Les contraintes sont les limites applicables aux exigences sur le projet. Il est intéressant de les expliciter pour obtenir des exigences réalistes. Par exemple, il ne serait pas réaliste d’exiger des temps de réponse d’un web service incompatibles avec le débit du réseau sous-jacent.

3.1. Contraintes stockage

Tip	Lister ici les éventuelles contraintes liées aux disques

Exemple : L’espace disque maximal allouable à une VM est de 2 To.

3.2. Contraintes CPU

Tip	Lister ici les éventuelles contraintes liées à la puissance de calcul

Exemple 1 : Une VM sera dotée au maximum de 10 VCPU

Exemple 2 : L’ensemble des pods de l’application ne devra pas demander plus de 1 CPU par node.

3.3. Contraintes mémoire

Tip	Lister ici les éventuelles contraintes liées à la mémoire

Exemple : un pod ou un job Kubernetes ne devra pas utiliser plus de 6 Go de RAM

3.4. Contraintes réseau

Tip	Lister ici les éventuelles contraintes de volume réseau utilisé

Exemple 1 : La latence minimale des requêtes sur le WAN entre Londres et Tokyo est de 250 ms

Exemple 2 : Le réseau Ethernet du Datacenter dispose d’une bande passante de 40 Gbps.

4. Exigences

Tip

Il est crucial de récupérer un maximum d’informations issues de la production plutôt que des estimations car ces dernières se révèlent souvent loin de la réalité. C’est d’autant plus difficile s’il s’agit d’un nouveau projet. Prévoir alors une marge importante. Les informations données ici pourront serviront d’entrants au SLO (Objectif de Service fixé par les exploitants).

Tip

Les sections suivantes portant sur les calculs de volumétrie statiques et dynamiques donnent des exemples de calculs et d’élements à prendre en compte. Sur le plan de la forme, il peut être préférable de remplacer le texte par des feuilles de calculs dans un tableur. Pour un projet complexe ou aux hypothèses mouvantes, c’est indispensable.

4.1. Volumétrie statique

Tip	Il s’agit des métriques permettant de déterminer le volume de stockage cumulé du projet. Penser à bien préciser les hypothèses prises pour les métriques estimées. Il sera ainsi possible de les revoir si de nouveaux éléments métier apparaissent.

4.1.1. Métriques

Tip	Il s’agit des données métier mesurées ou estimées qui serviront d’entrants au calcul des besoins techniques de stockage.

Métrique	Description	Mesurée ou Estimée ?	Valeur	Augmentation annuelle prévisionnelle (%)	Source	Détail/hypothèses
S1	Nombre d’entreprises éligibles	Estimé	4M	+1%	INSEE [2]	On considère que MIEL ne concerne pas les auto-entrepreneurs
S2	Taille moyenne d’un PDF	Mesurée	40Ko	0%	Exploitants

4.1.2. Estimation besoins de stockage

Tip

Lister ici les besoins en stockage de chaque composant une fois l’application arrivée à pleine charge (volumétrie à deux ans par exemple).

Prendre en compte :

La taille des bases de données.
La taille des fichiers produits.
La taille des files.
La taille des logs.
L’espace nécessaire dans un éventuel stockage objet (S3, Swift, Ceph…)
…

Ne pas prendre en compte :

Le volume lié à la sauvegarde : elle est gérée par les exploitants.
Le volume des binaires (OS, intergiciels…) qui est à considérer par les exploitants comme une volumétrie de base d’un serveur (le ticket d’entrée) et qui est de leur ressort.
Les données archivées qui ne sont donc plus en ligne.

Fournir également une estimation de l’augmentation annuelle en % du volume pour permettre aux exploitants de commander ou réserver suffisamment de disque.

Pour les calculs de volumétrie, penser à prendre en compte les spécificités de l’encodage (nombre d’octets par caractère, par date, par valeur numérique…).

Pour une base de donnée, prévoir l’espace occupé par les index et qui est très spécifique à chaque application. Une (très piètre) estimation préliminaire est de doubler l’espace disque (à affiner ensuite).

N’estimer que les données dont la taille est non négligeable (plusieurs Gio minimum).

Exemple de volumétrie statique du composant C :

Donnée	Description	Taille unitaire	Nombre d’éléments à 2 ans	Taille totale	Augmentation annuelle
Table Article	Les articles du catalogue	2Kio	100K	200 Mio	5 %
Table Commande	Les commandes clients	10Ko	3M	26.6 Gio	10 %
Logs	Les logs applicatifs (niveau INFO)	200 o	300M	56 Gio	0 % (archivage)

4.2. Volumétrie dynamique

Tip	Il s’agit des métriques par durée (année, mois, heure…) et permettant de déterminer la charge appliquée sur l’architecture, ce qui aidera à dimensionner les systèmes en terme de CPU, bande passante et performances des disques.

4.2.1. Métriques

Tip	Ce sont les données métier mesurées ou estimées qui serviront d’entrants au calcul de la charge.

Métrique	Description	Mesurée ou Estimée ?	Valeur	Augmentation annuelle prévisionnelle (%)	Saisonnalité	Source	Détail/hypothèses
D1	Proportion d’utilisateurs se connectant au service / J	Estimée	1%	+5%	Constant sur l’année Constant sur la semaine 3 pics à 20% de la journée à 8:00-9:00, 11:00-12:00 et 14:00-15:00		Les utilisateurs sont des professionnels utilisant l’application depuis la France métropolitaine aux heures de bureau standards

4.2.2. Estimation de la charge

Tip

Il s’agit ici d’estimer le nombre d’appels aux composants et donc le débit cible (en TPS = Transactions par seconde) que devra absorber chacun d’entre eux. Un système bien dimensionné devra présenter des temps de réponse moyen du même ordre en charge nominale et en pic.

Toujours estimer le "pic du pic", c’est à dire le moment où la charge sera maximale suite au cumul de tous les facteurs (par exemple pour un système de comptabilité : entre 14 et 15h un jour de semaine de fin décembre).

Ne pas considérer que la charge est constante mais prendre en compte :

Les variations journalières. Pour une application de gestion avec des utilisateurs travaillant sur des heures de bureau, on observe en général des pics du double de la charge moyenne à 8h-9h, 11h-12h et 14h-15h. Pour une application Internet grand public, ce sera plutôt en fin de soirée. Encore une fois, se baser sur des mesures d’applications similaires quand c’est possible plutôt que sur des estimations.
Les éléments de saisonnalité. La plupart des métiers en possèdent : Noël pour l’industrie du chocolat, le samedi soir pour les admissions aux urgences, juin pour les centrales de réservation de séjours etc. La charge peut alors doubler voire plus. Il ne faut donc pas négliger cette estimation.

Si le calcul du pic pour un composant en bout de chaîne de liaison est complexe (par exemple, un service central du SI exposant des données référentiel et appelé par de nombreux composants qui ont chacun leur pic), on tronçonnera la journée en intervalles de temps suffisamment fins (une heure par exemple) et on calculera sur chaque intervalle la somme mesurée ou estimée des appels de chaque appelant (batch ou transactionnel) pour ainsi déterminer la sollicitation cumulée la plus élevée.

Si l’application tourne sur un cloud de type PaaS, la charge sera absorbée dynamiquement mais veiller à estimer le surcoût et à fixer des limites de consommation cohérentes pour respecter le budget tout en assurant un bon niveau de service.

Table 4. Exemple : estimation volumétrie dynamique de l’opération REST GET Detail de l’application MIEL

Taux maximal d’utilisateurs connectés en même temps en pic annuel	S1 x F1 x 0.2 = 8K /H
Durée moyenne d’une session utilisateur	15 mins
Nombre d’appel moyen du service par session	10
Charge (Transaction / seconde)	8K / 4 x 10 / 3600 = 5.5 Tps

Tip

Pour un composant technique (comme une instance de base de donnée) en bout de chaîne et sollicité par de nombreux services, il convient d’estimer le nombre de requêtes en pic en cumulant les appels de tous les clients et de préciser le ratio lecture /écriture quand cette information est pertinente (elle est très importante pour une base de donnée).

Le niveau de détail de l’estimation dépend de l’avancement de la conception de l’application et de la fiabilité des hypothèses.

Dans l’exemple plus bas, nous avons déjà une idée du nombre de requêtes pour chaque opération. Dans d’autres cas, on devra se contenter d’une estimation très large sur le nombre de requêtes total à la base de données et un ratio lecture /écriture basée sur des abaques d’applications similaires. Inutile de détailler plus à ce stade.

Enfin, garder en tête qu’il s’agit simplement d’estimation à valider lors de campagnes de performances puis en production. Prévoir un ajustement du dimensionnement peu après la MEP.

Exemple : la base de donnée Oracle BD01 est utilisée en lecture par les appels REST GET DetailArticle fait depuis l’application end-user et en mise à jour par les appels POST et PUT sur DetailArticle issus du batch d’alimentation B03 la nuit entre 01:00 et 02:00.

Table 5. Exemple estimations nombre de requêtes SQL en pic vers l’instance BD01 de 01:00 à 02:00 en décembre

Taux maximal d’utilisateurs connectés en même temps	0.5%
Nombre maximal d’utilisateurs connectés concurrents	5K
Durée moyenne d’une session utilisateur	15 mins
Nombre d’appel moyen du service `GET DetailArticle` par session	10
Charge usagers GET DetailArticle (Transaction / seconde)	(10/15) x 5K / 60 = 55 Tps
Nombre de requête en lecture et écriture par appel de service	2 et 0
Nombre d’appel journalier du service `POST DetailArticle` depuis le batch B03	4K
Nombre de requêtes INSERT et SELECT par appel de service	3 et 2
Nombre journalier d’articles modifiés par le batch B03	10K
Nombre de requêtes SELECT et UPDATE	1 et 3
Nombre de SELECT / sec	55x2 + 2 x 4K/3600 + 1 x 10K/3600= 115 Tps
Nombre de INSERT / sec	0 + 3 x 4K/3600 = 3.4 Tps
Nombre de UPDATE / sec	0 + 3 x 10K/3600 = 8.3 Tps

4.3. Exigences de temps de réponse

4.3.1. Temps de Réponse des IHM

Tip

Si les clients accèdent au système en WAN (Internet, VPN, LS …), préciser que les exigences de TR sont données hors transit réseau car il est impossible de s’engager sur la latence et le débit de ce type de client.

Dans le cas d’accès LAN, il est préférable d’intégrer le temps réseau, d’autant que les outils de test de charge vont déjà le prendre en compte.

Les objectifs de TR sont toujours donnés avec une tolérance statistique (90éme centile par exemple) car la réalité montre que le TR est très fluctuant car affecté par un grand nombre de facteurs.

Inutile de multiplier les types de sollicitations (en fonction de la complexité de l’écran par exemple) car ce type de critère n’a plus grand sens aujourd’hui, particulièrement pour une application SPA).

Table 6. Exemple de types de sollicitation :

Type de sollicitation	Bon niveau	Niveau moyen	Niveau insuffisant
Chargement d’une page	< 0,5 s	< 1 s	> 2 s
Opération métier	< 2 s	< 4 s	> 6 s
Édition, Export, Génération	< 3 s	< 6 s	> 15 s

Exemple d’acceptabilité des TR :

Le niveau de respect des exigences de temps de réponse est bon si :

Au moins 90 % des temps de réponse sont bons.
Au plus 2% des temps de réponse sont insuffisants.

Acceptable si :

Au moins 80 % des temps de réponse sont bons.
Au plus 5 % des temps de réponse sont insuffisants.

En dehors de ces valeurs, l’application devra être optimisée et repasser en recette puis être soumise à nouveau aux tests de charge.

4.3.2. Durée d’exécution des batchs

Tip	Préciser ici dans quel intervalle de temps les traitements par lot doivent s’exécuter.

Exemple 1 : La fin de l’exécution des batchs étant un pré-requis à l’ouverture aux usagers, ces premiers doivent impérativement se terminer avant la fin de la plage batch définie plus haut.

Exemple 2 : le batch mensuel B1 de consolidation des comptes doit s’exécuter en moins de 4 J.

Exemple 3 : les batchs et les IHM pouvant fonctionner en concurrence, il n’y a pas de contrainte stricte sur la durée d’exécution des batchs mais pour assurer une optimisation de l’infrastructure matérielle, on favorisera la nuit pendant laquelle les sollicitations IHM sont moins nombreuses.

5. Dimensionnement cible

Tip	Nous donnons un dimensionnement final devant supporter la volumétrie statique et dynamique et respecter les exigences.

5.1. Estimation des besoins en ressources par composant technique

Tip	Donner ici RAM, disque et CPU par instance de composant technique déployé (à affiner après campagne de performance ou MEP).

Exemple :

Table 7. Estimation des besoins en ressources par composant technique

Unité déployable	Besoin en (V)CPU par instance	Besoin mémoire par instance (Mio)	Périodes d’activité	Commentaires
`tomcat-batchs1`	<négligeable>	1024	Toutes les heures, 24/7/365	Le serveur d’application reste démarré même en dehors de l’exécution des jobs
`spa`	<négligeable>	50	24/6, activité principale 8-17h Europe/Paris lun-ven	Appli Web SPA, s’exécute dans le navigateur
`bdd-postgresql`	2	2024	24/7, activité principale 8-17h Europe/Paris lun-ven	Instance Postgresql

5.2. Dimensionnement des machines

Voir le modèle de déploiement.

Tip

Cette section fournit le dimensionnement final des machines nécessaires

Pour les VM, attention à vérifier qu’un VCPU = 1 cœur physique (et non un thread si hyperthreading activé)
Le disque interne concerne le disque nécessaire à l’OS et aux binaires. Pour une machine physique, il s’agit de stockage local (disques locaux SDD, NMVe ou HDD). Pour une VM, il peut s’agir d’un disque local sur la machine physique exécutant la VM ou d’un SAN.
Le disque distant concerne du stockage sur une baie de disque (SAN)
Le stockage externe hors SAN concerne du stockage fichier sur un filesystème distribué (NFS, CIFS, WebDav, …) ou un stockage objet (Swift, S3, …)

Table 8. Dimensionnement des machines

Zone	Type de machine	Nb de machines	Nb (V)CPU	Mémoire (Gio)	Disque interne (Gio)	Disque distant SAN (Gio)
Zone 01	VM serveur applicatif	3	2	4	100	0
Zone 02	Machine physique Base de données	1	2	6	50	1024

Table 9. Dimensionnement du stockage externe hors SAN

Nature	Taille (Gio)	Type(s) de machine utilisant ce partage
NFS (montage NAS)	248	Machine physique Base de données
OpenStack Object Storage ("Swift")	20	VM serveur applicatif

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

vue-architecture-dimensionnement.adoc

vue-architecture-dimensionnement.adoc

Vue dimensionnement

1. Introduction

1.1. Documentation de Référence

2. Non statué

2.1. Points soumis à étude complémentaire

2.2. Hypothèses

3. Contraintes

3.1. Contraintes stockage

3.2. Contraintes CPU

3.3. Contraintes mémoire

3.4. Contraintes réseau

4. Exigences

4.1. Volumétrie statique

4.1.1. Métriques

4.1.2. Estimation besoins de stockage

4.2. Volumétrie dynamique

4.2.1. Métriques

4.2.2. Estimation de la charge

4.3. Exigences de temps de réponse

4.3.1. Temps de Réponse des IHM

4.3.2. Durée d’exécution des batchs

5. Dimensionnement cible

5.1. Estimation des besoins en ressources par composant technique

5.2. Dimensionnement des machines

Files

vue-architecture-dimensionnement.adoc

Latest commit

History

vue-architecture-dimensionnement.adoc

File metadata and controls

Vue dimensionnement

1. Introduction

1.1. Documentation de Référence

2. Non statué

2.1. Points soumis à étude complémentaire

2.2. Hypothèses

3. Contraintes

3.1. Contraintes stockage

3.2. Contraintes CPU

3.3. Contraintes mémoire

3.4. Contraintes réseau

4. Exigences

4.1. Volumétrie statique

4.1.1. Métriques

4.1.2. Estimation besoins de stockage

4.2. Volumétrie dynamique

4.2.1. Métriques

4.2.2. Estimation de la charge

4.3. Exigences de temps de réponse

4.3.1. Temps de Réponse des IHM

4.3.2. Durée d’exécution des batchs

5. Dimensionnement cible

5.1. Estimation des besoins en ressources par composant technique

5.2. Dimensionnement des machines