2. BESOIN D’UNE NOUVELLE BASE DE DONNÉES
Données transactionnelles: Analyse temps réel
Données structurés
Sources: Reporting, Analyse, Planning,
Sources: Machines, utilisateurs, Simulation
CPU (Multicore + RAM)
Stockage des données
Gestion d’évenement: Analyse Text
Flux de données Données non structurés
Sources: Machines, capteurs, Sources: Web, Reseau sociaux etc..
3. MYTHES DE L’OLTP
! OLTP: Optimisé pour l’écriture
! OLAP: Optimisé pour le Reporting
• En pratique, les chiffres sont semblables.
4. VISION DE SAP HANA
! Combiner l’OLTP et l’OLAP en utilisant du
• Hardware moderne (Multi CPU Multi Core)
• Analyse temps réel
• Simplifier la structure des d’applications d’entreprise ( en
faisant plus de traitement de la base de données)
! En plus
• Ne plus utiliser d’ ETL (Extraction, Transformation, Loading)
• Ne plus utiliser d’aggregat pré-calculé
5. CHARACTERISTIQUES D’UNE APPLICATION
D’ENTREPRISE
! Beaucoup de colonne ne sont pas utilisé
! Beaucoup de colonne on une cardinalité basse
! Les valeurs ‘Null’ et valeur par défaut sont majoritaire
! Les applications d’entreprise sont facilement compressible
6. PROGRÈS DU HARDWARE
! CPU: 8 (8-16 Core)
! RAM: 4 TB
! Technologie de partage mémoire inter-CPU, inter Blade
! Capacité Core: 2GB/s
9. ARCHITECTURE SAP HANA
! Les données sont stocké
en mémoire
! SSD: Recovery, archivage
! La mémoire est le nouveau
goulot d’étranglement
! Compression réduit le
nombre E/S
! Opération direct sur les
données compressé
10. STOCKAGE DES DONNÉES EN COLONNE ET
COMPRESSION
! 8 milliard d’humains
! Structure de la table:
• Nom
• Prenon
• Sexe
• Pays
• Ville
• Date de naissance
• 200 Octets par lignes
! Taille de stockage: 8 Milliard * 200 = 1 490 GB
11. STOCKAGE DES DONNÉES EN COLONNE ET
COMPRESSION
! Stockage en ligne ! Stockage en colonne +
Nom
Prenom
Sexe
Pays
Ville
Date
de
naissance
Compression
Couet
Romain
M
France
Paris
01.01.1973
Nom
Prenom
Sexe
Pays
Ville
Date
de
Naissance
1
1
1
1
1
1
Savornin
Dominqiue
M
France
Paris
01.01.1973
2
2
1
1
1
1
3
3
1
1
1
2
Goffaux
Guillaume
M
France
Paris
01.01.1984
4
4
1
1
1
3
Taspinar
Ossman
M
France
Paris
01.01.1982
! Dictionnaire
Prénom
Nom
Ville
Date
de
Naissance
Sexe
Clé
Text
Clé
Text
Clé
Text
Clé
Text
Clé
Text
1
Romain
1
Couet
1
Paris
1
01.01.1973
1
M
2
Dominique
2
Savornin
2
01.01.1984
2
F
Pays
3
Guillaume
3
Goffaux
3
01.01.1982
Clé
Text
4
Ossman
4
Taspinar
1
France
12. STOCKAGE DES DONNÉES EN COLONNE ET
COMPRESSION
! Stockage en ligne ! Stockage en colonne
• Bas cout CPU pour la • Reconstruction d’une ligne
reconstruction d’une ligne est couteux
• Cout élevé pour un scan • Lecture séquentiel rapide
séquentiel
13. STOCKAGE DES DONNÉES EN COLONNE ET
COMPRESSION
Nombre
d'Octet
Nombre
de
bit
requis
requis
Colonne
Cardinalité
(Compressé)
Non
compressé
Plain
Size
(GB)
Colonne
(GB)
DicConnaire
(GB)
Nom
5
000
000
23
49
365,08
21,42
0,23
Prenom
8
000
000
23
50
372,53
21,42
0,37
Sexe
2
1
1
7,45
0,93
0,00
Ville
1
000
000
20
49
365,08
18,63
0,05
Pays
200
8
49
365,08
7,45
0,00
Date
de
naissance
40000
16
2
14,90
14,90
0,00
84,75
0,65
Total
1490,12
85,40
! Ratio de stockage:
• 17/1
• En pratique SAP se base sur un ratio 7/1
15. IMPLEMENTATION DE SAP HANA
! HANA sur BW
• Remplace la base existante
• Transparent pour BW
! HANA sur ECC
• La base existante reste
active
• Réplication
• Log
• Trigger
• ETL (BO Data Services)