Diapositives

Report
SAUVEGARDES DÉLOCALISÉES
ET REPRISE D'ACTIVITÉ AU SIMSU
LAURE PERRET - DIDIER MATHIAN – WILLIAM MARCHAL
Sauvegardes délocalisées et reprise d’activité - JRES 2013
PLAN
 Présentation du SIMSU et du projet
 Scénario de reprise d'activité
 Les solutions utilisées
 Tests de reprise d’activité
 Bilan du projet, conclusion et perspectives
Sauvegardes délocalisées et reprise d’activité - JRES 2013
PRÉSENTATION DU SIMSU
 Structure inter-universitaire : 7 établissements
 Socle commun de service : réseau, annuaires, mail
étudiants …
 Applications mutualisées : scolarité, RH, finances,
web, plateformes collaboratives …
criticité des données et des services
Sauvegardes délocalisées et reprise d’activité - JRES 2013
INFRASTRUCTURE SIMSU
Rez de chaussée
1er Étage
200 VM, 334 vCPU
795 Go ram
25 To
VMware ESX
VMware ESX
7 hôtes
1.4 To ram (60%)
144 cœurs (20%)
Cluster
vmware
HA/DRS
SAN FC
Metro Cluster
NetApp
FAS 3240
Sauvegardes délocalisées et reprise d’activité - JRES 2013
75 To (70%)
Moyens
Matériel
LE PRA
 Ensemble de Moyens
visant à garantir
la reprise d’activité
Moyens
Logistique
9
8
7
6
5
4
3
2
1
0
Couverture actuelle de notre
PRA
Moyens
humain
Sauvegardes délocalisées et reprise d’activité - JRES 2013
Moyens
Logiciel
POURQUOI CE PROJET?
 Procédures anciennes, fastidieuses et trop longues
 Reconstruction d’infrastructure, réinstallation des
applications, restauration des données
 Virtualisation : toujours plus de serveurs
 Audit du système financier
 incertitudes sur le temps de reprise
 coût de perte des données
Mise en place de mécanismes de reprise d’activité complets
Nécessité d’une infrastructure délocalisée prête à fonctionner
Sauvegardes délocalisées et reprise d’activité - JRES 2013
PLAN
 Présentation du SIMSU et du projet
 Scénario de reprise d'activité
 Les solutions utilisées
 Tests de reprise d’activité
 Bilan du projet, conclusion et perspectives
Sauvegardes délocalisées et reprise d’activité - JRES 2013
SCÉNARIO DE REPRISE : SCHÉMA LOGIQUE
 Sinistre sur notre infrastructure SIMSU
 Perte de nos serveurs et de nos données
 Par où commence-t-on et avec quels moyens?
PC
PRA
Accès au site
PRA
Reconfiguration
réseau
DNS
Sauvegardes délocalisées et reprise d’activité - JRES 2013
Redémarrage
VM
Restauration
SCÉNARIO DE REPRISE : RECONFIGURATION RÉSEAU
Sauvegardes délocalisées et reprise d’activité - JRES 2013
REDÉMARRAGE DES MACHINES VIRTUELLES
1
R-PRA
Activation
vlan simsu+acl
Client vsphère
directement sur
esx « reprise »
Port console
1’
Démarrage des
réplicas
PC PRA
Directement raccordé
à nos équipements
DNS Replica
Rdp bureau
à distance
Sauvegardes délocalisées et reprise d’activité - JRES 2013
2
VirtualCenter
réplica
Serveur de
Sauvegarde
Restauration des
VM
PLAN
 Présentation du SIMSU et du projet
 Scénario de reprise d'activité
 Les solutions utilisées
 Tests de reprise d’activité
 Bilan du projet, conclusion et perspectives
Sauvegardes délocalisées et reprise d’activité - JRES 2013
INFRASTRUCTURE SIMSU-PRA (SITE DE VIALLET)
2 vm de sauvegarde
Veeam
Rsync
ESX Sauvegarde
Site PRA :
Grenoble INP Viallet
SIMSU -> VIALLET
9 Km
Fibre dédiée 10Gb/s
Maitrise du routeur
R-PRA
DNS
replica
Vcenter
replica
ESX reprise
2 vm en standby
2 Esx 5.1
Chassis blade
2 lames
780 Go ram
32 cœurs
SAN iSCSI 10Gb
Sauvegarde
120To
Sauvegardes délocalisées et reprise d’activité - JRES 2013
Reprise
40To
MÉCANISMES DE SYNCHRONISATION ENTRE LES SITES
 Synchronisation routeur R-PRA : vlan et acl
 Délocalisation des sauvegardes
 Machines virtuelles : logiciel Veeam Backup & Recovery
 Régulier mais pas forcement quotidien
 Bases de données : rsync
 Quotidien
 Réplication : vCenter + DNS
Sauvegardes délocalisées et reprise d’activité - JRES 2013
MÉCANISMES DE SAUVEGARDE
Sauvegarde
machine virtuelle
Snapshot Netapp SMVI
VM
Sauvegarde
machine virtuelle
VM
OS
Veeam
VM
Fichiers
Base de données
Sauvegarde Fichiers
Netbackup/Bacula
Dump
(Bases oracle
arrêtées)
Sauvegarde Fichiers
Rsync
/backup_local
Site SIMSU
Sauvegardes délocalisées et reprise d’activité - JRES 2013
Site Viallet
FOCUS VEEAM
 Réplication
 Backup
« Reverse incrémental » :
Incr
J-2
Incr
J-1
Full
J
Incr
J-3
Incr
J-2
Incr
J-1
 Déduplication + compression
Volumétrie
Source
Volumétrie
modifiée
quotidiennement
Volumétrie
transférée
Volumétrie stockée
(7 jours de rétention)
18 To
1,2 To
500Go
7 To
Sauvegardes délocalisées et reprise d’activité - JRES 2013
+ incr
J+1
Full
J
SOLUTIONS DE BASCULE
Accès au site
PRA
Reconfiguration
réseau
DNS
Sauvegardes délocalisées et reprise d’activité - JRES 2013
Redémarrage
VM
Restauration
MÉCANISMES DE BASCULE RÉSEAU
Sauvegardes délocalisées et reprise d’activité - JRES 2013
MÉCANISMES DE RESTAURATION
Sauvegarde VM
Snapshot Netapp
SMVI
VM
Incident
majeur
Sauvegarde Fichiers
Netbackup/Bacula
Restauration
machine virtuelle
Sauvegardes délocalisées et reprise d’activité - JRES 2013
Veeam
OS
VM
Fichiers
Base de données
Restauration
Base (Dump)
/backup_local
Site SIMSU
1
VM
Restauration Fichiers
3
Rsync
2
Site Viallet
PLAN
 Présentation du SIMSU et du projet
 Scénario de reprise d'activité
 Les solutions utilisées
 Tests de reprise d’activité
 Bilan du projet, conclusion et perspectives
Sauvegardes délocalisées et reprise d’activité - JRES 2013
2 TESTS DE REPRISE
1. Validation scénario réseau: Re-routage d’un VLAN de test avec des VM de test.
2. Validation scénario reprise de VM : Restauration des vm SIFAC de prod sur site PRA et
validation par les gestionnaires des 7 universités.
RESTAURATION VEEAM (VM)
7 machines virtuelles
RESTAURATION RSYNC (restauration des
dump)
7 dump
RESTAURATION SAP (restauration base)
7 restaurations
Durée
6H30
Volumétrie
4,00 To
1H
1,00 To
1H
Sauvegardes délocalisées et reprise d’activité - JRES 2013
Temps de reprise : 8H30
PLAN
 Présentation du SIMSU et du projet
 Scénario de reprise d'activité
 Les solutions utilisées
 Tests de reprise d’activité
 Bilan du projet, conclusion et perspectives
Sauvegardes délocalisées et reprise d’activité - JRES 2013
BILAN DU PROJET
 Facilités
 Trouver un bon site PRA
 Prêt de matériel pour maquettage avant investissement
 Association des partenaires et de notre équipe réseau
 Difficultés
 Choix de topologie réseau
 Choix de logiciels de sauvegarde
 Prise en main des équipements
Sauvegardes délocalisées et reprise d’activité - JRES 2013
CONCLUSION
I
n
c
i
d
e
n
t
m
a
j
e
u
r
Incident
Niveau de service
Mécanisme local
Panne matérielle
Panne électrique
Continuité d’activité
Cluster VmWare + Netapp
Perte d’un fichier
RPO : J-1 (svg la nuit)
RTO : <1H
Granularité : fichier
Netbackup ou Bacula
Corruption Base d’une
base de donnée
RPO : J-1 (svg la nuit)
RTO : <1/2 j
Granularité : BD
Netbackup ou Bacula
rsync (site Viallet)
Corruption VM/système
RPO : J-1
RTO : <2H
Granularité : vm
SMVI (site SIMSU)
Veeam (site Viallet)
Incident site SIMSU
(excepté nœud
RENATER)
RPO : J-1
RTO : 1 à n jours.
Granularité : 1 ou n vm
Amélioration du niveau de service
Sauvegardes délocalisées et reprise d’activité - JRES 2013
Mécanisme délocalisé
PRA :
PERSPECTIVES
 Délocalisation de l'archivage
 Réduction des points faibles : point d'entrée réseau,
équilibreur de charge
 Systématisation des tests
 Elargissement du PRA : chaine d'alerte, moyens
humain et logistique
 Cloud hybride
Sauvegardes délocalisées et reprise d’activité - JRES 2013

similar documents