Valoriser les archives marégraphiques pour étudier les variations des composantes du niveau de la mer
Les études montrent que des séries temporelles de plus de 60 ans sont indispensables pour tirer des tendances à long terme sur les composantes du niveau marin comme :
- l'évolution du niveau moyen de la mer ;
- l'évolution et amélioration des niveaux extrêmes ;
- l'évolution des ondes de marée et des effets météorologiques ;
- la variabilité spatiale et temporelle des tendances du niveau de la mer.
Malheureusement, les longues séries marégraphiques sont rares. Pourtant, des données analogiques de niveau d'eau existent comme en France où le potentiel d'archives marégraphiques papier est considérable.
Figure 1: Photos des archives marégraphiques au Shom à Brest.
Etapes successives nécessaires à la construction de la série marégraphique
Inventaire des données
Dans un premier temps il s’agit de réaliser un inventaire de données marégraphiques pour un même site d’observation. Cet inventaire est constitué d’un coté de données marégraphiques, mais également de données dites auxiliaires aussi appelées métadonnées. Celles-ci renseignent sur la mesure (instrument de mesures utilisé et son entretien, référence verticale, référence temporelle, éventuels dysfonctionnements …).
Les données marégraphiques existent sous forme de registres de marée ou sous forme de marégrammes.
Numérisation et digitalisation
Dans un deuxième temps les marégrammes et registres de marées sont dématérialisées. Une fois sauvegardées sous format d’image numérique, le processus de digitalisation peut alors commencer, selon le type de donnée à disposition.
Registres de marée
Figure 2: Registre de marée de Socoa de janvier 1880 (Archives Shom).
Les hauteurs d'eau horaires notées sur les registres sont numérisées sur un tableur numérique. Pour identifier plus facilement les erreurs ayant pu être faites par l'observateur, mais également les erreurs de saisie, deux méthodes de contrôle ont été appliquées en temps réel sur les données saisies:
Figure 3: Contrôles mis en place en temps réel pour détecter les erreurs de saisie ou les erreurs de l'observateur. A- Le tableau de digitalisation des hauteurs d'eau de mars 1908 pour chaque heure. Les nuances de couleurs montrent bien les pleines mers (rouge) et basses mers (bleu) ainsi que le vives eaux (rouge/bleu foncé) et les mortes eaux (vert/jaune) : et B- une représentation schématique de la courbe du 31 mars 1908 (en noir) et le jour suivant (en bleu). Les indications en rouge et violet montrent deux anomalies sur le tableau (carré) et sur le graphique (cercle). Il ne s'agit pas d'erreurs de saisie, mais d'erreurs de saisie sont immédiatement corrigées. Les autres erreurs ont été marquées par un remplissage de cellule (rayure diagonale) pour indiquer que cette erreur a été vérifiée dans les documents papiers ; il est, par conséquent, plus facile de voir si une erreur, identifiée à une phase ultérieure de la reconstruction, était déjà vérifiée ou non.
En mettant en forme les cellules du tableur numérique en leur assignant une couleur dépendante de la valeur saisie, il devient facile d'identifier visuellement des niveaux "anormaux" entre des valeurs voisines. Les nuances de couleurs permettent également d'identifier facilement les pleines et basses mers ainsi que les périodes de vives eaux et de mortes eaux. En représentant graphiquement les niveaux d'eau, les pics ou valeurs aberrantes sont facilement identifiables)
Marégrammes
La numérisation des données est un travail long et fastidieux mais essentiel à ce type d'étude car ce n'est qu'une fois converties en format numérique que les données historiques peuvent être analysées et utilisées pour répondre au questionnement scientifique.
Avant l'arrivée des marégraphes numériques, le niveau marin était levé à partir de marégraphes mécaniques et les enregistrements s'effectuaient sur des marégrammes papiers. Afin d'exploiter ces documents anciens, un travail important de scannage doit être fait avant l'extraction du signal.
Figure 4: Marégramme de Socoa daté du 19 au 26 novembre 1956 (AD 64 - Bayonne - 2003W-06).
Le CEREMA a développé un logiciel en langage Matlab dans le but initial de récupérer de façon semi-automatique des données anciennes de niveaux d'eau (signal marégraphique, de niveau d'eau en général, pluviogrammes, …) et de les rendre disponible/analysable au format numérique. NUNIEAU (NUmérisation des NIveaux d'EAU) est un logiciel de traitement d'image visant à extraire le signal analogique étudié en se basant sur un algorithme de reconnaissance des couleurs. Ce dernier permet de dissocier le signal du fond de plan dès lors que les couleurs diffèrent. En outre, la finalité du traitement étant d'obtenir une série temporelle de hauteur d'eau la plus propre possible, il possède également des outils de calage altimétrique et temporel, et des outils de nettoyage.
Quels que soient les formats des marégrammes, et par conséquent les appareils à utiliser pour effectuer cette action, il est essentiel d'enregistrer les fichiers numériques en format « .tif ». La définition des images scannées va varier en fonction des dimensions du marégrammes, l'objectif étant d'obtenir un fichier ne dépassant une taille de 50-60 Mo avec la meilleure résolution possible. 300 à 400 dpi est la résolution optimale.
Quatre grands types de marégrammes ont été identifiés en fonction de leurs états (Figure 5).
Type 1 (Figure 5A) : Les marégrammes sont dans un bon état et le signal est bien visible. Il est possible de bien discriminer le signal du fond. Le logiciel NUNIEAU vectorise le signal sans difficulté.
Type 2 (Figure 5B) : Les marégrammes sont dans un état moyen et le papier est noirci. Néanmoins, le signal est (partiellement) récupérable par NUNIEAU.
Type 3 (Figure 5C) : Les marégrammes sont dans un mauvais état et sont très noircis. Le signal est très difficile à identifier, même parfois invisible.
Type 4 (Figure 5D) : Les marégrammes sont dans un état moyen. La feuille est dans une bon ou moyen état de conservation, mais le signal est difficilement visible voire invisible. Souvent les pleines et basses mers et même parfois l'ensemble de la courbe, sont retracées au crayon. Ces types de marégrammes concernent doivent faire l'objet au préalable d'une retouche d'image (Figure 6) afin de faire apparaitre les courbes qui seront par la suite extrait par NUNIEAU.
Figure 5: Les différents types des marégrammes à digitaliser pendant la reconstruction des données marégraphiques historiques de Socoa. A) type 1, 142 marégrammes soit 18,3% (ex. 15-22 déc. 1970 ; AD64 – 2003W-20) ; B) type 3, 50 marégrammes soit 6,4% (ex. 29 oct. – 5 nov. 1963 ; AD64 – 2003W-13) ; C) type 4, 32 marégrammes soit 4,1% (ex. 25 nov. – 2 déc. 1963 ; AD64 – 2003W-13) ; et D) type 2, 553 marégrammes soit 71,2% (ex. 28 oct. – 4 nov. 1957 ; AD64 – 2003W-07)
Figure 6: Marégramme de type 2 traité à l'aide du logiciel d'édition et de retouche d'image GIMP. a) l'image originale (datée du 7 au 15 octobre 1957 ; AD64 - Bayonne - 2003W-07). Les signaux sont invisibles ; b) image modifiée après traitement. Les signaux deviennent visibles.
L'extraction du signal marégraphique nécessite plusieurs étapes:
1. Le renseignement des métadonnées à associer aux mesures de hauteurs d'eau, telles que la date de début des mesures, les caractéristiques de la grille (nombre et valeur des carreaux unitaires selon x et y), commentaires optionnels, … ;
2. Le calage du marégramme, à la fois en temps et en hauteur, grâce à la définition de points de calages dont les hauteurs et heures sont connues. Le logiciel met à disposition plusieurs outils permettant de vérifier la qualité de ce calage ;
3. La définition de la couleur à extraire d'après ses composantes de rouge, vert et bleu (valeurs RVB). La bonne définition de ces paramètres est primordiale pour ne pas trop extraire, ou au contraire ne pas assez extraire de pixels ;
4. Le nettoyage de l'image au cours duquel sont dessinées les zones à garder/exclure lors du traitement. Dans le cas d'un marégramme à courbes multiples, c'est au cours de cette étape qu'est défini le masque d'extraction.
Figure 7: Illustration des étapes à suivre pour digitaliser une courbe de marée avec NUNIEAU. Les marégrammes de St Malo dans les années 1920 comprennent des courbes sur des périodes d'un mois. Après la définition des points de calage, la numérisation consiste à dessiner les courbes en repassant sur les tracés (une courbe représente une ligne), le signal numérique digitalisé est finalement extrait sous forme de fichier texte.
L'homogénéisation en hauteur et en temps
Le système de temps utilisé n'est pas le même en fonction des époques (Temps Solaire Vrai, Temps Solaire Moyen d'un point, temps Universel) et la notion de référence verticale peut également évoluer au cours du temps (le zéro du marégraphe est-il resté le même ? Correspond-il au zéro hydrographique ? Est-ce que ce dernier est stable depuis le 19ème siècle ?, …).
Dans le but d'obtenir une série reconstruite cohérente dans le temps et validée, il est nécessaire de prendre en considération l'ensemble des informations relatives aux mesures de hauteurs d'eau disponibles (métadonnées), et de i) corriger les mesures lorsque cela est nécessaire et possible, ii) exclure certaines données de qualité trop incertaine, et iii) uniformiser les mesures (en temps et en hauteur). Ce travail de définition de la qualité des données est primordial pour toutes les études ultérieures s'appuyant sur les données (évolution du niveau de la mer, niveaux extrêmes…).
Pour ce qui est de l'homogénéisation temporelle, toutes les données digitalisées sont converties en Temps Universel (UTC), système utilisé de nos jours. Pour cela, les données en Temps Solaire Vrai (TSV) sont converties en Temps Solaire Moyens (TSM) grâce au calcul de l'équation du temps. Par la suite, une correction basée sur la différence de longitude entre la position de Saint-Nazaire et Greenwich a été appliquée pour finalement parvenir à l'UTC. Pour les périodes plus récentes, il a fallu surtout veiller à convertir les heures locales (heures d'été / d'hiver) en UTC lorsque cela était nécessaire.
L'uniformisation verticale de la série marégraphique consiste à réduire toutes les mesures de hauteurs d'eau à un niveau de référence commun. De manière générale, le zéro hydrographique (ZH) est choisi comme référencement.
Validation de la série numérique
Après la numérisation, les données inédites ont été contrôlées, corrigées si possible et validées afin d'obtenir une série temporelle de hauteurs d'eau fiable. Lors de cette phase de correction, des "étiquettes" ont été attribuées aux données permettant de qualifier la qualité de chaque mesure (Tableau ).
Les données brutes sont fournies avec les étiquettes (Figure ). Les données de mauvaises qualités (4) ont été directement supprimés de la série validée ; les données dans la série validée qui ne sont ni supprimées de la série validée : les données dans la série validée qui ne sont ni supprimés ni étiquetée "2" ou "3" sont considérées comme des données de bonne qualité (étiquette "1").
Étiquettes qualités définies pour caractériser les mesures de hauteur d'eau.
Figure 8: Exemple du travail de validation de données: Attribution d'étiquettes qualité aux données de niveau d'eau à Socoa. Zoom sur la période entre avril 1883 et septembre 1885. Vert clair = données de bonne qualité (1) ; vert foncé = données qui sont probablement bonnes (2) ; marron = données qui sont probablement mauvaises (3) et rouge = données de mauvaise qualité (4).
A découvrir également
-
Travaux de Data Archaeology
Depuis les années 2000, un important travail de "data archeaology" a été initié au Shom, répondant aux recommandation du programme GLOSS sur le…