La préservation des données est l’un des enjeux les plus importants de notre futur immédiat, et également l’un des plus sous-estimés. La quantité d’informations recueillies augmente chaque jour, et les datas brutes demandent de plus en plus d’espace. Pourtant, la transmission d’un support à l’autre, la transformation de ces données d’un format rapidement démodé au suivant, et le simple passage du temps, sont autant de facteurs qui ajoutent à l’inévitable corruption des fichiers.
Cette étude porte donc sur le développement d’une méthode de nettoyage des données, selon un processus que l’on espère pouvoir automatiser à moyen terme. Dans le cadre de ma recherche de doctorat, je travaille avec un technicien de laboratoire pour définir les protocoles qui permettront non seulement de préserver, mais également de restaurer les informations afin de retrouver une qualité équivalente à l’originale.
Les succès de notre méthode sur des données-tests (des fichiers artificiellement corrompus, dont certaines parties étaient aléatoirement effacées ou remplacées) nous encouragent à utiliser le protocole sur du matériel réel. Nous espérons ainsi être confrontés à des problèmes qui ne surviendraient pas en conditions de laboratoire, et affiner l’efficacité du procédé.
Pour ce faire, j’ai sélectionné une série de fichiers audio, retrouvés sur un enregistreur personnel, d’un type courant dans les années 1990. Le numéro de série étant effacé, nous n’avons pas pu établir l’année exacte de ce modèle.
J’ai choisi cet enregistreur comme premier essai en conditions réelles à cause de son histoire. Obscure légende sur les réseaux sociaux, il aurait été retrouvé par un pêcheur, flottant au large de la côte japonaise dans une boîte de plastique scellée autour de 2011. La boîte elle-même serait un modèle particulier, utilisé principalement en plongée. Nous n’avons malheureusement pas pu trouver plus d’informations, ou même vérifier la véracité de ce détail.
L’enregistreur aurait été vendu par le pêcheur anonyme à un magasin d’électronique. Yukiro Azuma, un client en vacances à la recherche d’un fil pour son téléphone cellulaire, a acquis l’enregistreur après avoir entendu son histoire de l’employé de l’établissement.
Monsieur Azuma a entrepris de raconter l’anecdote sur les réseaux sociaux, lançant, volontairement ou non, une légende urbaine sur l’origine de l’appareil. Le questionnement est devenu un jeu, qui s’est rendu jusqu’au département océanique de l’Université de Tokyo. Une tentative pour interpréter son origine, suivant les courants de l’Océan Pacifique et la circulation maritime durant la période spéculée de son sauvetage, n’a rien donné de concret.
L’enregistreur a été vendu par la suite à un acheteur anonyme, après une mise aux enchères virtuelle organisée par monsieur Azuma, à un prix non révélé. La trace de l’objet se perd, avant qu’il soit envoyé, il y a deux semaines, à l’équipe du professeur Altberg dans le département d’informatique de la Miskatonic University, dans l’espoir qu’il puisse restaurer les douze heures d’audio contenues dans le vieil appareil.
Ayant personnellement suivi l’histoire de cet enregistreur, j’ai appris par hasard sa présence dans le milieu universitaire, et ai contacté le professeur Altberg pour lui exposer notre projet et lui proposer de participer à la restauration. Le professeur a été assez généreux pour nous envoyer l’appareil.
Le technicien a commencé le travail, suivant mon protocole. Je publierai ici le résultat épuré, sans les données techniques de la restauration, pour la communauté non scientifique qui s’est intéressée à l’histoire de cet enregistreur. Chaque entrée sera retransmise en paragraphe, les espaces représentant une coupure dans le temps. Je regrouperai les textes de façon hebdomadaire, ce qui permettra également de démontrer le travail accompli en une semaine.