Ce n'est pas mon habitude mais là, je vais poster un billet d'humeur (noire).
J'ai bien conscience qu'un billet d'humeur n'est qu'une expérience personnelle, peut être que cela se passe mieux pour d'autres mais ce que j'ai vu et vécu me laisse penser le contraire. Tous les faits relatés ici sont rééls et toute ressemblance avec une histoire vraie ne serait pas fortuite du tout ;o)
Ce billet est un peu long mais il devrait se lire facilement, c'est tellement croustillant et plus de rebondissement tous aussi invraisemblables les uns que les autres.
J'ai donc eu l'occasion de suivre pendant 2 ans un serveur dédié hébergé chez Claranet (société bien connu et qui a pignon sur rue). Je dois reconnaître que mon expérience n'est vraiment pas des plus joyeuse et laisse penser que cette activité est réalisé soit par des amateurs soit avec un "jeanfoutisme" énorme.
La phase d'avant-vente c'était pas si mal passée, on nous avait vendu la maîtrise des infrastructures et de l'OS. Allons-y, ils ont l'air sérieux. Nous avons donc choisi un serveur dédié avec raid 1 et backup externe. Ce choix était pour nous important car ce serveur contient des données très importante tel le site web et les mails/mailing list.
Après quelques mois d'utilisation, on remarque rapidement qu'il faut souvent "aider" les admins de Claranet pour débloquer des situations. Mon collègue (qui est loin d'être manchot sur Linux) devait leur envoyer la solution pour accélérer les choses. On a eu quelques mails du genre à mon avis, d'après le message d'erreur que l'on voit et en cherchant 2mn sur google, on trouve cette solution.
. Réponse de Claranet : ah oui, on n'avait pas trouvé.
Passons, tout le monde peut se planter, moi le premier. Puis premier incident qui me fait peur. J'appelle le support pour avoir plus de droits sur la machine (seul Claranet était root). Il était 20h30, l'admin me dit que tout est bon. Je lui réponds que non et la.. la phrase mystique : ah non, pardon j'étais sur la machine d'AirBus.....
..... (sic).
Allez, on continue, même pas peur... Une panne électrique dans leur centre.... Bon bah, pas de bol hein, les 2 disques ont sautés.... On repart sur les sauvegarde alors... Claranet: euh bah en fait, on est désolé.... la conf apache & les mailing list n'étaient pas le script de sauvegarde
.... re-sic.. La on frise l'incompétence.
On continue ? Allez, ça fera un best-of comme ça.
Vous vous souvenez sûrement de la faille vmsplice sur les kernels 2.6.17 et supérieur. Notre serveur sur une debian sarge, avait (et on ne sait pas pq) un kernel 2.6.19-rc3.. Oui oui, vous avez bien lu, un 2.6.19-rc3 sur une sarge en prod' !?! Pour rappel, nous aurions du avoir un 2.6.8. Du coup, nous sommes sensible à la faille alors que nous n'aurions pas du y être sensible... Après 15j d'insistance (de notre part), ils acceptent de faire quelque chose. C'est hallucinant d'être obliger de demander ce genre d'updates, et puis c'est pas comme si c'etait un exploit root ;o)
S'en suit, une série d'échange de mail dans lequel je leur demande pourquoi nous avons ce kernel rc (sic) sur un serveur en production. Réponse : c'est parce qu'à l'époque c'était le dernier en date et donc le plus sécurisé
... Je vous laisse apprécier.....Bah oui, un dernier kernel et qui plus est en RC est forcément plus sécurisé..... Ca devient franchement n'importe quoi... Au bout du compte on se retrouvera avec un 2.6.23 sur une sarge.. la grande classe pour le suivi des updates de sécu...
On se décide de partir de chez eux, et donc après la migration réussie chez un autre herbergeur, on résilie le contrat. Nous avions pris l'option d'acheter la machine (un assemblage "noname" de chez Claranet) dès le départ, donc je vais la récupérer chez eux.
Et là on accroche la ceinture... Je descends en salle machine avec l'ingénieur, la salle est moyenne (on apprécie le câble série qui traverse la salle et qui nous oblige à passer derrière le rack pour accéder à l'allée centrale). Premier constat, assez peu de machines et surtout des machines avec des disques dérackés (sûrement des machines éteintes ou morte).
Au bout de 2mn, l'ingénieur me demande le "mid" de ma machine. C'est l'identifiant interne de Claranet pour identifier la machine... Forcement, je ne le connais pas... Donc il repart le chercher... Une fois le mid en main, on trouve rapidement la machine. Et là, mon coeur s'arrête... Ma machine fait partie des machines dont le second disque est déracké.... Autrement dit, le RAID1,.... A ce moment là, j'ai une pensée profonde pour les autres machine qui sont dans le même cas que la mienne.... A posteriori, on a testé le disque, il était mort.....
Puis l'ingénieur passe derrière la machine, me demande l'autorisation pour la couper et là encore une phrase mystique : bon, je coupe.... j'espère que c'était la bonne !
... (sic)... je reste sans voix...... Après être remonté à l'accueil, il ira vérifier que c'était bien la bonne.... Autrement dit, la machine que j'avais sous le bras, aurait pu être celle d'un autre client....
Ce dernier contact que j'ai eu avec eux me laisse franchement un goût amer dans la bouche... Laisser chez eux une machine dans ces conditions, avec le risque que cela représentait... C'est inimaginable... Le tout bien sûr pour plusieurs centaines d'euros par mois..... Pour moi, c'est terminé, l'hébergement chez Claranet c'est terminé. Si vous en avez chez eux, je me conseille très sincèrement d'en partir au plus vite.