Ieri Fantascienza.com è sparita dai vostri computer. E insieme a Fantascienza.com FantasyMagazine, ThrillerMagazine, il Delos Store e tutti gli altri nostri siti - e altri ancora. Una giornata davvero difficile dalla quale siamo riusciti a uscire (quasi) sani. E' stata davvero dura, e allora concedetemi questo piccolo sfogo, come se fosse un blog, per raccontavi com'è andata.
Lunedì sera mi accorgo che il server di Fantascienza.com lampeggia rosso. Verifico e vengo a scoprire che sin dal pomeriggio il server stesso si riavviava da solo ogni venti minuti o mezz'ora (dopo quasi un anno di uptime risalente all'ultimo upgrade). Comincio a sudare freddo.
Cerco di capire se ci sono problemi con i dischi, ma sembra tutto a posto. Faccio delle cose, sistemo dei file che potevano dare problemi, sembra che stia su ma niente, si riavvia ancora.
Mio malgrado devo rimandare l'intervento alla mattina dopo per chiamare l'assistenza. Dormo poco e male facendomi rigirare nella testa tutta la notte fsck, spostamenti di ip e persino - chissà perché - virtualizzazione di macchine unix.
Arriva la mattina, riesco a fare un backup completo e aggiornato di tutto quanto in modo da essere in grado di attivare alla mala parata una macchina di riserva. E alle 9 in punto chiamo l'assistenza della Dell.
Mi risponde un volenteroso Massimiliano Ledda - dico il nome per rendergli merito di una giornata davvero difficile in cui mi è stato di grandissimo aiuto: grazie! - che per prima cosa mi fa fare la verifica dei dischi: qualche blocco rovinato ma niente di che, non è quello il problema.
Ci vuole il programma che faccia il test dell'hardware. Esiste in due versioni: MS-DOS e Linux.
Noi abbiamo FreeBsd.
Ok, masterizziamo un cd di avvio live con linux e il programmino, e un altro con su MS-DOS. Rifar partire il server, attivare il bios, dirgli di partire da cd, riavviare, inserire il cd, aspettare.
Non parte.
Provo su un altro pc. Parte.
Riprovo sul server. Non parte.
Altra analisi di tutte le particolari configurazioni del bios ma niente. L'unica è provare con un altro lettore cd-rom.
Ok, smonto il vecchio server in disuso per estrarre il cd-rom. Dieci minuti buoni a lottare con il molex che non vuole mollare la presa. Per fare l'operazione devo tirar giù il server dal rack (pesa almeno venti chili) ce la faccio e sostituisco il cd-rom. Parte!
Improvvisamente lo schermo diventa tutto a righette frastagliate e l'immagine dell'interfaccia diventa una sorta di stereogramma. Il KDE di Linux non è compatibile col mio monitorino dei server. Ok, spostare il 17 pollici dal PC e portarlo vicino al server, collegare, ok va!
Oh oh, ci vuole il mouse. E Linux mica lo accetta il mouse se glielo dai dopo che è partito. Riavviamo. Ci siamo.
Ok, test di tutto quanto e alla fine se ne ricava che c'è un problema su un banco di ram. Sposti la ram ed è finita? Magari.
C'è il fatto che il server si memorizza una sorta di log dei problemi della ram, e finché non lo hai pulito continua a darti errore, quindi non sai se il problema è risolto. Quindi bisogna pulire questo log. Per farlo ci vuole un programmino apposta che gira solo su MS-DOS.
Che ovviamente sul server non c'è, perché c'è FreeBSD.
Niente paura, possiamo fare un dischetto di avvio: dischetto? Cos'è, quelle robe quadrate che non vedo più da dieci anni? E il server non ha neanche il lettore dei floppy.
Ok, altra soluzione: c'è un programmino che si collega via rete, basta avere un pc Windows collegabile in rete. Ce l'ho. Manda il programmino via email.
L'antivirus della Dell vede che c'è un allegato eseguibile alla mail e la blocca.
Tre tentativi: niente da fare.
Usiamo un altro account senza antivirus: questa volta è il mio antivirus che lo blocca.
Proviamo via ftp. Metto su un account volante: niente. Proviamo con un altro: niente. Il firewall della Dell probabilmente blocca l'ftp.
Soluzione finale: creo un account di posta sul mio server di posta, Massimiliano si connette via web al webmail del mio server e me lo manda. Viene ancora bloccato, ma io entro nel webmail con lo stesso username e lo pesco dalla posta spedita. Ce l'ho!
Ok, lo installo, lo faccio partire ma non si connette al server.
A questo punto decido che riattaccare lo spinotto della rete, che avevo staccato quando ho tirato giù il server dall'armadio, potrebbe essere utile. Funziona!
Log cancellato.
Sposto le ram. Ancora errore.
Tolto le ram sospetto. Niente più errore.
Il server è tornato.
Bilancio finale: un cdrom e un hard disk hot swappable che verranno cambiati in garanzia e circa 400 euro di ram ECC Registered da buttare. Ma almeno i siti sono su e finalmente vanno.
Sono le 18 di una giornata d'inferno. Ma ce l'abbiamo fatta.
Per i prossimi giorni il server sarà un po' più lento: andiamo con solo 1GB di ram contro i 3 che avevano. Ma abbiamo già ordinato i pezzi, resistete.
PS. Le notizie di oggi sono le stesse di quelle di ieri: tanto erano rimaste offline tutto il giorno, quindi probabilmente non le avete ancora lette.
Aggiungi un commento
Fai login per commentare
Login DelosID