[Driftstörning] Problem med Chalmers gemensamma filtjänst

Einar Blåberg eb at chalmers.se
Tors Sep 11 09:54:06 CEST 2008


Vi har de senaste dagarna haft stora problem med den gemensamma 
filtjänsten, detta har drabbat främst teknologer men även anställda.

Vad har vi gjort för att lösa problemen?
* I slutet av förra veckan konstaterades att en av de större felkällorna 
var applikationen Exceed, denna är sedan onsdag lunch temporärt 
borttagen i StuDAT. Att det tagit så lång tid mellan konstaterande och 
åtgärd är för att vi måste veta att vi kan backa tillbaka till 
normalläget igen efter vi gör en förändring och att förändringarna inte 
leder till andra värre konsekvenser.
* Klienterna i StuDAT kommer under denna veckan att få nya inställningar 
som bör minska deras trafik mot filservern och därmed minska lasten på 
filservern.
* Då det främst är en av noderna i filtjänsten som drabbas så kommer vi 
att flytta användare från den till de andra noder, detta för att sprida 
ut lasten jämnare mellan de ingående komponenterna i tjänsten.
* Vi jobbar nu med att uppdatera serverprogramvaran och mjukvarumässigt 
förbättra prestandan på filservern, detta beräknas vara klart i mitten 
av nästa vecka. Uppdateringen ingår i det vanliga underhållet av 
tjänsten men har tidigarelagts i och med problemen som uppkommit.

Vad kommer hända på längre sikt?
Det pågår sedan början av året ett projekt för att byta teknisk lösning 
för filtjänsten, den nya tjänsten kommer tas i drift i November då ett 
flertal av de mindre filservrar som ITS ansvarar för kommer att migreras 
till nya lösningen. I början av nästa år kommer den gemensamma 
filservern att migreras till den nya lösningen.

Det har inte funnits en enskild faktor som gett upphov till problemen 
men bland det som påverkat mest finns applikationer i StuDATs 
basplattform som vid inloggning skapat orimligt hög last på filservern. 
Detta märks när många loggar på datorerna vid samma tid (lunchtid har 
det märkts tydligast).

Vi ser allvaret i situationen och förstår väl hur det drabbar våra 
kunder efterssom det drabbar oss på precis samma sätt med långsamma 
eller helt stillastående arbetsstationer. Vi har prioriterat ner eller 
helt bort andra arbetsuppgifter för att felsöka och åtgärda problemen 
med filtjänsten.

Avvikelsen från normal drift av tjänsten är så stor att frågan kommer 
tas upp i förvaltningsgruppen.

Mvh
Einar Blåberg
Chalmers IT-Service



More information about the Driftstorning mailing list