[Driftstörning] Problem med Chalmers gemensamma filtjänst
Einar Blåberg
eb at chalmers.se
Tors Sep 11 09:54:06 CEST 2008
Vi har de senaste dagarna haft stora problem med den gemensamma
filtjänsten, detta har drabbat främst teknologer men även anställda.
Vad har vi gjort för att lösa problemen?
* I slutet av förra veckan konstaterades att en av de större felkällorna
var applikationen Exceed, denna är sedan onsdag lunch temporärt
borttagen i StuDAT. Att det tagit så lång tid mellan konstaterande och
åtgärd är för att vi måste veta att vi kan backa tillbaka till
normalläget igen efter vi gör en förändring och att förändringarna inte
leder till andra värre konsekvenser.
* Klienterna i StuDAT kommer under denna veckan att få nya inställningar
som bör minska deras trafik mot filservern och därmed minska lasten på
filservern.
* Då det främst är en av noderna i filtjänsten som drabbas så kommer vi
att flytta användare från den till de andra noder, detta för att sprida
ut lasten jämnare mellan de ingående komponenterna i tjänsten.
* Vi jobbar nu med att uppdatera serverprogramvaran och mjukvarumässigt
förbättra prestandan på filservern, detta beräknas vara klart i mitten
av nästa vecka. Uppdateringen ingår i det vanliga underhållet av
tjänsten men har tidigarelagts i och med problemen som uppkommit.
Vad kommer hända på längre sikt?
Det pågår sedan början av året ett projekt för att byta teknisk lösning
för filtjänsten, den nya tjänsten kommer tas i drift i November då ett
flertal av de mindre filservrar som ITS ansvarar för kommer att migreras
till nya lösningen. I början av nästa år kommer den gemensamma
filservern att migreras till den nya lösningen.
Det har inte funnits en enskild faktor som gett upphov till problemen
men bland det som påverkat mest finns applikationer i StuDATs
basplattform som vid inloggning skapat orimligt hög last på filservern.
Detta märks när många loggar på datorerna vid samma tid (lunchtid har
det märkts tydligast).
Vi ser allvaret i situationen och förstår väl hur det drabbar våra
kunder efterssom det drabbar oss på precis samma sätt med långsamma
eller helt stillastående arbetsstationer. Vi har prioriterat ner eller
helt bort andra arbetsuppgifter för att felsöka och åtgärda problemen
med filtjänsten.
Avvikelsen från normal drift av tjänsten är så stor att frågan kommer
tas upp i förvaltningsgruppen.
Mvh
Einar Blåberg
Chalmers IT-Service
More information about the Driftstorning
mailing list