Bereits 10853 Beiträge!


Alles hat ein Ende....

Beitrag von MoD, am 21.02.2008
Durchschnittliches Voting: 7.23


Sers,

ich hatte mir eigentlich vorgenommen darüber zu schweigen aber nachdem dieser Typ Mensch gerade wieder bei mir war und mir die Ohren zugedröhnt hat muss ich es einfach loswerden.

Die ganze Storie ist leider schon ein paar Tage alt aber ich wollte Sie euch nicht vorenthalten.

Aber von vorn:

Wie vielleicht bekannt haben wir ein schönes neues GRID aufgebaut 4x 10 Blades mit je 4 Quadcore CPU´s ( rechnet es selber aus ) davon sind je Einheit 1 Blade als "Hot Swap" Einheit konfiguriert. Somit stehen 36 Blades mit je 4 Quadcores zur Verfügung (brachiale Rechenleistung).

Auf dem Ding sollen ca. 100 Leutchen diverse Hochmathematischen bzw. Flüssigkeittechnischen Simulationen berechnen lassen. Hierbei handelt es sich ausschließlich um Langzeitsimulationen die durchaus mal ne 1 Woche auf der Maschine zum durchrechnen brauchen (zum Vergleich ein Handelsüblicher High End PC braucht für die selbe Aufgabe geschätzte 3! Jahre)

Die eigentlichen Berechnungen werden von 15 Programmierern(innen) in die Maschine gehackt. Dabei können die auch Kontrollstrukturen (Schleifen etc.) einsetzen.

Jetzt lief die Maschine eine Zeit lang sehr sehr gut. Bis die letzten Tage wir massive Performance Probleme auf der Maschine bekommen haben (sollte nahezu unmöglich sein).
Unangenehmerweise sind einige der Langzeitprojekte regelrecht abgesoffen, da irgendwas die Maschine so ausgelastet hat, dass nicht einmal mehr die Sicherungsroutinen gezogen haben. Diese beenden Normalerweise einen Rechenjob wenn er zuviele Ressourcen braucht und somit die anderen Jobs gefährdet.

Heute vormittag haben wir endlich den Schuldigen gefunden bzw. die SCHULDIGE! Ja eine SIE. Hübsch, Blond, Blauäugig, hochintelligent und stur wie ein Stück eisenbewehrter Beton.

Jetzt ist es so dieses Simulationssystem kommt mit einer eigenen "Programmier"-Sprache daher. Jedoch scheint die holde Dame das Handbuch nicht gewissenhaft studiert zu haben und war der Meinung Kontrollstrukturen gäbe es hier nicht. *kopf ---> tisch*

Und was macht Frau von Welt? Ja sie nimmt den GCC Compiler (den ich leichtsinnigerweise zugegeben noch im System hatte ... *asche auf mein Haupt*) und schreibt das ganze in einem kleinem C-Programm. Soweit noch so gut, dass wäre ja noch nicht schlimm gewesen. Die Dame hat das ganze, ähnlich wie auch die Simulationssoftware arbeitet, in viele einzelne Threads zerlegt, welche vom GRID dann je einem anderen Core zur bearbeitung zugewiesen wird. Auch noch nicht schlimm ABER das zerlegen der Aufgaben in einzelne Threads hat sie mit einer Schleife gelöst,
EINER ENDLOSSCHLEIFE!!!!!!!!!!!!

Ergo plötzlich sind einige Millionen Threads im System rumgeschwirrt welche natürlich dann das ganze System durcheinandergebracht haben. Nur am Rande war jeder der Threads ebenfalls eine Endlosschleife welche aber normalerweise nicht so wild gewesen wäre.

Blöd war nur, dass das Sicherungssystem Threadweise arbeitet, d.h. es würgt die Threads ab die zuviel Leistung fordern. Da aber die Threads zumindest am Anfang weit von dieser Grenze weg ware.... tja und irgendwann war Ende und das System hat das Handtuch geworfen.

Aber der Hammer kam eben von ihr. Als ich sie damit konfrontiert habe sagte Sie nur: "Tja was kann ich dafür wenn ihr 'männliches' System so unflexible ist und das nicht verkraftet!" Ich wusste nicht mehr was ich sagen sollte.

So ich mach für heut Feierabend.


ACHTUNG Archivsystem!

Es sind keine neuen Einträge, Bewertungen oder Kommentare mehr möglich.