Storageauslastung und andere Statistiken

Wenn der Zählerüberlauf im Maya-Kalender wirklich den Weltuntergang darstellt, geh ich jetzt von einer Zombieapokalypse aus. Zumindest ist mir gestern im Büro ein Zombie begegnet. Kein körperlicher, sondern eher eine Art Wolpertinger, ein Fabelwesen der Storage-Industrie. Konkret das Phantom des "NetApp wird langsam bei 20% Speicherauslastung". Dieser FUD war vor 10 Jahren schon nicht mehr originell, und dass er heute noch auftaucht überrascht.

Auf den Sinn und Unsinn davon möchte ich gar nicht eingehen, das ist schon oft genug geschehen. Vielmehr kam ich etwas ins Grübeln über das Thema Auslastung. Die mittlere Auslastung eines Systems gibt an, wieviel der zur Verfügung stehenden Kapazität man wirklich nutzt, sprich wieviel "meines Geldes wirklich für mich arbeitet". Also wie voll sind Systeme eigentlich so im Schnitt? Was darf man realistisch erwarten? Das Ergebnis hat mich etwas überrascht.

Fangen wir mit den Buying Pattern unserer Kunden an. Fast immer werde Systeme beim initialen Kauf auf den Endausbau zum Laufzeitende gesized. Die Gründe sind immer die gleichen:

* Das Budget muss jetzt ausgegeben werden.

* Der Kunde glaubt - meist aus der Erfahrung mit anderen Storagesystemen - eine Kapazitätserweiterung sei komplex.

* Später gekaufte Kapazität hat einen anderen Abschreibungszeitraum.

Technisch ist es sehr einfach, im laufenden Betrieb Kapazität zu ONTAP Systemen hinzuzufügen. Das ist nicht der Grund. Die eigentlichen Hinderungsgründe sind vielmehr kaufmännisch/organisatorisch.

Betrachten wir doch mal die Auswirkungen dieses Vorgehens. Übliche Angaben vom Kunden sind: "Wir haben ein Datenwachstum vom 60% im Jahr und wollen das System 3 Jahre lang betreiben." Unter der Annahme das viele Kunden das so handhaben, kann man eine mittlere Auslastung berechnen. Dazu ein bisschen Mathematik:

Mithilfe des Datenwachstums kann man die Kapazität nach der Formel

berechnen, wobei n die Startkapazität, w das Wachstum in Prozent und t die Laufzeit ist. So ergibt sich für unseren Kunden, der heute 300 TB hat und um 60% jährlich wächst, nach 3 Jahren eine Zielkapazität von grob 1,2 PB. Die mittlere Auslastung (nach halber Laufzeit) kann man mit

berechnen. In unserem Beispiel wäre die Startauslastung bei ca 25% und nach der halben Laufzeit bei knapp 50%. Hier noch eine Tabelle, um ein Gespür zu bekommen, wovon wir reden:

Wachstum

mittlere Auslastung

40%

60%

50%

54%

60%

49%

70%

45%

80%

41%

90%

38%

100%

35%

Welche Schlüsse kann man daraus ziehen? Die Auslastung ist umso schlechter, je höher das jährliche Datenwachstum und je länger die Laufzeit des Systems ist. Keine Rocket Science, aber sehr ernüchternd zu sehen, das nur 50% Auslastung durchaus ein üblicher Wert ist. So hatte ich das noch nie betrachtet.

Wie kann man die Auslastung verbessern?

Wie oben beschrieben, ist die Ursache meist nicht technischer, sondern betriebswirtschaftlicher oder organisatorischer Natur. Wenn der Kunde hier seine Prozesse ändern kann und auch während der Laufzeit Kapazität bedarfsorientiert hinzufügt, wird die Auslastung besser. Oft erlauben das aber betriebliche Prozesse nicht. Manchmal kann ein Storage-On-Demand Konzept hier zusätzliche Flexibilität schaffen. Fragen Sie den Freundlichen.

Einen technischen Kniff habe ich aber noch parat. Wenn wir in obiger Formel das Wachstum kleiner bekommen, verbessert sich die mittlere Auslastung automatisch. Auf das Wachstum der Netto-Daten hat man als IT-Abteilung üblicherweise wenig Einfluss, aber am Hebel Netto-Daten vs. Brutto-Kapazität kann man dank Storage-Effizienz deutlich drehen. Besonders mit Deduplizierung und, ganz neu in ONTAP 8.1, mit Kompression lassen sie meist signifikante Ersparnisse erzielen. Effektiv entspricht das einer Reduzierung der Brutto-Wachstumsrate. Unsere Technologie erlaubt uns, weniger Blech für die gleiche Anforderung zu benötigen.

Das spart nicht nur Anschaffungskosten, sondern auch Stellplatz und Strom! Oder man nimmt einfach den 21. Dezember als festes Laufzeitende. Das spart auch Geld, das man dann in Pflanzen und Rasenmäher stecken kann.