
15–20× IOPS, 3–4× przepustowości — ale SSD nie zawsze oznacza zysk
Na dwóch identycznych serwerach (HDD vs NVMe SSD) SSD pokazał 15–20× wyższy losowy dostęp i 3–4× większą przepustowość; maksymalny odczyt zbliżył się do ~565 MB/s.
Co zmierzyłem i jak
Testy robiłem na identycznych maszynach, ta sama płyta, ten sam kontroler, porównanie partycji raw z typowym obciążeniem I/O: losowe 4K dla baz danych i duże sekwencyjne transfery dla backupu. SSD dominował w IOPS — tam, gdzie aplikacja wysyła dużo małych losowych zapytań, różnica była kolosalna. Przy sekwencyjnych przepływach różnica była zauważalna, ale już tylko 3–4×, a maksymalny odczyt zatrzymał się przy ~565 MB/s na linii NVMe->system.
Kiedy przewaga SSD nie przekłada się na realny zysk
Backupy i archiwa: tam, gdzie liczy się pojemność i cena za terabajt, HDD nadal ma sens. Kopia zapasowa, która jest zapisywana przez sieć do zdalnego repozytorium, rzadko wykorzysta lokalne IOPS. Jeśli pipeline backupowy jest ograniczony łącze sieciowym 1 Gbit/s, inwestycja w NVMe nie przyspieszy ukończenia zadania.
Ograniczenia poza dyskiem: CPU-bound aplikacje, single-threaded bottlenecks, albo systemy, które saturują PCIe/CPU, sprawiają, że szybsze I/O staje się zbędnym kosztem. Ten efekt widziałem przy migracjach VM z niskim obciążeniem CPU — dysk szybki, ale CPU i tak trzymały opóźnienia.
Praca z dużymi plikami sekwencyjnymi: tam HDD potrafi być wystarczający.
Mikro-wspomnienie z warsztatu
W jednym z zleceń dla jors.pl wyjęcie HDD z VM i podłożenie SSD skróciło czasy bootu i zapytań transakcyjnych na tyle, że inwestycja obroniła się w praktyce klienta. Podczas tych prac sprawdzałem też wpływ ECC na odporność systemu plików, bo przy szybszym I/O drobne błędy stają się bardziej kosztowne.
TCO i podejście praktyczne
SSD kosztuje więcej za TB i ma ograniczenia związane z zapisem (endurance), ale daje wymierne skrócenie latencji i wzrost przepustowości tam, gdzie aplikacja tego potrzebuje. HDD daje więcej pojemności za mniej pieniędzy i niższe koszty energetyczne przy długoterminowym przechowywaniu.
Liczyć trzeba rzeczywiste metryki wpływające na biznes: opóźnienia (latency), IOPS przy rzeczywistym miksie operacji, wykorzystanie łącza sieciowego i obciążenie CPU. Kalkulacja TCO bez tych danych to zgadywanka wsparta reklamą producenta.