Întrebări simple: Ce este S.M.A.R.T. și cum funcționează?

Foarte mulți dintre noi am avut de-a face cu un hard disk care cedează. Unii dintre noi au încercat chiar să afle mai multe informații despre fiabilitatea unităților HDD, precum și despre funcția lor ascunsă de predicție, care face parte dintr-o tehnologie numită S.M.A.R.T. Am putea argumenta și că această tehnologie nu este destul de sigură deoarece nu prezice întotdeauna defecțiuni iminente. Acest fapt este în parte adevărat. Totuși, mecanismele interioare ale acestui sistem de auto-monitorizare nu sunt atât de simple. Așa că haideți să ne încercăm să remediem aceste incertitudini și să examinăm modul în care S.M.A.R.T. funcționează cu adevărat. Haideți să începem:

S.M.A.R.T – un mic istoric

S.M.A.R.T., cunoscut și ca SMART (Tehnologia de analiză și raportare prin auto-monitorizare) este un sistem care supraveghează informațiile interne ale unui hard disk. Aceasta a fost dezvoltată începând cu anul 1992 și în prezent este inclusă în toate unitățile HDD moderne de tip IDE și Serial ATA. Desigur, aceasta este o caracteristică prezentă și în unitățile de tip solid state drive (SSD).

Istoria sa include o serie de nume precum Predictive Failure Analysis (Analiză Predictivă a Defecțiunilor) sau IntelliSafe și contribuții din partea tuturor marilor producători de hard disk-uri: IBM, Seagate, Quantum, Western Digital. În cele din urmă, documentația acestei tehnologii a fost prezentată pentru prima dată în 2004, în cadrul standardului document (PDF).

HDD, sanatate, S.M.A.R.T., SMART, atribute, valori

În afara unor încercări singulare (Google, Backblaze), cea mai mare parte a datelor specifice S.M.A.R.T. sunt nedocumentate. Sistemul oferă o cantitate mare de informații interne dar există și o multitudine de incoerențe în statistici, deoarece mulți dintre producătorii de hard disk-uri folosesc definiții și măsurători total diferite. De exemplu, o parte din dezvoltatori stochează perioada de funcționare în ore, pe când alții măsoară în minute sau secunde. De asemenea, aceștia nu au încercat să explice care dintre diferitele atribute sau variabile furnizate prezintă interes pentru noi, utilizatorii, și astfel ajungem să ne înecăm în date.

Totuși, înainte să căutăm să înțelegem care dintre atributele S.M.A.R.T. sunt relevante, trebuie să diferențiem mai întâi între principalele tipuri de defecțiuni posibile: previzibile și imprevizibile. Primul tip include erorile care apar pe măsura trecerii timpului. Ele sunt cauzate de unele defecte ale mecanicii discului dur sau de avarierea suprafeței acestuia. Problemele se vor înrăutăți cu timpul și, în cele din urmă, HDD-ul va ceda. Defecțiunile imprevizibile sunt cauzate de evenimente neprevăzute, de exemplu, căderi bruște de tensiune ale rețelei electrice.

NOTĂ: Este important să înțelegem că S.M.A.R.T. ne poate ajuta doar la detectarea defecțiunilor previzibile.

Atribute S.M.A.R.T. importante

Starea de sănătate a hard disk-ului este monitorizată în mod constant prin utilizarea mai multor senzori. Valorile sunt măsurate prin utilizarea unor algoritmi caracteristici, iar mai apoi atributele corespunzătoare sunt optimizate în funcție de rezultate.

În orice program de monitorizare pe care îl veți folosi, toate atributele S.M.A.R.T. vor avea aceste câmpuri:

  • Identifier: (identificare) definiția exactă a atributului. De obicei are o semnificație standard și este marcată cu un număr între 1 și 250 (de exemplu, ID 9 reprezintă perioada de funcționare). Totuși, toate instrumentele de monitorizare vă vor furniza numele și descrierea textuală a atributului.
  • Threshold: (pragul minim) este valoarea minimă pe care o poate avea atributul. Dacă această valoare este atinsă atunci hard disk-ul este pe cale să cedeze.
  • Value: valoarea curentă a atributului. Algoritmul calculează acest număr pe baza datelor brute. Un hard disk nou va avea un număr mare, maximul teoretic (100, 200 sau 253, în funcție de producător), care va scădea treptat pe durata vieții acestuia.
  • Worst: (cea mai slabă) cea mai mică valoare înregistrată vreodată pentru atribut.
  • Data: valorile măsurătorilor brute furnizate de un senzor sau un contor. Acestea sunt datele utilizate de algoritmele create de fiecare producător de HDD-uri în parte. Utilizatorii obișnuiți ar trebui să evite aceste cifre.
  • Flags: scopul atributului. Aceste etichete sunt, de obicei, stabilite de către producător și, prin urmare, vor varia de la disc la disc. Fiecare dintre atribute sunt fie critice, ce pot prezice o defecțiune iminentă (de exemplu, ID 5- numărul curent de sectoare instabile), fie statistice, fără un efect direct în determinarea stării de sănătate (de exemplu, ID 174-numărul curent al căderilor de curent neașteptate).

NOTĂ: Întotdeauna amintiți-vă, atunci când încercați să înțelegeți statusul oricărui atribut S.M.A.R.T., că trebuie să verificați valori care apar în următoarele câmpuri: value, threshold și flags. De asemenea, fiți atenți la faptul că valori mai mici apar atunci când există probleme de fiabilitate.

Temperatura HDD-ului este un parametru de fiabilitate constant dezbătut. Totuși, se consideră că valorile mai mari de 60° vor reduce durata de viață a unui hard disk și vor crește posibilitatea apariției unor defecțiuni. Vă recomandăm să utilizați un ventilator (cooler) pentru a micșora temperatura discului dur, fapt ce îi poate prelungi durata de viață.

După cum a fost menționat mai sus, nu toate atributele S.M.A.R.T. sunt critice pentru predicția unor posibile defecțiuni. Cele două studii amintite deja cu privire la rata defectării hard disk-urilor, precum și alte surse, sunt de acord că un ajutor important în identificarea defecțiunilor HDD-urilor este ID 5-reallocated sector count (numărul curent de sectoare realocate). Realocarea are loc atunci când logica discului dur repoziționează un sector deteriorat, ca urmare a unor erori de hard sau soft recurente, într-un nou sector fizic din cele de rezervă. Acest atribut reflectă numărul total de repoziționări efectuate și este o indicație a gradului de uzură al hard disk-ului.

HDD, sanatate, S.M.A.R.T., SMART, atribute, valori

Un alt atribut util care ar trebui monitorizat este ID 197-current pending sector count (numărul curent de sectoare instabile). Acesta contabilizează sectoarele "instabile”, adică cele deteriorate care au erori de citire și care așteaptă să fie repoziționate pe disk. Algoritmii S.M.A.R.T. au sentimente contradictorii față de acest atribut, căci uneori pare a fi neconvingător. Totuși, se pare că acesta poate oferi o avertizare timpurie privind posibilele probleme.

Ultimul dintre indicatorii la care ar trebui să fi atenți este ID 187-reported uncorrectable errors (raport erori irecuperabile). Este vorba despre înregistrarea numărului de erori care sunt imposibil de recuperat și reprezintă un atribut util deoarece pare a avea același înțeles pentru toți producătorii de HDD-uri.

NOTĂ: Toate cele trei atribute S.M.A.R.T. au valori care sunt foarte ușor de interpretat. În cazul în care raportează o valoare de 1 sau mai mult atunci este foarte probabil ca unitatea hard disk cedează și ar trebui să începem o copiere de rezervă. Totuși, chiar dacă avem de a face cu niște indicatori foarte utili ai fiabilității HDD-urilor, aceștia nu sunt infailibili și ar trebui să le comparați cu sfaturile date de programul de monitorizare a hard disk-ului folosit de voi.

Concluzii

Acesta a fost studiul nostru pe scurt asupra mecanismelor interne ale S.M.A.R.T. și abilitățile sale de a monitoriza și anticipa defecțiunile unui hard disk. Principalul punct de vedere pe care ar trebui să vi-l amintiți este că acest sistem de auto-testare vă va ajuta să analizați starea generală de sănătate a HDD-ului sau SSD-ului folosit. Dacă doriți să folosiți datele specifice S.M.A.R.T. pentru a verifica dacă disk-ul are probleme, citiți articolele recomandate mai jos.

Despre autor: Tudor Mandache
Întotdeauna am fost fascinat de tehnologie, chiar dacă eu am studii legate de un alt domeniu, adică arheologie. Totuşi, pentru ambele domenii, îmi place foarte mult să construiesc articole pentru că am constatat că sunt ajutat de un amestec neobișnuit de aptitudini tehnice și abilități de scriere. De asemenea, îmi place să traduc informații tehnice complicate, într-o limbă pe care oamenii obișnuiți le pot înțelege cu ușurință. Faptul că eu nu vin din arealul programatorilor înseamnă că pot comunica foarte bine atât cu experți în tehnologie, cât și oameni obișnuiți care încearcă să se folosească de noutățile din domeniul tehnicii.