Synology-Forum.nl

Hardware ondersteuning => NAS hardware vragen => Topic gestart door: Robert Koopman op 31 augustus 2018, 12:38:13

Titel: Toch vreemd met de SMART test
Bericht door: Robert Koopman op 31 augustus 2018, 12:38:13
Een van mijn 8 3TB schijven ging opeens I/O fouten geven.
Hij kon deze foute sectoren wel telkens herstellen maar toch ben ik er niet blij mee.
Maandelijks draait er een eenvoudige SMART test en daar werden geen fouten gevonden.
Dan voor deze schijf maar eens een volledige SMART test gedaan, 500 minuten later geen fouten gevonden.
Ik heb de schijf aangemeld bij mijn leverancier, schijf is net een jaar oud.
Mag deze terug sturen.
Nog een keer de test van 500 minuten gedaan. Geen fouten gevonden.
Heb altijd een spare schijf liggen dus deze erin gedaan. Volume herstellen is druk bezig.
“Defecte” schijf nu testen met het tooltje van WD en hij komt meteen niet door de SMART test.
Op zich is dat natuurlijk prettig, schijf is volgens WD echt niet goed.

Maar wat stelt de test in de NAS dan eigenlijk voor?
Titel: Re: Toch vreemd met de SMART test
Bericht door: Ben(V) op 31 augustus 2018, 13:24:41
Smart testen kunnen in captive mode en in non-captive mode gedaan worden.
Synology doet alleen non-captive mode omdat de disk in gebruik is, de tools van WD doet captive mode testing en misschien ook nog wel dingen die alleen in WD disken zitten of extra testen.

Short smart test doet alleen een test van bepaalde delen van een disk.

Smart testen worden door de controller in de disk zelf gedaan dus foute data zoals bijvoorbeeld ontstaat door bitrot kan hij niet ontdekken.
Dat kan wel door de raidsoftware ontdekt worden tijdens het scrubben.
Titel: Re: Toch vreemd met de SMART test
Bericht door: Robert Koopman op 31 augustus 2018, 13:25:46
Aha, duidelijk!
Titel: Re: Toch vreemd met de SMART test
Bericht door: Briolet op 31 augustus 2018, 13:37:38
En als je eens de smartinfo wilt opvragen zonder op DSM in te loggen kan dat ook op de commandline met:

smartctl -d ata -a /dev/sda
smartctl -d ata -a /dev/sdb
smartctl -d ata -a /dev/sdc
etc

Je krijgt dan iets als:
~# smartctl -d ata -a /dev/sdb
smartctl 6.5 (build date Jun  8 2018) [x86_64-linux-3.10.105] (local build)
Copyright (C) 2002-16, Bruce Allen, Christian Franke, www.smartmontools.org

=== START OF INFORMATION SECTION ===
Model Family:     Western Digital Red
Device Model:     WDC WD30EFRX-68AX9N0
Serial Number:    WD-WMC1T*******
LU WWN Device Id: 5 0014ee 6ae23618f
Firmware Version: 80.00A80
User Capacity:    3,000,592,982,016 bytes [3.00 TB]
Sector Sizes:     512 bytes logical, 4096 bytes physical
Device is:        In smartctl database [for details use: -P show]
ATA Version is:   ACS-2 (minor revision not indicated)
SATA Version is:  SATA 3.0, 6.0 Gb/s (current: 6.0 Gb/s)
Local Time is:    Fri Aug 31 13:30:59 2018 CEST
SMART support is: Available - device has SMART capability.
SMART support is: Enabled

=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED

General SMART Values:
Offline data collection status:  (0x00) Offline data collection activity
was never started.
Auto Offline Data Collection: Disabled.
Self-test execution status:      (   0) The previous self-test routine completed
without error or no self-test has ever
been run.
Total time to complete Offline
data collection: (41160) seconds.
Offline data collection
capabilities: (0x7b) SMART execute Offline immediate.
Auto Offline data collection on/off support.
Suspend Offline collection upon new
command.
Offline surface scan supported.
Self-test supported.
Conveyance Self-test supported.
Selective Self-test supported.
SMART capabilities:            (0x0003) Saves SMART data before entering
power-saving mode.
Supports SMART auto save timer.
Error logging capability:        (0x01) Error logging supported.
General Purpose Logging supported.
Short self-test routine
recommended polling time: (   2) minutes.
Extended self-test routine
recommended polling time: ( 413) minutes.
Conveyance self-test routine
recommended polling time: (   5) minutes.
SCT capabilities:        (0x70bd) SCT Status supported.
SCT Error Recovery Control supported.
SCT Feature Control supported.
SCT Data Table supported.

SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME                                                   FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate                                              0x002f   200   200   051    Pre-fail  Always       -       25
  3 Spin_Up_Time                                                     0x0027   181   179   021    Pre-fail  Always       -       5950
  4 Start_Stop_Count                                                 0x0032   100   100   000    Old_age   Always       -       119
  5 Reallocated_Sector_Ct                                            0x0033   200   200   140    Pre-fail  Always       -       0
  7 Seek_Error_Rate                                                  0x002e   200   200   000    Old_age   Always       -       0
  9 Power_On_Hours                                                   0x0032   040   040   000    Old_age   Always       -       44294
 10 Spin_Retry_Count                                                 0x0032   100   100   000    Old_age   Always       -       0
 11 Calibration_Retry_Count                                          0x0032   100   100   000    Old_age   Always       -       0
 12 Power_Cycle_Count                                                0x0032   100   100   000    Old_age   Always       -       119
192 Power-Off_Retract_Count                                          0x0032   200   200   000    Old_age   Always       -       39
193 Load_Cycle_Count                                                 0x0032   200   200   000    Old_age   Always       -       79
194 Temperature_Celsius                                              0x0022   121   114   000    Old_age   Always       -       29
196 Reallocated_Event_Count                                          0x0032   200   200   000    Old_age   Always       -       0
197 Current_Pending_Sector                                           0x0032   200   200   000    Old_age   Always       -       0
198 Offline_Uncorrectable                                            0x0030   100   253   000    Old_age   Offline      -       0
199 UDMA_CRC_Error_Count                                             0x0032   200   200   000    Old_age   Always       -       0
200 Multi_Zone_Error_Rate                                            0x0008   200   200   000    Old_age   Offline      -       0

SMART Error Log Version: 1
No Errors Logged

SMART Self-test log structure revision number 1
Num  Test_Description    Status                  Remaining  LifeTime(hours)  LBA_of_first_error
# 1  Short offline       Completed without error       00%     44214         -
# 2  Short offline       Completed without error       00%     44047         -
# 3  Short offline       Completed without error       00%     43879         -
# 4  Short offline       Completed without error       00%     43711         -
# 5  Short offline       Completed without error       00%     43543         -
# 6  Short offline       Completed without error       00%     43375         -
# 7  Short offline       Completed without error       00%     43208         -
# 8  Short offline       Completed without error       00%     43040         -
# 9  Short offline       Completed without error       00%     42872         -
#10  Short offline       Completed without error       00%     42704         -
#11  Short offline       Completed without error       00%     42536         -
#12  Short offline       Completed without error       00%     42369         -
#13  Short offline       Completed without error       00%     42201         -
#14  Short offline       Completed without error       00%     42033         -
#15  Short offline       Completed without error       00%     41865         -
#16  Short offline       Completed without error       00%     41697         -
#17  Short offline       Completed without error       00%     41529         -
#18  Short offline       Completed without error       00%     41362         -
#19  Short offline       Completed without error       00%     41194         -
#20  Short offline       Completed without error       00%     41026         -
#21  Short offline       Completed without error       00%     40858         -

SMART Selective self-test log data structure revision number 1
 SPAN  MIN_LBA  MAX_LBA  CURRENT_TEST_STATUS
    1        0        0  Not_testing
    2        0        0  Not_testing
    3        0        0  Not_testing
    4        0        0  Not_testing
    5        0        0  Not_testing
Selective self-test flags (0x0):
  After scanning selected spans, do NOT read-scan remainder of disk.
If Selective self-test is pending on power-up, resume after 0 minute delay.

Laat volgens mij meer detail zien dan de info die DSM toont. b.v. het smartlog met de resultaten van de laatste 21 tests staan niet in DSM
Titel: Re: Toch vreemd met de SMART test
Bericht door: Sylvester op 31 augustus 2018, 13:42:16
En wanneer doet hij dat ‘scrubben’ eigenlijk? Is dat tijdens de consistentie check?
Titel: Re: Toch vreemd met de SMART test
Bericht door: Ben(V) op 31 augustus 2018, 13:45:24
Geen idee ik doe niet aan een Nederlandse DSM hun vertalingen zijn regelmatig volkomen onbegrijpelijk.
Titel: Re: Toch vreemd met de SMART test
Bericht door: Sylvester op 31 augustus 2018, 13:47:54
Dat is waar, heb ik ook al eens gemeld dat die Nederlandse verwoording raar is. Maar wanneer doet de Engelse DSM dan scrubbing?
Titel: Re: Toch vreemd met de SMART test
Bericht door: Ben(V) op 31 augustus 2018, 13:55:25
Staat als taak in je taakplanner.
Titel: Re: Toch vreemd met de SMART test
Bericht door: Clan1511 op 01 september 2018, 10:44:54
Ik heb even een vraagje, als het mag:

Hoe moet ik deze melding (voor het eerst) interpreteren:

Schijf 3
S.M.A.R.T.-status: Normaal
Telling herverbinding schijf: 2
Telling beschadigde sectoren: 0
Telling heridentificatie schijf: 29?

Bij voorbaat dank,

M.vr.gr.
Titel: Re: Toch vreemd met de SMART test
Bericht door: Ben(V) op 01 september 2018, 11:11:51
https://en.wikipedia.org/wiki/S.M.A.R.T.
Titel: Re: Toch vreemd met de SMART test
Bericht door: Briolet op 01 september 2018, 16:06:17
Een van mijn 8 3TB schijven ging opeens I/O fouten geven.…
…Maar wat stelt de test in de NAS dan eigenlijk voor?

Onder water gebruikt de nas de smartmontools voor de smartinformatie. Op de website van smartmontools staat het een en ander duidelijk uitgelegd. Zie ook hun FAQ pagina.: ATA drive is failing self-tests but SMART healthstatus is PASSED. Whats going on. (https://www.smartmontools.org/wiki/FAQ#ATAdriveisfailingself-testsbutSMARThealthstatusisPASSED.Whatsgoingon)