Opened 9 years ago
Last modified 9 years ago
#227 accepted defect
fallo en c2t5000CCA369C508E5d0
Reported by: | fernando | Owned by: | fernando |
---|---|---|---|
Priority: | major | Milestone: | |
Component: | TracMeteo | Keywords: | sas disco error |
Cc: | antonio |
Description (last modified by fernando)
- zpool status: c2t5000CCA369C508E5d0 FAULTED 0 204 0 too many errors
- iostat -exn:
0.7 0.8 19.8 29.3 0.0 0.0 0.0 0.8 0 0 0 13 29 42 c2t5000CCA369C508E5d0
root@seal:~# iostat -Ex sd63 extended device statistics device r/s w/s kr/s kw/s wait actv svc_t %w %b sd63 0.7 0.8 19.8 29.3 0.0 0.0 0.8 0 0 sd63 Soft Errors: 0 Hard Errors: 13 Transport Errors: 29 Vendor: ATA Product: Hitachi HDS72302 Revision: A580 Serial No: MN3220F30B2ATE Size: 2000.40GB <2000398934016 bytes> Media Error: 4 Device Not Ready: 0 No Device: 9 Recoverable: 0 Illegal Request: 0 Predictive Failure Analysis: 0 Tampoco se puede volver a configurar: {{{ root@seal:~# cfgadm -c configure c9::w5000cca369c508e5,0 cfgadm: Hardware specific failure: failed to configure SCSI device: I/O error }}}
Change History (5)
comment:1 Changed 9 years ago by fernando
- Description modified (diff)
comment:2 follow-up: ↓ 3 Changed 9 years ago by fernando
- Status changed from new to accepted
Tampoco deja volverlo a configurar:
root@seal:~# cfgadm -c configure c9::w5000cca369c508e5,0 cfgadm: Hardware specific failure: failed to configure SCSI device: I/O error
comment:3 in reply to: ↑ 2 Changed 9 years ago by antonio
Pero si que puedes acceder al slot y marcarlo como fallo.
El problema que tenemos es que ese disco no sabemos a que backplane y slot estaba asociado. O si?
Estaría bien, observar como el backplane ve ese slot y si detecta que hay algún dispositivo, aunque sea en modo fallo.
A
comment:4 Changed 9 years ago by fernando
Podemos con el numero de serie MN3220F30B2ATE que nos proporciona iostat mirar en las tablas : https://www.meteo.unican.es/trac/meteo/wiki/Jbods
Y con ello sabemos que el dico esta en el Jbod1 front expander Slot 16.me falta poner en las tabla a que /dev/es/ses* corresponde
Entiendo que lo que dices que si funciona es el sg_ses.
Sg_ses nos dice los SAS address de los discos y nos dejaria marcarlos.
comment:5 Changed 9 years ago by antonio
Eso es.
Lo que pasa es que es posible que el sg_sas no te diga el SAS address del dispositivo conctado a ese slot, debido a que está offline.
Aunque como es un error, y el sistema lo sigue viendo es posible que el SAS expander lo tenga todavía asociado el dispositivo pero sin la posibilidad de acceder a el.
Prueba el sg_ses y mira a ver que hace.
Antonio
El disco no responde a los comando de sg3 , y esto queda reflejado en el iostat aumentando el numero de errores de transporte:
Tampoco funciona el commando smartctl sobre este dispositivo:
El zfs lo ha puesto en "desconfigurado"
El fallo se produjo el dia 28: