Podcast Z #3: Shit Happens
MP3
OGG (Vorbis)
OPUS
Síguenos en Twitter
Suscríbete por Apple Podcast
Donación BitCoin:
1GNbTi1tL2TakGs9S9o1n6p7AVJWtBhi33
Encender el ordenador y que no funcione es frustrante...
Autor: Jesús Cea & Pablo Lobariñas - Contacto: sistemas2016@podcast.jcea.es
Fecha de grabación: 2011/04/03 - Duración: 24:40
Fecha de publicación: 2011/05/05
Palabras clave: Sistemas, GRUB, LVM, Snapshots, Boot
Descarga el audio: MP3 (8156124 bytes) - OGG (4891726 bytes)
Notas:
- 00:37: El ordenador no arranca. El GRUB falla.
- 01:00: ¿Qué es el GRUB?.
Un gestor de arranque para cargar y lanzar el sistema operativo.
- 03:13: Reinstalar es la última opción. O debería serlo.
- 03:43: Pablo: "Así que eres uno de esos raritos que se ponen a personalizar el ordenador
hasta el último detalle?". Jesús: "Cuando te pasas 15 horas al día usando una herramienta, más te vale que la
herramienta se adapte a ti, y no al revés".
- 04:30: Los problemas con el GRUB son rutinarios para mí. Doy un ejemplo concreto.
- 05:50: El error está claro. ¿Cómo solucionarlo?. Arrancar con un disco de recuperación y
reinstalar el GRUB.
- 07:25: Pero... no funciona. ¡No se deja instalar!.
- 08:10: Explico cómo tengo configurado el disco duro. Uso LVM,
y la partición de arranque no es una partición en sí, sino un volumen lógico. Las versiones
recientes de GRUB te lo permiten.
- 10:00: El GRUB no se deja instalar. Descripción de los errores que me salen. Errores un poco
extraños, porque se queja de cosas que deberían funcionar.
- 11:30: Uno de los errores es una pista: No encuentra el volumen lógico de arranque. Eso
no tiene sentido, porque el volumen lógico de arranque es perfectamente accesible, lo puedo montar sin
problemas, y funcionaba esta mañana. Ejecuto el proceso de instalación del GRUB bajo
"strace", para ver exactamente qué está
haciendo y dónde falla.
- 12:30: Con "strace" veo que el sistema de instalación de GRUB accede sin problemas a todo
eso que me indica luego, con errores, que no puede acceder. ¡Extraño!.
- 12:56: Nueva pista: uno de los errores es que el volumen lógico de arranque no es capaz
de gestionar UUIDs, aunque con "strace" veo que eso no es cierto.
- 14:05: No cabe duda que se trata de un bug. Pero, ¿qué he hecho yo para provocarlo?.
¿Cómo solucionarlo?. Hago diversos experimentos.
- 15:05: Tengo UUIDs duplicados... ¿Pero no se supone que los
UUIDs únicos?.
Son los snapshots LVM, que mantienen
el UUID del volumen lógico original. ¿Pista?. Me llama la atención...
- 17:20: Que los Snapshots LVM tengan el UUID duplicado parece algo hecho aposta, pero este hecho
y los errores que obtenía al intentar reinstalar el GRUB me recuerdan que sí había hecho algo "raro" ese día:
crear un Snapshot LVM de mi "home", es decir, de mis datos personales. No debería afectar al arranque, pero...
- 18:10: Se me iluminó la bombilla :-)
- 18:45: Pruebo a borrar ese snapshot, ya que era un experimento prescindible.
El sistema operativo arranca. ¡¡Funciona!!.
- 19:10: ¿Por qué tener un snapshot LVM te impide arrancar el ordenador?. Hago varias pruebas
y parece evidente que se trata de un bug del GRUB.
- 20:00: Estupendo, no podemos usar una de las grandes ventajas de emplear LVM. ¡Si tienes algún
snapshot, olvídate de reiniciar el ordenador!.
- 20:49: Las condiciones para desencadenar el fallo son: a) Tener un GRUB reciente que
permita arrancar desde un volumen lógico, b) Tener el arranque en un volumen
lógico, y c) Tener algún snapshot en el mismo grupo de volúmenes donde está ese volumen lógico de arranque.
- 21:18: Una vez que determinamos las condiciones exactas del fallo busco por
Internet
y veo que se trata de un problema conocido de GRUB.
Está solucionado en las versiones modernas, pero la mayoría de las distribuciones de linux "estables",
en el momento de grabar el podcast, no incorporan esta versión.
- 21:35: Resumen de todo el proceso mental de diagnóstico y resolución.