¿Estás visitando desde ?
Ingresá a Linware ⯈
Continuar en Linware Argentina ⯈
×
¿Qué estás buscando?
BUSCAR!
BLOG
Canonical, Elastic y Google se unen para evitar la corrupción de datos en Linux
Publicada el 30/06/2020

En Elastic se esta constantemente innovando y lanzando nuevas características. A medida que se lanzo nuevas funciones, también se esta trabajando para asegurarnos de que sean probadas, sólidas y confiables, y a veces encontrando errores u otros problemas.

Al probar una nueva característica, se descubrio un error del kernel de Linux que afecta los discos SSD en ciertos kernel de Linux. 

La investigación dio como resultado lanzamientos de nuevos núcleos de Ubuntu que abordan el problema.

Canonical se une al esfuerzo

Si bien habia algunas soluciones, todavía no estában satisfechos:

  • El problema no era específico de las imágenes de Ubuntu en GCP; También sucedió en metal desnudo.
  • No sabíamos qué confirmación de kernel introdujo el problema.
  • No sabíamos si una solución ya estaba disponible en un kernel más nuevo.

Para abordar estos puntos, nos comunicamos con nuestro socio Canonical para profundizar un poco más.

Canonical comenzó un gran esfuerzo de prueba utilizando los scripts de reproducción Elastic , primero confirmando que la corrupción no se produjo en los núcleos de línea principal de Ubuntu> = 5.0 usando unidades SSD (usando ninguno o planificadores de E / S de múltiples colas con fecha límite mq ).

El siguiente paso fue retroceder en las versiones de kernel para encontrar el delta mínimo entre un kernel que exhibe corrupción y uno que no. Utilizando múltiples entornos de prueba paralelos (dado que una prueba completa puede tomar hasta cinco días), Canonical descubrió que 4.19.8 es el primer núcleo de Ubuntu mainline que incluye las correcciones de corrupción [6].

Los backports faltantes para el kernel 4.15.0 y los derivados se describen en el rastreador de errores de Canonical en LP # 1848739 , y se pueden encontrar más detalles en este artículo y el error kernel.org .

Después de que Elastic y Canonical confirmaron que un kernel GCP parcheado que incluye todos los backports necesarios soluciona el problema , se fusionaron en el kernel principal de Ubuntu 4.15.0 y, en consecuencia, todos los kernels derivados (incluido -gcp) recibieron las correcciones.

Conclusión

Elastic se compromete a desarrollar nuevas características de Elastic Stack que mejoren cada una de las tres soluciones principales. Estos esfuerzos cuentan con el apoyo de algunos ingenieros y socios muy talentosos que siempre están atentos para que no tenga que preocuparse. Si encontramos problemas durante las pruebas, sepa que Elastic y su red de socios cercanos no dejarán ninguna piedra sin mover para garantizar que tenga la mejor experiencia posible.

A través de nuestra estrecha colaboración con Google y Canonical, se pudo llegar al fondo del problema, lo que condujo al lanzamiento de los siguientes núcleos fijos HWE Ubuntu:

El uso de las versiones anteriores o más recientes evitará la corrupción cuando se utilizan discos SSD junto con SCSI blk-mq habilitado.

Si no quiere preocuparse si su entorno está protegido de esta corrupción de datos, pruebe con Elastic Cloud.

Ir al Blog