toy-story-2

Toy Story 2 estuvo cerca de destruirse por un error de los servidores

Creativity incLas últimas semanas estuve leyendo el libro Creativity inc. de Ed Catmull, uno de los fundadores de Pixar, donde cuenta muchos detalles de la historia de esta gran empresa del entretenimiento y revela las prácticas que hacen de este estudio cinematográfico uno de los más exitosos.

Dentro de las anécdotas que más me llamaron la atención estuvo la de aquella vez en que por error borraron una gran parte de los archivos de la película Toy Story 2 que se iba a estrenar unos meses después.

¿Qué pasó?

Una de las características principales de pixar es que sus películas son desarrolladas por computador, utilizando las tecnologías más avanzadas de modelamiento 3D, renderizado y animación por computador. Y claro, todo lo que utilizan para construirlas es almacenado en servidores (específicamente servidores linux que se basan en unix).

 

PixarHQ

El problema ocurrió en 1998, durante la producción de Toy Story 2, cuando una de las personas ejecutó por error el comando /bin/rm -r -f * (https://es.wikipedia.org/wiki/Rm) que en sistemas unix borra todos los archivos y carpetas del sistema sin pedir confirmación. Después de desconectar la máquina para que no continuara el borrado masivo, se dieron cuenta que el 90% de los archivos de la película habían sido borrados.

Para evitar estos errores se suele tener cuidado de sólo conceder permisos a los usuarios a sus propios archivos, pero dado que la forma en que trabaja Pixar obliga a que muchas personas deben tener acceso a múltiples archivos, la política de red estaba definida para que cualquier persona pudiera visualizar y editar los archivos de todo el proyecto.

Pese a borrar una gran cantidad de información, este tipo de errores no suele ser catastrófico. Las organizaciones con equipos de tecnología serios, como Pixar, mantienen copias de seguridad que les permiten recuperar la información del día anterior o de unos pocos días atrás. El equipo técnico de Pixar, apenas se enteró del borrado masivo, empezó a restaurar los archivos de la copia de seguridad.

Pero como lo cuenta en quora el director técnico asociado de la película, Oren Jacob, en los días siguientes se dieron cuenta que el sistema de copias de seguridad había estado teniendo problemas y las versiones restauradas quedaron con múltiples errores.

¿Cómo lo arreglaron?

En el punto en el que se encontraban la mejor estrategia, pensando en perder la menor cantidad de información, era encontrar la última copia de seguridad que no tuviera errores. Según lo que habían revisado, la última copia válida era de cerca de dos meses atrás, por lo que sería necesario repetir esos dos meses de trabajo de todo el equipo.

 

woody3dmodel
Algunos de los archivos borrados eran modelos 3d de los personajes

Pero tuvieron un golpe de suerte: Galyn Susman, una de las supervisoras técnicas, estaba trabajando desde casa por una licencia de maternidad, y para poder trabajar remotamente estaba realizando copias de seguridad semanales del proyecto. En realidad, como aclara Oren Jacob, la copia de que tenía Galyn en su casa tenía una parte de los archivos, así que el equipo técnico tuvo que reconstruir los archivos del sistema mezclando el árbol de archivos de la copia de dos meses atrás, la copia en el computador de Galyn Susman y otra conjunto de archivos recuperados de las máquinas de los animadores y de logs de renders.

El equipo de tecnología trabajó todo un fin de semana para ensamblar las versiones más actualizadas de los archivos que fuera posible, pero aún así hubo un porcentaje importante de trabajo que se perdió para siempre.

El resultado

El inconveniente técnico con Toy Story 2 complicó el cumplimiento del proyecto, pero como cuenta Ed Catmull en su libro, el proyecto también tenía unos problemas en la dirección de la película que posteriormente llevaron al equipo directivo a sustituir al director y hacerle grandes cambios a la película.

Muchas de las partes que no se recuperaron tuvieron que volverse a trabajar, pero con los cambios de guión también hubo otras que no se tuvieron que re-procesar. Al final, después de los inconvenientes, Pixar pudo estrenar Toy Story 2 logrando otro éxito en taquilla.

Aprendizaje

Algo que vale la pena resaltar es que hasta en las grandes empresas tecnológicas que utilizan las mejores prácticas ocurren accidentes y errores, ocasionados por humanos o por muchos otros factores. En los países de Latinoamérica solemos pensar que en esas empresas no ocurren esos problemas y que sólo en las locales pasa porque somos muy “tropicales”.

Es cierto que las empresas latinas tienen muchos puntos de mejora, pero es bueno tener presente que estos errores y accidentes no se pueden eliminar completamente. Y el tenerlo presente finalmente ayuda a darnos cuenta de la importancia de tener copias de seguridad, de tener procesos de continuidad de negocio y de tener análisis de disponibilidad de los sistemas, que finalmente es que le ayudó a Pixar a evitar una catástrofe.

Se pueden leer más detalles de la historia en: TheNextWeb

junio 23, 2015 | 0 comentarios | Ingeniería

Comentar

Deja un comentario

Bitajor.com | Hecho en Colombia | 2008 - 2016