Respaldo de datos: protegiendo lo más importante de tu organización

lupa
Blog Privacidad Software libre Tecnologías disruptivas
Disco y memorias

Es probable que lo más importante de tu organización sea la información: los trabajos, investigaciones, artículos, documentos administrativos; son bienes intangibles, que pueden se imposible de recuperar en caso de pérdida, por lo tanto son invaluables. Respaldar significa hacerte cargo de recopilar toda tu información importante, y guardarla de manera sistemática en un lugar seguro. 

Por ello es fundamental crear una política de respaldos que incluya: 1. lugar donde se almacenarán los respaldos, 2. elección de los elementos a respaldar así como valoración de su tamaño y 3. periodicidad con que se realizarán los respaldos. Veamos cómo lograr esto por partes:

1. ¿Dónde almacenar los respaldos?

Se puede hacer en uno o varios discos externos, se puede hacer en otra computadora, o quizás en un servicio de «nube» como Nextcloud, Dropbox, OneDrive o Drive. Debes evaluar los riesgos que implica cada método, por ejemplo, si lo haces en un disco externo, tienes que prever el costo del disco y la limitación del tamaño. Además está el problema de dónde guardar el disco: si lo dejas en la oficina, ¿qué ocurre en caso de incendio o robo?

Una estrategia posible, sería tener un disco de 2TB donde respaldar documentos y fotos (probablemente no videos) y guardarlo en la casa de alguien de la organización. El disco se podría traer por ejemplo una vez a la semana para realizar los respaldos.

Una segunda opción es utilizar una «nube» que es un servicio tercerizado donde se almacenan datos de forma remota. ¿Qué significa esto? Que tu información está almacenada en una o varias computadoras que no te pertenecen, sino una empresa te cede o te alquila el espacio que ella controla y administra 1. Este mecanismo agrega varias comodidades, pues no hay que estar llevando ni trayendo nada y los respaldos se podrían hacer automáticamente. 

Pero a su vez aparecen nuevos problemas y riesgos: por un lado el tema del espacio, ya que estos servicios suelen brindar de forma gratuita unos pocos GB, teniendo que contratar planes de pago para obtener más almacenamiento. Por otro lado, el tema de la velocidad de carga de la información, que dependiendo del tipo de conexión y el tamaño de información puede resultar algo lento. 

Por último, desde el punto de vista de la seguridad estarías depositando la confianza en un tercero que eventualmente puede ser vulnerado o que incluso puede tomar decisiones sobre tu información 2.

Nota importante: debes tener la precaución de no guardar tus respaldos en la misma «nube» que utilizas para guardar tu repositorio institucional. Los respaldos siempre deben estar en un «lugar» diferente. Es decir, que si usas Drive para compatir tu repositorio con tu equipo, deberías respaldar en otra «nube» como Mega o Dropbox.

Elegir cualquiera de estas opciones o incluso una diferente, dependerá del «Modelo de Amenazas» de tu organización y los recursos que cuentes para hacerlo. Una vez que hemos determinado dónde respaldar, veamos el siguiente aspecto:

2. ¿Qué respaldar?

Un segundo elemento a tener en cuenta es qué es lo que se necesita respaldar. ¿Será todo el repositorio institucional? ¿Quizás sea solamente la información del año actual? ¿O quizás solamente los proyectos activos?

Por otra parte qué tipo de información vas a respaldar, ¿serán solo documentos? (que suelen ser «livianos») ¿o también podrá incluir fotos, audios o videos? En particular, los videos en alta calidad pueden ser muy «pesados» y por lo tanto, más complicados de respaldar: debido a restricciones de espacio en disco o ancho de banda.

Nuevamente aquí podrías tener diversas opciones según lo que respondas a las preguntas anteriores. Quizás una estrategia posible sea adoptar un doble abordaje: los videos de alta calidad, almacenados en un disco externo y el repositorio general en algún servicio de «nube». Realmente aquí hay muchos caminos posibles. Te recomendamos que estimes la cantidad de contenido que produce tu organización, la clasifiques por tipo, y de esa manera tengas una lista más clara de posibles pasos a seguir.

3. ¿Cada cuánto respaldar?

Lo siguiente tiene que ver con la periodicidad. Puedes elegir respaldar una vez a la semana, o quizás no sea necesario ya que información no cambia tanto, y bastará realizar los respaldos una vez por mes (por ejemplo algún proyecto archivado). Sin embargo lo más común es que la información cambie muy rápido y sea necesario realizar los respaldos todos los días.

Esto nuevamente lo debes decidir en función de la velocidad de producción de la información así como del tipo de información que maneja tu organización y también del modelo de amenazas previamente establecido.

Veamos todo lo anterior con un ejemplo:

Un ejemplo de la «vida real»

Tomemos un ejemplo de una organización de 6 personas, con pocos recursos económicos que posee 3 carpetas diferenciadas, con accesos diferenciados.

Las carpetas contienen lo siguiente:

  • Un repositorio institucional de 15GB (con algunos pocos videos) que crece 5MB por día
  • Una carpeta de videos de un proyecto específico de 200GB que crece aproximadamente 5GB por mes
  • Una carpeta con documentos administrativos de 100 MB que cambia 1MB a la semana

Una posible configuración sería así:

  • Una cuenta en la nube que permita más de 30 GB de información y respaldos automáticos todas las noches (por ejemplo Google Drive One 20 dólares/año aprox)
  • Un disco duro de 2TB donde se respaldarán los videos una vez a la semana, por ejemplo los viernes (entre 60 y 80 dólares aprox)
  • Una cuenta en otra nube que permita 2GB que se respaldará automáticamente todas las noches (gratis)

A este ejemplo aún les falta algunas consideraciones técnicas y de seguridad que veremos a continuación:

Respaldos incrementales

Un problema sobre el que siempre volvemos es la restricción de espacio. ¿Qué ocurre si en el ejemplo anterior se realizan copias completas del repositorio de video una vez por semana? Haciendo un poco de matemática veremos que aproximadamente en 10 semanas, o sea en unos 2 meses y medio, se llenaría nuestro disco de 2TB (2048 GB) y deberíamos borrar los viejos respaldos o comprar un nuevo disco duro.

Una solución a este problema es realizar los respaldos de forma «incremental», es decir copiar o borrar solo aquello que cambió. Esto implica «llevar la cuenta» de lo que se agregó o borró y modificar solamente eso. Siguiendo el ejemplo anterior, como la carpeta de videos aumenta 5GB por mes, tendremos la posibilidad de utilizar el disco durante 360 meses más, ¡sí 360 meses ! Pues 360 meses por 5 GB, es igual a 1845 GB aproximadamente el espacio libre que quedó luego del primer respaldo.

¿Pero cómo llevar la cuenta de lo que cambia para cada respaldo? Hay programas que lo hacen automáticamente. Y no solo eso, sino que este tipo de sistemas es capaz de recuperar cualquier respaldo de fecha anterior: digamos que hace 2 años se vienen generando los respaldos de videos de forma incremental y descubres que hace 20 meses se borró un video por error. Como el sistema guarda la información completa de lo que fue cambiando, también tiene ese video guardado en el respaldo de 20 meses atrás. Basta pedirle al programa el respaldo de esa semana y obtendrás el video borrado. Como podrás ver, este método incremental es fantástico.

Respaldos cifrados

Otro problema muy importante que mencionamos es el de la seguridad de la información respaldada: ¿Qué pasa si alguien accede a la «nube» de la organización de forma no autorizada? ¿Qué pasa si roban el disco duro de la oficina o de la mochila de quién lo custodia? ¿Qué ocurre si la empresa realiza escaneos automáticos para borrar cosas que considera no adecuadas o que no van con su política? Esa persona o grupo podría tener acceso a toda la información de nuestra organización, incluso a la más sensible. 

Para tener un almacenamiento cifrado puedes utilizar VeraCrypt para cifrar tu disco o pendrive, o generar un contenedor cifrado en una nube. El problema con este abordaje es que se agrega un nuevo programa que deberíamos combinar con el programa de respaldos y en el caso de utilizar «nube», cada vez que modifiques tu contenedor cifrado, se sincronizará por completo hacia la nube, siendo muy poco eficiente.

Por ello, lo mejor es utilizar un programa para respaldos que realice las copias de forma cifrada, independientemente de que el almacenamiento esté o no cifrado. Esto significa que en el momento de crear el respaldo, deberás establecer una contraseña y solamente con ella podrás recuperar la información. Es muy importante guardar esa contraseña en un lugar —como por ejemplo en KeepassXC— y no perderla bajo ningún concepto, de lo contrario será imposible recuperar tu información.

Para conocer más sobre modelos y mecanismos de manejo de contraseñas, te invitamos a leer nuestro artículo El Caos de las Contraseñas.

Una recomendación

Llegado a este punto es importante saber que hay varios programas que cumplen las características que se necesitan para realizar respaldos de la forma más eficiente y segura. En este artículo queremos recomendarte uno que se llama Duplicati, pues tiene todas estas funcionalidades:

  • Cifrado «fuerte» con AES256 3 o con GPG 4
  • Respaldos incrementales
  • Posibilidad de conexión con formas de respaldo remoto o «nubes» (Drive, OneDrive, Dropbox, Mega, SSH, WebDAV, etc..)
  • Corre en múltiples sistemas operativos (GNU/Linux, Windows, MacOS)
  • Interfaz web
  • Es software libre

Te dejamos un tutorial con algunas capturas de pantalla para utilizar Duplicati para realizar respaldos.

Esperamos que este artículo te sirva para decidir, construir y poner en práctica una política de respaldos de tu organización y no esperes a que sea demasiado tarde para resguardar lo más importante que tiene tu organización.

Imagen destacada: PxHere con licencia Creative Commons CC0

Notas:

  1. También hay opciones de crear nubes propias pero esto excede el alcance de este artículo
  2. Ejemplos de ello Dropbox o Microsoft que analizan de forma automática tu información buscando infracciones de «propiedad intelectual» u otras cosas que consideren inadecuadas
  3. https://es.wikipedia.org/wiki/Advanced_Encryption_Standard
  4. https://es.wikipedia.org/wiki/GNU_Privacy_Guard