DPM Syncrhonization Failures
 

Trabajar con DPM (Microsoft Data Protection Manager) me genera una serie de sentimientos encontrados.
En general, para entornos Windows, cubre las bases, permite resguardar archivos, carpetas, equipos virtuales, bases de datos MSSQL, etc. por lo que digamos que cumple.
Sin embargo, ya desde su instalación nos genera esa sensación de un producto sin terminar, armado de partes.

Una GUI que deja mucho que desear

Desde las primeras versiones de DPM, la interfaz del usuario no ha sido su fuerte.
Primitiva, básica y corta, son las palabras que me surjen, nuevamente... cumple... pero aprueba con 4

Muchas de las partes en las que la GUI no colabora, pueden corregirse, realizarse, adecuarse via PowerShell claro, pero, si quisiera hacer todo desde una shell... por ahi la herramienta que buscaría no sería esta.. y el sistema operativo tampoco.. creo que en eso concidimos.

Pero no siempre hay un script de PowerShell que nos salve.. y este es el caso.

The DPM service was unable to communicate with the protection agent on xxxxx (ID xxxx .. An existing connection was forcibly closed by the remote host (0x80072746))

WOW.. que pasó?????

Una réplica que se vuelve inconsistente debe ser resincronizada, bue.. no es tanto drama.. ahi la GUI me ayuda, busco el grupo de protección y pido una resincronización..

Peeerroooo... me llega un email...error.... mismo error...
Excarbamos un poco y la documentación (lamentable documentación) nos dice que esto puede deberse aun problema de red, que la red esté saturada, el Agente no contesta y la conexión se corta.... ni ahi...

No digo que no pueda ser eso en otros casos... pero no en este..., la comunicación entre el Agente y el Server es una red independiente para backup, es decir, no trafica ningún otra cosa, con 40 GB/s de transferencia,... no es la red.

DCOM

Analizando un poco.. el tema aqui pasa porque uno o los 2 intervinientes, Agente y Server "creen" que el otro equipo ha dejado de contestar... en nuestro caso.. lo que vemos es que en realiadad el Protection Group tiene un volumen considerable y durante el proceso de sincronización solo se transfieren pocos datos, de ahi que se generen baches temporales y el server o el agente crean que no hay respuesta.

Porque pasa esto? Por lo que se pudo analizar, es DCOM quien en realidad se está tomando "demasiado" tiempo para verificar la sincronización y por ende tiene intervalos muy grandes de no transferencia de datos, de ahi que el error sea interpretado como problemas de red.

Registry al rescate...

Bueno.. aqui es donde para mi se hace evidente que la GUI se quedó corta, porque para solucionar este problema tuvimos que recurrir a hacer cambios en el registro de windows que deberían a mi criterio estar disponibles en la GUI como parametrización de la configuración del Agente y/o Server

Buscando en las parametrizaciones factibles via claves de registro del lado del Agente encontramos las siguientes

HKEY_LOCAL_MACHINE\Software\Microsoft\Microsoft Data Protection Manager\Agent
Value Name: ConnectionNoActivityTimeout
Type: REG_DWORD
Value: 0x1c20 (7200 decimal)

HKEY_LOCAL_MACHINE\Software\Microsoft\Microsoft Data Protection Manager\Agent
Value Name: ConnectionNoActivityTimeoutForNonCCJobs
Type: REG_DWORD
Value: 0x1c20 (7200 decimal)

Ok.. pará !! que estamos haciendo con estos cambios????
Bien, lo que hacemos poniendo un valor decimal de 7200 a las claves del registro es decirle al Agente que espere más tiempo antes de cortar la comunicación

Una vez que hicimos este cambio en el registro, debemos verificar que no tengamos trabajos en ejecución y reiniciar el servicio DPMRA

Reiniciado el servicio DPMRA, podremos reintentan la sincronización, misma que debería finalizar sin problemas.

Conclusiones

Hay muchos ajustes que se pueden hacer via edición del registro, pero es peligroso si no sabemos exactament lo que estamos haciendo.
Que luego de tantas versiones la GUI de DPM siga siendo tan poble, implica que es tal vez un producto que no interesa tanto para Microsoft y como lo hizo con ForeFront posiblemente discontinúe en un futuro cercano.
Cierto es que no es una de las herramientas de backup más difundidas, pero como dije antes, para ambientes Microsoft, aprueba... (con 4.. pero aprueba)

 

 

Volver a lista de Notas