Guía de Recuperación y Resiliencia: SOA Backoffice Cluster

⚠️ Nivel Técnico: Senior / Expert
Este procedimiento asume un entorno de Producción OSB/SOA Suite en Clúster. Cualquier error en la secuencia de limpieza de caché puede resultar en inconsistencias de despliegue.

Antes de reiniciar cualquier servicio de Middleware, debemos asegurar que los cimientos (Red y Base de Datos) están firmes. Un reinicio de WebLogic sin base de datos es tiempo perdido.

📋 1. Fase de Validación y Prerrequisitos (Sanity Check)

No toques WebLogic sin confirmar que los nodos se ven entre sí y que la base de datos está disponible.

1.1 Conexión y Validación de Red

ssh oracle@172.28.100.139

# Validar visibilidad local
ping -c 1 sev-nmnode1

# Validar visibilidad a Nodo 2
ping -c 1 jiu-nmnode1

1.2 Validación de Base de Datos

# Verificar puerto SOA dedicado (1595)
nc -zv etalides.wstelecom.net 1595

Esperado:

Connection to ... port 1595 [tcp/*] succeeded!

🧹 2. Fase de Higiene (Limpieza Profunda)

Tras una caída o mantenimiento, el caché de WebLogic puede contener datos corruptos. Se debe limpiar en ambos nodos.

2.1 Limpieza en Nodo 1 (Admin + Managed)

ps -ef | grep weblogic | grep -v grep | awk '{print $2}' | xargs kill -9
ps -ef | grep NodeManager | grep -v grep

cd /u01/oracle/admin/domains/osbdev_bo_domain/servers/

rm -rf AdminServer/tmp/* AdminServer/cache/* AdminServer/data/ldap/*
rm -rf OSB_SERVER1/tmp/* OSB_SERVER1/cache/*
rm -rf JMS_SERVER1/tmp/* JMS_SERVER1/cache/*
rm -rf JEE_SERVER1/tmp/* JEE_SERVER1/cache/*
rm -rf ESS_SERVER1/tmp/* ESS_SERVER1/cache/*

2.2 Limpieza en Nodo 2 (Managed)

ssh oracle@172.21.151.138

ps -ef | grep weblogic | grep -v grep | awk '{print $2}' | xargs kill -9

cd /u01/oracle/admin/domains/osbdev_bo_domain/servers/

rm -rf OSB_SERVER2/tmp/* OSB_SERVER2/cache/*
rm -rf JMS_SERVER2/tmp/* JMS_SERVER2/cache/*
rm -rf JEE_SERVER2/tmp/* JEE_SERVER2/cache/*
rm -rf ESS_SERVER2/tmp/* ESS_SERVER2/cache/*

🚀 3. Arranque de Infraestructura (Node Manager)

Ejecutar en ambos nodos:

cd /u01/oracle/admin/domains/osbdev_bo_domain/bin/

grep "ListenAddress" ../nodemanager/nodemanager.properties

nohup ./startNodeManager.sh > LogStartNodeManager.log 2>&1 &

netstat -an | grep 5556

Esperado: LISTEN

🔍 Tip Senior (SSL)

openssl x509 -in /u01/oracle/certificates/ssl/api.ssorh.mx_cert.cer -noout -enddate

🧠 4. Arranque del AdminServer

Solo en Nodo 1:

cd /u01/oracle/admin/domains/osbdev_bo_domain/bin/

nohup ./startWebLogic.sh > /u01/oracle/admin/logs/osbdev_bo_domain/AdminServer_boot.out 2>&1 &

tail -f /u01/oracle/admin/logs/osbdev_bo_domain/AdminServer_boot.out

Esperar:

<Server started in RUNNING mode>

💪 5. Arranque de Managed Servers (Cluster)

Desde la consola WebLogic:

http://172.28.100.139:7001/console

Secuencia:

  1. OSB_CLUSTER → Start
  2. JMS_CLUSTER → Start
  3. JEE_CLUSTER → Start
  4. ESS_CLUSTER → Start

📸 6. Auditoría y Evidencia

tree -a -L 4 -f > /tmp/estructura_completa_Lyra.txt
find . -maxdepth 4 -not -path '*/.*' > /tmp/estructura_completa_Lyra.txt

Descarga desde Windows:

scp oracle@172.28.100.139:/u01/oracle/admin/domains/osbdev_bo_domain/bin/LogStartWeblogic.out "C:\Users\rugarcia\Downloads\"
scp oracle@172.28.100.139:/tmp/estructura_completa_Lyra.txt "C:\Users\rugarcia\Downloads\"

📊 Anexo: Mapa de Arquitectura

Componente Hostname IP Función
Nodo 1 izjidsoagtv01 172.28.100.139 AdminServer, Managed
Nodo 2 izsedsoagtv02 172.21.151.138 Managed HA
Base de Datos etalides 1595 SOAINFRA / MDS
Balanceador OTD izdseotdbo 172.21.151.142 Entry Point
Script Definitivo: Reparar y Optimizar JDeveloper 12c (Error JVM)
Older post

Script Definitivo: Reparar y Optimizar JDeveloper 12c (Error JVM)

Script automatizado (.bat) para solucionar el error 'Unable to create JVM', optimizar memoria RAM en equipos de 32GB y limpiar caché corrupta en JDeveloper.

Newer post

UI Component: Electric Neon Cards

Implementación de tarjetas con bordes de energía giratorios utilizando Conic Gradients, Inset y efectos de brillo neón.

UI Component: Electric Neon Cards