Reunión trimestral del Tier2 Español Informe UAM-LCG2 30-05-2007 Barcelona.

15
Reunión trimestral del Tier2 Español Informe UAM-LCG2 30-05- 2007 Barcelona

Transcript of Reunión trimestral del Tier2 Español Informe UAM-LCG2 30-05-2007 Barcelona.

Reunión trimestral del Tier2 Español

Informe UAM-LCG2

30-05-2007

Barcelona

Site UAM-LCG2 (disposición)

CE SE (dcache)MON

133 WNs(167 KSi2K)

27 TB

SW

Pool Pool

Pool Pool

Pool Pool

Pool Pool

Pool

Pool

Pool

37 TB

Pool B Pool A

Site UAM-LCG2 (hardware-comportamiento)

MON

CE 2x Dual Core AMD Opteron 2754G de RAM

Doble fuente de alimentaciónSL305

2x Dual Core AMD Opteron 1754G de RAM

SL305

- con aprox 140 WNs no hemos tenido problemas de rendimiento

- problema con el servicio tomcat5 (cae periódicamente), El problema creo que está en el servicio en sí, y no en la falta de hardware.

Site UAM-LCG2 (hardware-comportamiento)

SE + dcache admin

2x Dual Core AMD Opteron 2804G de RAM

Doble fuente de alimentación2 Discos SAS

SL43

- hemos comprobado consumo elevado de CPU y de memoria.- debido al aumento de la capacidadque tendrá de cache hay que tomarmedidas- Documentos que relacionan el númerode servidores que deberá tener dcache en función de los Teras que exportes.

SE

Servicios dcache

Site UAM-LCG2 (hardware-comportamiento)

Large size dcache

Site UAM-LCG2 (hardware-comportamiento)

Medium size dcacheaprox 100 TB

Jon Bakken (FNAL) and Martin Gasthuber (DESY). 2007. "dCache hardware (+) layout: typical hardware usage for various scales".

Site UAM-LCG2 (hardware-comportamiento)

SE (dcache)

27 TB

Pool Pool

Pool Pool

Pool Pool

Pool Pool

Pool

Pool

Pool

37 TB

Pool B Pool A

Site UAM-LCG2 (hardware-comportamiento)

Pool B

Pool A AMD Opteron 2441G de RAM

Cajas SCSI (2 fuentes alimentación)SL4 64 bits

2x Dual Core AMD Opteron 2758G de RAMSL4 64 bits

Almacenamiento: 13 discos Raid6 Segate ST3400620

sin hotspare en XFS

- Obtenemos poca velocidad de transferencia - cajas de discos (Vtrak) inestables- desaparecerán a medio plazo

- Han entrado en producción esta semana

Bonnie++ Raid 6 (con hotspare)

Lectura --> 395.874 KB/sEscritura --> 105.094 KB/s

Site UAM-LCG2 (hardware-comportamiento)

SE (dcache)

27 TB

Pool

Pool

Pool A

El objetivo es migrar a los pools nuevos los datos valiosos para ello:(medio plazo)

1. Actualmente estos pools se encuentran en modo rdonly2. Eliminaremos las replicas de los ficheros 3. De los existentes se eliminarán los ficheros no deseados RDOs, ESDs..4. Nos quedariamos con los AODs y ficheros de usuario 5. Finalmente migraríamos los datos a los Pool B

Nota: está prevista la adquisición a medio plazo de nuevos servidoresde almacenamiento.

Site UAM-LCG2 (hardware-comportamiento)

SE (dcache)

Pool Pool

Pool Pool

Pool Pool

Pool Pool

Pool

37 TB

Pool B

Rack con 9 servidores de almacenamiento.

Site UAM-LCG2 (hardware-comportamiento)

SE (dcache)

Pool Pool

Pool Pool

Pool Pool

Pool Pool

Pool

37 TB

Pool B

Rack con 9 servidores de almacenamiento.

Site UAM-LCG2 (hardware-comportamiento)

SE (dcache)

Pool Pool

Pool Pool

Pool Pool

Pool Pool

Pool

37 TB

Pool B

Cada máquina tiene 3 fuentes de alimentación

Site UAM-LCG2 (SAI)

- Esta semana hemos instalado una UPS de 100 KVA- El modelo es MGE Galaxy 5000

http://www.mgeups.es/productos/g5k.php

Site UAM-LCG2 (SAI)

Utilización Actual

- A la UPS van conectados todos los servidores, pero no los Wns, los cuales irían a una línea distinta.

- A la UPS hay actualmente 35 máquinas y 8 cajas con 15 discos.

- Tiene una carga de 7 %, equilibrada en las tres fases (2,2,3)

- Monitorización via http (probar la opción snmp)

Esto nos daria una autonomía de unos 84 minutos, actualmente.

Site UAM-LCG2 (Cuestiones)

1. Sigo experimentando problemas en el MON, el servicio tomcat 5 cae periódicamente, y cuando se reinicia vuelve a publicar la información correctamente.

2. Experimento que el BDII TOP (el cual consulta del RB) devuelve consultas con valor nulo.