Changes between Version 46 and Version 47 of ColasPBS


Ignore:
Timestamp:
Sep 30, 2011 1:49:27 PM (11 years ago)
Author:
lluis
Comment:

--

Legend:

Unmodified
Added
Removed
Modified
  • ColasPBS

    v46 v47  
    569569Donde [nnn] es el nodo requerido. Este job carece un poco de sentido, puesto que si se hacen las cosas bien, el trabajo tendría que ser ejecutable igualmente en cualquier nodo.
    570570
     571== APENDICE: Correos ==
     572
     573=== Correo 30 septiembre 2011: Requerimientos de memoria trabjos en la cola 'estadistica'  ===
     574  {{{
     575Buenos días,
     576
     577Esto es una actualización del correo que os mandé hace una semana...
     578
     579Últimamente hemos tenido problemas con el clúster. Estos problemas acaecían por jobs que superaban la capacidad de memoria de los nodos. Después de mirárnoslo, hemos encontrado la manera para evitarlo. Se trata de mandar los jobs al clúster (envia_matlab, envia_R) con un requerimiento de memória incluído. Con este requerimiento de memoria se establecen dos cosas en los jobs:
     580 1.- Los trabajos que se manden sólo se van a ejecutar si ecuentran un nodo que tenga disponible la memoria requerida
     581 2.- Si algún elemento del trabajo mandado supera este límite de memoria, la ejecución del job se parará.
     582
     583Para hacer este requerimiento se tiene que añadir a la instrucción 'qsub'
     584-l mem=[cantidad_de_memoria kb/mb/gb/tb]
     585
     586o si es en un script de pbs
     587#PBS mem=[cantidad_de_memoria kb/mb/gb/tb]
     588
     589La  [cantidad_de_memoria] tiene que ser un número entero
     590
     591Cada job irá reservando memoira del nodo. Cuando un trabajo no encuentre suficiente memoria se quedará a la espera hasta que la consiga. Esto puede hacer que por ejemplo con un nodo con 8 cores y 8 GB de memoria, sólo pueden correr en el 3 jobs de 2250mb, un cuarto ya no entraría. Así quedarían 5 cores libres que no harían nada (a no ser que le mandáramos 5 jobs que no llegasen a consumir los 250mb restantes)
     592
     593Recordad que tenéis a vuestra disposición una wiki con toda esta información
     594
     595https://www.meteo.unican.es/trac/meteo/wiki/ColasPBS
     596
     597La cola 'estadística' tiene por defecto un valor de 'mem=750mb'. Si tenéis que mandar un trabajo al clúster que sepáis que vaya a ocupar mucha memoria, por favor, augmentad el valor de 'mem' a lo que estimeis, pero nunca superando los '7gb', ya que los nodos de la cola estadística sólo tienen 8gb de memoria (el sistema ocupa una parte).
     598
     599Por ahora si el job muere por exceso de memoria no habrá manera de saberlo, puesto que de momento no sabemos como hacer que el sistema mande un mensaje diciendo algo. Estamos en ello.
     600
     601Hasta ahora,
     602
     603Lluís
     604}}}