123456789101112131415161718192021222324252627 |
- À partir de la version 2.5.4 d'OAR, il est possible de lancer un
- signal de checkpoint au jobs en besteffort qui sont sur le point
- d'être tués par des jobs d'une queue prioritaire (avant la v. 2.5.4 le
- meurtre était forcément sans préavis!)
- IMPORTANT : les scripts ci-dessous sont «fixés» sur orval06 car ce
- nœud était libre lors de la mise au point de ces programmes
- test. Merci de ne pas lancer ces tests avant de vérifier (monitoring)
- que le noeud orval06 est libre (au besoin, modifier le noeud dans les
- scripts
- 1) make : compile les fichiers C (compteur capable de recevoir le
- signal de checkpoint SIGUSR2) et fortran
- 2) oarsub -S ./orval06-a-tuer.oar pour lancer le «tableau de jobs»
- compteurs de minutes (autant de jobs que de ligne dans input.txt )
- 3) qques minutes plus tard, lancer :
- oarsub -S ./killer-orval06.oar ( quelques produit matriciel openMP
- dans la queue prioritaire )
- - tout compteur tué aura préalablement effectué un checkpoint
- - après la fin job «tueur» ( multiplication matricielle, assez court),
- les ressources sont libérées et les jobs précédemment tués sont
- relancés (mais à partir du checkpoint)
|