0README 1.1 KB

123456789101112131415161718192021222324252627
  1. À partir de la version 2.5.4 d'OAR, il est possible de lancer un
  2. signal de checkpoint au jobs en besteffort qui sont sur le point
  3. d'être tués par des jobs d'une queue prioritaire (avant la v. 2.5.4 le
  4. meurtre était forcément sans préavis!)
  5. IMPORTANT : les scripts ci-dessous sont «fixés» sur orval06 car ce
  6. nœud était libre lors de la mise au point de ces programmes
  7. test. Merci de ne pas lancer ces tests avant de vérifier (monitoring)
  8. que le noeud orval06 est libre (au besoin, modifier le noeud dans les
  9. scripts
  10. 1) make : compile les fichiers C (compteur capable de recevoir le
  11. signal de checkpoint SIGUSR2) et fortran
  12. 2) oarsub -S ./orval06-a-tuer.oar pour lancer le «tableau de jobs»
  13. compteurs de minutes (autant de jobs que de ligne dans input.txt )
  14. 3) qques minutes plus tard, lancer :
  15. oarsub -S ./killer-orval06.oar ( quelques produit matriciel openMP
  16. dans la queue prioritaire )
  17. - tout compteur tué aura préalablement effectué un checkpoint
  18. - après la fin job «tueur» ( multiplication matricielle, assez court),
  19. les ressources sont libérées et les jobs précédemment tués sont
  20. relancés (mais à partir du checkpoint)