FAQ

Come faccio a sapere quando il mio job andrà in esecuzione?

Per avere una previsione “al più tardi”  eseguire il comando

expectation jobid

expectation 64553

SubmitTime=2019-10-10T09:00:00

StartTime=2019-10-10T11:00:00

Nell’esempio e’ prevista la partenza del JOB alle ore 11:00 nello stesso giorno di sottomissione.

Per conoscere data ed ora di start di tutti i job in stato di Pending digitare

squeue   –start    ( 2 caratteri – )

Il sistema mostrerà la data  di inizio dei job per i quali è possibile calcolare tale valore.

Come faccio a sapere quante ore di calcolo ho consumato?

Il comando

useraccounting    2019-01-01   2019-06-30  “” “” “”

consente di conoscere l’utilizzo effettuato dal primo gennaio al 30 giugno su INDACO e le ore rimanenti della propria quota.

 

Come faccio ad avviare una macchina virtuale Windows 10?

E’ possibile avviare una macchina virtuale windows 10 con i seguenti comandi

module load omics/1

omics

 

Come faccio a registrare un progetto?

Nella pagina di registrazione per gli utenti di  UNIMI occorre modificare la finalità selezionando PROGETTO al posto di registrazione utente.

 

Non riesco a vedere i miei dati all’interno della macchina virtuale

Per accedere ai propri dati dalla macchina virtuale occorre selezionare una delle seguenti modalità

  1. creazione del CDROM virtuale contenente i dati in modo da renderli visibili alla VM come se fossero su CDROM
  2. utilizzo del software scp transfer per copiare i dati da INDACO all’interno della macchina virtuale

 

 

Non riesco a modificare i file creati dai miei collaboratori

E’ possibile cambiare il gruppo secondario al gruppo di progetto con il comando

newgrp    progetto

e modificare  la maschera al valore 002 con il comando

umask 002

 

E’ possibile utilizzare GPU su INDACO?

Su INDACO sono disponibili le schede Nvidia K40. Tra breve verranno rese disponibili anche le schede 2080 TI a singola precisione.

Come faccio a vedere se il mio job sta usando la GPU

Occorre connettersi al nodo gpu con ssh (es. ssh  gpu1) e lanciare il comando nvidia-smi

Come avvio un job che usa  due GPU con Amber ed MPI?

# One dual GPU 
    export CUDA_VISIBLE_DEVICES=0,1
    cd run1
    mpirun -np 2 ${AMBERHOME}/bin/pmemd.cuda.MPI -O -i ...

 

Il costo su INDACO delle GPU è troppo alto.

Il noleggio della macchina con GPU prevede un  pacchetto da almeno 16 core ed una GPU. Per tenere conto della differenza di costo/prestazioni delle macchine con GPU rispetto alle macchine light è stato introdotto il fattore di moltiplicazione di 22,4 valido solo per il periodo di gratuità. Un’ora di calcolo su macchina con GPU utilizzando 16 core o meno produce un addebito di 22,4 ore da scalare dalla quota. Ciò riflette il fatto che il costo orario di un  core-light  per utente abbonato è 0,026 Euro mentre il costo di 16 core per un’ora di utilizzo  su un nodo GPU è 0.582 Euro.

Alcuni job utilizzano solo un core CPU ed il calcolo si svolge quasi interamente su GPU. INDACO renderà disponibile una macchina dotata di GPU di classe gaming per tali applicazioni.

Perchè il mio job non parte anche se ci sono nodi liberi?

Lo schedulatore utilizza una politica di fair sharing.  L’algoritmo Fair tree provvede ad ordinare in ordine decrescente di priorità i job. Lo scopo è quello di assicurare un utilizzo equo delle risorse da parte degli utenti evitando che un utente possa monopolizzare il cluster solo perché in quel momento risulta scarico.

Perchè il mio job non parte?   Squeue  mi dice:

Priority Se il tuo lavoro ha una priorità inferiore rispetto ad altri lavori in coda, rimarrà in stato di pending. In coda, tali lavori saranno indicati con la voce Priority (Reason)

AssocGrpMemLimit E’ stata superata la quantità di memoria massima per tutti i job del gruppo di account. Uno o più’ job devono terminare prima che altri possano partire.

AssocGrpCPULimit  E’ stato superato il numero massimo di CPU per tutti i job in esecuzione del gruppo di account dell’ utente. Uno o più’ job in esecuzione devono terminare prima che il job possa partire.

AssocGrpTimeLimit E’ stato raggiunto il massimo valore walltime per tutti i job in esecuzione del gruppo. Uno o più job devono terminare prima che il job possa partire.

Dependency  Il job non può partire a causa di una dipendenza

Resources  Non ci sono abbastanza risorse disponibili