![]()
SAS ist eine Simulationssoftware, die für statistische Analysen, Data-Mining, Data-Warehouse-Lösungen und Business-Intelligence eingesetzt werden kann. SAS steht für "Statistical Analysis System".
Man muss in der sas-Gruppe eingetragen werden, um diese Software benutzen zu können. Bitte Kontakt mit den dem Clusterteam aufnehmen.
Verfügbar auf:
Um dieses Paket auf den RRZN-Clustersystemen zu benutzen, muss man das Modul laden:
module load sas
Falls Sie die Fehlermeldung "module: command not found" bekommen, müssen Sie folgendes Kommando eingeben (im normalen Fall ist das "module" Kommando bereits vorhanden):
source /usr/share/Modules/init/`basename $SHELL`
Im normalen Fall wird SAS im seriellen Modus verwendet. Dies bedeutet, dass nur ein Prozessor benutzt wird, was wiederum heißt, dass die PBS-Option "-l nodes=1:ppn=1" benutzt werden muss. Es folgt ein Beispiel-Batchskript, um SAS im seriellen Modus zu benutzen. Hier werden 30 Minuten Laufzeit und 5GB Hauptspeicher als Ressourcen angefordert:
#!/bin/bash -login
#PBS -N seriellSAS
#PBS -M ich@meine.email.adresse
#PBS -m ae
#PBS -j oe
#PBS -l nodes=1:ppn=1
#PBS -l walltime=00:30:00
#PBS -l mem=5gb
# show which computer the job ran on
echo "Job ran on:" $(hostname)
# initialise the modules environment
source $MODULESHOME/init/bash
# load the relevant modules
module load sas
# change to work dir:
cd $PBS_O_WORKDIR
# the program to run
sas Simulation.sas
Es ist auch möglich, SAS im parallelen Modus zu betreiben. Dies ist aber nur möglich, wenn der Löser dies unterstüzt. Lesen Sie die SAS-Dokumentation für mehr Information.
Um mehrere CPU-Kerne zu benutzen, braucht man die "CPUCOUNT=" Systemoption in Ihrem SAS-Programm. Die Anzahl der CPUs, die mit dieser Option spezifiziert sind, müssen mit der Anzahl der angeforderten Prozesse im Batchskript übereinstimmen. Zum Beispiel, wenn Sie "OPTIONS CPUCOUNT=4;" in Ihrem SAS-Programm benutzen, müssen Sie "#PBS -l nodes=1:ppn=4" in Ihrem Batchskript schreiben.
Hier ist ein kleines Beispiel, das 4 CPU-Kerne anfordert und benutzt. Zuerst die SAS-Datei, hier "Test.sas" benannt.
libname p_mixed '/tmp/p_mixed';
* vier CPU-Kerne benutzen
options cpucount=4;
data p_mixed.orac;
set p_mixed.panel_7;
if attachment < 0.06 then delete;
RUN;
Und hier das Batchskript, um die richtigen Ressourcen anzufordern und das SAS-Programm laufen zu lassen:
#!/bin/bash -login
#PBS -N parallelSAS
#PBS -M ich@meine.email.adresse
#PBS -m ae
#PBS -j oe
#PBS -l nodes=1:ppn=4
#PBS -l walltime=00:30:00
#PBS -l mem=5gb
# show which computer the job ran on
echo "Job ran on:" $(hostname)
# initialise the modules environment
source $MODULESHOME/init/bash
# load the relevant modules
module load sas
# change to work dir:
cd $PBS_O_WORKDIR
# the program to run
sas Test.sas
Leibniz Universität IT Services - URL: www.rrzn.uni-hannover.de/sas.html
Dr Paul Cochrane, Letzte Änderung: 28.07.2011
Copyright Gottfried Wilhelm Leibniz Universität Hannover