Logo: Leibniz Universität Hannover

SAS

Beschreibung

SAS ist eine Simulationssoftware, die für statistische Analysen, Data-Mining, Data-Warehouse-Lösungen und Business-Intelligence eingesetzt werden kann.  SAS steht für "Statistical Analysis System".

Man muss in der sas-Gruppe eingetragen werden, um diese Software benutzen zu können.  Bitte Kontakt mit den dem Clusterteam aufnehmen.

Verfügbar auf:

  • RRZN-Computeservern

Ansprechpartner

 Dr. Paul Cochrane

Inhaltsverzeichnis

  • Benutzung auf den RRZN-Computeservern
  • Dokumentation und Beispiele

Benutzung auf den RRZN-Computeservern

Um dieses Paket auf den RRZN-Clustersystemen zu benutzen, muss man das Modul laden: 

module load sas

Falls Sie die Fehlermeldung "module: command not found" bekommen, müssen Sie folgendes Kommando eingeben (im normalen Fall ist das "module" Kommando bereits vorhanden): 

source /usr/share/Modules/init/`basename $SHELL`

Dokumentation und Beispiele

SAS-Dokumentation

Serielle Nutzung

Im normalen Fall wird SAS im seriellen Modus verwendet.  Dies bedeutet, dass nur ein Prozessor benutzt wird, was wiederum heißt, dass die PBS-Option "-l nodes=1:ppn=1" benutzt werden muss.  Es folgt ein Beispiel-Batchskript, um SAS im seriellen Modus zu benutzen.  Hier werden 30 Minuten Laufzeit und 5GB Hauptspeicher als Ressourcen angefordert:


#!/bin/bash -login
#PBS -N seriellSAS
#PBS -M ich@meine.email.adresse
#PBS -m ae
#PBS -j oe
#PBS -l nodes=1:ppn=1
#PBS -l walltime=00:30:00
#PBS -l mem=5gb

# show which computer the job ran on
echo "Job ran on:" $(hostname)
# initialise the modules environment
source $MODULESHOME/init/bash
# load the relevant modules
module load sas
# change to work dir:
cd $PBS_O_WORKDIR
# the program to run
sas Simulation.sas

Parallele Nutzung

Es ist auch möglich, SAS im parallelen Modus zu betreiben.  Dies ist aber nur möglich, wenn der Löser dies unterstüzt.  Lesen Sie die SAS-Dokumentation  für mehr Information.

Um mehrere CPU-Kerne zu benutzen, braucht man die "CPUCOUNT=" Systemoption in Ihrem SAS-Programm.  Die Anzahl der CPUs, die mit dieser Option spezifiziert sind, müssen mit der Anzahl der angeforderten Prozesse im Batchskript übereinstimmen.  Zum Beispiel, wenn Sie "OPTIONS CPUCOUNT=4;" in Ihrem SAS-Programm benutzen, müssen Sie "#PBS -l nodes=1:ppn=4" in Ihrem Batchskript schreiben.

Hier ist ein kleines Beispiel, das 4 CPU-Kerne anfordert und benutzt.  Zuerst die SAS-Datei, hier "Test.sas" benannt.


libname p_mixed '/tmp/p_mixed';
* vier CPU-Kerne benutzen
options cpucount=4;
data p_mixed.orac;
set p_mixed.panel_7;
if attachment < 0.06 then delete;
RUN;

Und hier das Batchskript, um die richtigen Ressourcen anzufordern und das SAS-Programm laufen zu lassen:


#!/bin/bash -login
#PBS -N parallelSAS
#PBS -M ich@meine.email.adresse
#PBS -m ae
#PBS -j oe
#PBS -l nodes=1:ppn=4
#PBS -l walltime=00:30:00
#PBS -l mem=5gb

# show which computer the job ran on
echo "Job ran on:" $(hostname)
# initialise the modules environment
source $MODULESHOME/init/bash
# load the relevant modules
module load sas
# change to work dir:
cd $PBS_O_WORKDIR
# the program to run
sas Test.sas

Leibniz Universität IT Services - URL: www.rrzn.uni-hannover.de/sas.html
 
Dr Paul Cochrane, Letzte Änderung: 28.07.2011
Copyright Gottfried Wilhelm Leibniz Universität Hannover