Slurm Burst Buffer Guide
- Overview
- Configuration (for system administrators)
- Job Submission Commands
- Persistent Burst Buffer Creation and Deletion Directives
- Interactive Job Options
- Status Commands
- Advanced Reservations
- Job Dependencies
Overview
Slurm includes support for
burst buffers,
a shared high-speed storage resource.
Slurm provides support for allocating these resources, staging files in,
scheduling compute nodes for jobs using these resources, then staging files out.
Burst buffers can also be used as temporary storage during a job's lifetime,
without file staging.
Another typical use case is for persistent storage, not associated with any
specific job.
This support is provided using a plugin mechanism so that a various burst
buffer infrastructures may be easily configured.
One plugin is provided currently:
Slurmには、共有高速ストレージリソースであるバーストバッファのサポートが含まれています。Slurmは、これらのリソースの割り当て、ファイルのステージング、これらのリソースを使用するジョブの計算ノードのスケジュール、ファイルのステージングのサポートを提供します。バーストバッファーは、ファイルのステージングなしで、ジョブの存続期間中の一時的なストレージとしても使用できます。もう1つの一般的な使用例は、特定のジョブに関連付けられていない永続的なストレージです。このサポートは、さまざまなバーストバッファーインフラストラクチャを簡単に構成できるように、プラグインメカニズムを使用して提供されます。現在、1つのプラグインが提供されています。
- datawarp - Uses Cray APIs to perform underlying management functions
datawarp-Cray APIを使用して、基になる管理機能を実行します
Additional plugins may be provided in future releases of Slurm.
Slurmの将来のリリースでは、追加のプラグインが提供される可能性があります。
Slurm's mode of operation follows this general pattern:
Slurmの動作モードは、次の一般的なパターンに従います。
- Read configuration information and initial state information
構成情報と初期状態情報を読み取る - After expected start times for pending jobs are established, allocate
burst buffers to those jobs expected to start earliest and start stage-in
of required files
保留中のジョブの予想される開始時刻が確立されたら、バーストバッファを、最も早く開始され、必要なファイルのステージインを開始すると予想されるジョブに割り当てます。 - After stage-in has completed, jobs can be allocated compute nodes and begin
execution
ステージインが完了したら、ジョブに計算ノードを割り当てて実行を開始できます - After job has completed execution, begin file stage-out from burst buffer
ジョブの実行が完了したら、バーストバッファーからファイルのステージアウトを開始します - After file stage-out has completed, burst buffer can be released and the
job record purged
ファイルのステージアウトが完了した後、バーストバッファを解放し、ジョブレコードを削除できます。
Configuration (for system administrators)
Burst buffer support in Slurm is enabled by specifying the plugin(s) to
load for managing these resources using the BurstBufferType
configuration parameter in the slurm.conf file.
Multiple plugin names may be specified in a comma separated list.
Detailed logging of burst buffer specific actions may be generated for debugging
purposes by using the DebugFlags=BurstBuffer configuration parameter.
The BurstBuffer DebugFlags (like many other DebugFlags) can result in very
verbose logging and is only intended for diagnostic purposes rather than for
use in a production system.
slurm.confファイルのBurstBufferType構成パラメーターを使用してこれらのリソースを管理するためにロードするプラグインを指定することにより、Slurmのバーストバッファーサポートが有効になります。複数のプラグイン名をコンマ区切りのリストで指定できます。DebugFlags = BurstBuffer構成パラメーターを使用して、デバッグ目的でバーストバッファー固有のアクションの詳細なログを生成できます。BurstBuffer DebugFlags(他の多くのDebugFlagsと同様)は、非常に詳細なログを記録する可能性があり、運用システムでの使用ではなく、診断目的でのみ使用することを目的としています。
# Excerpt of example slurm.conf file BurstBufferType=burst_buffer/datawarp # DebugFlags=BurstBuffer # Commented out
Burst buffer specific options should be defined in a burst_buffer.conf
file.
This file can contain information about who can or can not use burst buffers,
timeouts, and paths of scripts used to perform various functions, etc.
TRES limits can be configured to establish
limits by association, QOS, etc.
The size of a job's burst buffer requirements can be used as a factor in
setting the job priority as described in the
multifactor priority document.
バーストバッファ固有のオプションは、burst_buffer.confファイルで定義する必要があります。このファイルには、バーストバッファー、タイムアウト、およびさまざまな機能の実行に使用されるスクリプトのパスなどを使用できるかどうかに関する情報を含めることができます。TRESの制限は、関連付け、QOSなどによって制限を設定するように構成できます。ジョブのバーストのサイズバッファ要件は、多要素優先度ドキュメントで説明されているように、ジョブ優先度を設定する際の要素として使用できます。
Note for Cray systems: The JSON-C library must be installed in order
to build Slurm's burst_buffer/datawarp plugin, which must parse JSON format data.
See Slurm's JSON installation information
for details.
Crayシステムに関する注意:JSON形式のデータを解析する必要があるSlurmのburst_buffer / datawarpプラグインをビルドするには、JSON-Cライブラリをインストールする必要があります。詳細については、SlurmのJSONインストール情報を参照してください。
Job Submission Commands
The normal mode of operation is for batch jobs to specify burst buffer
requirements within the batch script.
Batch script lines containing a prefix of "#BB" identify the job's burst buffer
space requirements, files to be staged in, files to be staged out, etc.
when using the burst_buffer/generic plugin.
The prefix of "#DW" (for "DataWarp") is used for burst buffer directives when
using the burst_buffer/datawarp plugin.
Please reference Cray documentation for details about the DataWarp options.
For DataWarp systems, the prefix of "#BB" can be used to create or delete
persistent burst buffer storage (NOTE: The "#BB" prefix is used since the
command is interpreted by Slurm and not by the Cray Datawarp software).
Interactive jobs (those submitted using the salloc and srun
commands) can specify their burst buffer space requirements using the "--bb"
or "--bbf" command line options, as described later in this document.
All of the "#SBATCH", "#DW" and "#BB" directives should be placed at the top
of the script (before any non-comment lines).
All of the persistent burst buffer creations and deletions happen before the
job's compute portion happens.
In a similar fashion, you can't stage files in/out at various points in the
script execution. All file stage-in happens prior to the job's compute portion
and all file stage-out happens after computation.
通常の操作モードは、バッチジョブがバッチスクリプト内でバーストバッファの要件を指定するためのものです。「#BB」のプレフィックスを含むバッチスクリプト行は、burst_buffer / genericプラグインを使用する場合の、ジョブのバーストバッファースペース要件、ステージインされるファイル、ステージアウトされるファイルなどを識別します。「#DW」の接頭辞(「DataWarp」の)は、burst_buffer / datawarpプラグインを使用するときにバーストバッファディレクティブに使用されます。DataWarpオプションの詳細については、Crayのドキュメントを参照してください。DataWarpシステムの場合、「#BB」のプレフィックスを使用して永続的なバーストバッファーストレージを作成または削除できます(注:コマンドはCray DatawarpソフトウェアではなくSlurmによって解釈されるため、「#BB」プレフィックスが使用されます)。このドキュメントで後述するように、対話型ジョブ(sallocコマンドとsrunコマンドを使用して送信されるジョブ)は、「-bb」または「--bbf」コマンドラインオプションを使用してバーストバッファースペース要件を指定できます。"#SBATCH"、 "#DW"、および "#BB"ディレクティブはすべて、スクリプトの最上部(コメント行以外の行の前)に配置する必要があります。永続的なバーストバッファーの作成と削除はすべて、ジョブの計算部分が発生する前に発生します。同様に、スクリプト実行のさまざまな時点でファイルをステージング/ステージングすることはできません。すべてのファイルステージインはジョブの計算部分の前に行われ、すべてのファイルステージアウトは計算後に行われます。"#SBATCH"、 "#DW"、および "#BB"ディレクティブはすべて、スクリプトの最上部(コメント行以外の行の前)に配置する必要があります。永続的なバーストバッファーの作成と削除はすべて、ジョブの計算部分が発生する前に発生します。同様に、スクリプト実行のさまざまな時点でファイルをステージング/ステージングすることはできません。すべてのファイルステージインはジョブの計算部分の前に行われ、すべてのファイルステージアウトは計算後に行われます。"#SBATCH"、 "#DW"、および "#BB"ディレクティブはすべて、スクリプトの最上部(コメント行以外の行の前)に配置する必要があります。永続的なバーストバッファーの作成と削除はすべて、ジョブの計算部分が発生する前に発生します。同様に、スクリプト実行のさまざまな時点でファイルをステージング/ステージングすることはできません。すべてのファイルステージインはジョブの計算部分の前に行われ、すべてのファイルステージアウトは計算後に行われます。
The salloc and srun commands can create and use job-specific burst buffers.
For both commands, the "--bb" or "--bbf" option is used to specify the job's
burst buffer requirements.
Note the burst buffer may not be accessible from a login node, but require
that salloc spawn a shell on one of its allocated compute nodes. See the
description of SallocDefaultCommand in the slurm.conf man page for more
information about how to spawn a remote shell.
sallocコマンドとsrunコマンドは、ジョブ固有のバーストバッファーを作成して使用できます。どちらのコマンドでも、「-bb」または「--bbf」オプションを使用して、ジョブのバーストバッファー要件を指定します。バーストバッファーはログインノードからアクセスできない場合がありますが、sallocが割り当てられた計算ノードの1つにシェルを生成する必要があることに注意してください。リモートシェルを生成する方法の詳細については、slurm.confのmanページにあるSallocDefaultCommandの説明を参照してください。
A basic validation is performed on the job's burst buffer options at job
submit time.
If the options are invalid, the job will be rejected and an error message will
be returned directly to the user.
Note that unrecognized options may be ignored in order to support backward
compatibility (i.e. a job submission would not fail in the case of an option
being specified that is recognized by some versions of Slurm, but not recognized
by other versions).
If the job is accepted, but later fails (e.g. some problem staging files), the
job will be held and its "Reason" field will be set to error message provided
by the underlying infrastructure.
基本的な検証は、ジョブの送信時にジョブのバーストバッファーオプションに対して実行されます。オプションが無効な場合、ジョブは拒否され、エラーメッセージが直接ユーザーに返されます。下位互換性をサポートするために、認識されないオプションは無視される場合があることに注意してください(つまり、Slurmの一部のバージョンでは認識されるが他のバージョンでは認識されないオプションが指定された場合、ジョブの送信は失敗しません)。ジョブが受け入れられたが後で失敗した場合(いくつかの問題のあるステージングファイルなど)、ジョブは保留され、その「理由」フィールドは、基盤となるインフラストラクチャによって提供されるエラーメッセージに設定されます。
Users may also request to be notified by email upon completion of burst
buffer stage out using the "--mail-type=stage_out" or "--mail-type=all" option.
The subject line of the email will be of this form:
ユーザーは、「-mail-type = stage_out」または「--mail-type = all」オプションを使用して、バーストバッファーのステージアウトが完了したときに電子メールで通知されるように要求することもできます。メールの件名は次の形式になります。
SLURM Job_id=12 Name=my_app Staged Out, StageOut time 00:05:07
Persistent Burst Buffer Creation and Deletion Directives
These options are used for both the burst_buffer/datawarp and
burst_buffer/generic plugins to create and delete persistent burst
buffers, which have a lifetime independent of the job.
これらのオプションは、burst_buffer / datawarpとburst_buffer / genericプラグインの両方で使用され、永続的なバーストバッファーを作成および削除します。永続的なバーストバッファーは、ジョブに依存しない存続期間を持っています。
- #BB create_persistent name=<name> capacity=<number> [access=<access>] [pool=<pool> [type=<type>]
- #BB destroy_persistent name=<name> [hurry]
The persistent burst buffer name may not start with a numeric value (numeric
names are reserved for job-specific burst buffers).
The capacity (size) specification can include a suffix of "N" (nodes),
"K|KiB", "M|MiB", "G|GiB", "T|TiB", "P|PiB" (for powers of 1024) and "KB",
"MB", "GB", "TB", "PB" (for powers of 1000). NOTE: Usually Slurm interprets
KB, MB, GB, TB, PB, TB units as powers of 1024, but for Burst Buffers size
specifications Slurm supports both IEC/SI formats. This is because the CRAY API
supports both formats.
The access parameter identifies the buffer access mode. Supported access
modes for the burst_buffer/datawarp plugin include: striped, private, and ldbalance.
The pool parameter identifies the resource pool from which the burst buffer
should be created. The default and available pools are configuration dependent.
The type parameter identifies the buffer type. Supported type
modes for the burst_buffer/datawarp plugin include: cache and scratch.
Multiple persistent burst buffers may be created or deleted within a single
job.
A sample batch script follows:
永続的なバーストバッファ名は、数値で始めることはできません(数値名は、ジョブ固有のバーストバッファ用に予約されています)。容量(サイズ)の仕様には、「N」(ノード)、「K | KiB」、「M | MiB」、「G | GiB」、「T | TiB」、「P | PiB」(パワー用)のサフィックスを含めることができますの1024)と「KB」、「MB」、「GB」、「TB」、「PB」(1000の累乗の場合)。注:通常、SlurmはKB、MB、GB、TB、PB、TBの単位を1024の累乗として解釈しますが、バーストバッファーのサイズ仕様では、Slurmは両方のIEC / SIフォーマットをサポートしています。これは、CRAY APIが両方の形式をサポートしているためです。アクセスパラメータは、バッファアクセスモードを識別します。burst_buffer / datawarpプラグインでサポートされるアクセスモードには、striped、private、およびldbalanceがあります。poolパラメータは、バーストバッファを作成するリソースプールを識別します。デフォルトおよび使用可能なプールは構成に依存します。typeパラメータは、バッファタイプを識別します。burst_buffer / datawarpプラグインでサポートされているタイプモードには、キャッシュとスクラッチがあります。単一のジョブ内で複数の永続的なバーストバッファーを作成または削除できます。サンプルのバッチスクリプトは次のとおりです。
#!/bin/bash #BB create_persistent name=alpha capacity=32GB access=striped type=scratch #DW jobdw type=scratch capacity=1GB access_mode=striped #DW stage_in type=file source=/home/alan/data.in destination=$DW_JOB_STRIPED/data #DW stage_out type=file destination=/home/alan/data.out source=$DW_JOB_STRIPED/data /home/alan/a.out
Persistent burst buffers can be created and deleted by a job requiring no
compute resources. Submit a job with the desired burst buffer directives and
specify a node count of zero (e.g. "sbatch -N0 setup_buffers.bash").
Attempts to submit a zero size job without burst buffer directives or with
job-specific burst buffer directives will generate an error.
Note that zero size jobs are not supported for job arrays or heterogeneous
job allocations.
永続的なバーストバッファーは、計算リソースを必要としないジョブによって作成および削除できます。目的のバーストバッファーディレクティブを使用してジョブを送信し、ノード数をゼロに指定します(例: "sbatch -N0 setup_buffers.bash")。バーストバッファーディレクティブを使用せずに、またはジョブ固有のバーストバッファーディレクティブを使用して、サイズがゼロのジョブを送信しようとすると、エラーが発生します。サイズがゼロのジョブは、ジョブ配列または異種ジョブの割り当てではサポートされないことに注意してください。
NOTE: The ability to create and destroy persistent burst buffers may be
limited by the "Flags" option in the burst_buffer.conf file.
See the burst_buffer.conf man page for more information.
By default only privileged users
(i.e. Slurm operators and administrators)
can create or destroy persistent burst buffers.
注:永続的なバーストバッファーを作成および破棄する機能は、burst_buffer.confファイルの "Flags"オプションによって制限される場合があります。詳細については、burst_buffer.confのmanページを参照してください。デフォルトでは、特権ユーザー(つまり、Slurmオペレーターと管理者)のみが永続バーストバッファーを作成または破棄できます。
Interactive Job Options
Interactive jobs may include directives for creating job-specific burst
buffers as well as file staging.
These options may be specified using either the "--bb" or "--bbf" option of
the salloc or srun command.
Note that support for creation and destruction of persistent burst buffers using
the "--bb" option is not provided.
The "--bbf" option take as an argument a filename and that file should contain
a collection of burst buffer operations identical to that used for batch jobs.
This file may contain file staging directives.
Alternately the "--bb" option may be used to specify burst buffer directives
as the option argument. The format of those directives can either be identica l
to those used in a batch script OR a very limited set of directives can be used,
which are translated to the equivalent script for later processing.
Multiple directives should be space separated.
対話型ジョブには、ジョブ固有のバーストバッファーを作成するためのディレクティブやファイルステージングが含まれる場合があります。これらのオプションは、sallocまたはsrunコマンドの「--bb」または「--bbf」オプションを使用して指定できます。「--bb」オプションを使用した永続バーストバッファーの作成と破棄のサポートは提供されていないことに注意してください。「--bbf」オプションはファイル名を引数として取り、そのファイルにはバッチジョブで使用されるものと同じバーストバッファ操作のコレクションが含まれている必要があります。このファイルには、ファイルステージングディレクティブが含まれている場合があります。または、「-bb」オプションを使用して、オプション引数としてバーストバッファディレクティブを指定できます。これらのディレクティブの形式は、バッチスクリプトで使用されるものと同じにすることも、非常に限られたセットのディレクティブを使用することもできます。これらは、後で処理するために同等のスクリプトに変換されます。複数のディレクティブはスペースで区切る必要があります。
- access=<access>
- capacity=<number>
- swap=<number>
- type=<type>
- pool=<name>
If a swap option is specified, the job must also specify the required
node count.
The capacity (size) specification can include a suffix of "N" (nodes),
"K|KiB", "M|MiB", "G|GiB", "T|TiB", "P|PiB" (for powers of 1024) and "KB",
"MB", "GB", "TB", "PB" (for powers of 1000). NOTE: Usually Slurm interprets
KB, MB, GB, TB, PB, TB units as powers of 1024, but for Burst Buffers size
specifications Slurm supports both IEC/SI formats. This is because the CRAY API
supports both formats.
A sample command line follows and we also show the equivalent burst buffer
script generated by the options:
スワップオプションが指定されている場合、ジョブは必要なノード数も指定する必要があります。容量(サイズ)の仕様には、「N」(ノード)、「K | KiB」、「M | MiB」、「G | GiB」、「T | TiB」、「P | PiB」(パワー用)のサフィックスを含めることができますの1024)と「KB」、「MB」、「GB」、「TB」、「PB」(1000の累乗の場合)。注:通常、SlurmはKB、MB、GB、TB、PB、TBの単位を1024の累乗として解釈しますが、バーストバッファーのサイズ仕様では、Slurmは両方のIEC / SIフォーマットをサポートしています。これは、CRAY APIが両方の形式をサポートしているためです。コマンドラインの例を次に示します。オプションで生成された同等のバーストバッファスクリプトも示します。
# Sample execute line: srun --bb="capacity=1G access=striped type=scratch" a.out # Equivalent script as generated by Slurm's burst_buffer/datawarp plugin #DW jobdw capacity=1GiB access_mode=striped type=scratch
Symbol Replacement
Slurm supports a number of symbols that can be used to automatically
fill in certain job details, e.g., to make stage_in or stage_out directory
paths vary with each job submission.
Slurmは、特定のジョブの詳細を自動的に入力するために使用できるいくつかの記号をサポートしています。たとえば、stage_inまたはstage_outのディレクトリパスをジョブの送信ごとに変えることができます。
Supported symbols include:
%% | % |
%A | Array Master Job Id |
%a | Array Task Id |
%d | Workdir |
%j | Job Id |
%u | User Name |
%x | Job Name |
\\ | Stop further processing of the line |
Status Commands
Slurm's current burst buffer state information is available using the
scontrol show burst command or by using the sview command's
Burst Buffer tab. A sample scontrol output is shown below. The scontrol
"-v" option may be used for a more verbose output format.
Slurmの現在のバーストバッファー状態情報は、scontrol show burstコマンドを使用するか、sviewコマンドのBurst Bufferタブを使用して利用できます。scontrolの出力例を以下に示します。scontrol "-v"オプションは、より詳細な出力形式に使用できます。
$ scontrol show burst Name=generic DefaultPool=ssd Granularity=100G TotalSpace=50T UsedSpace=42T StageInTimeout=30 StageOutTimeout=30 Flags=EnablePersistent,PrivateData AllowUsers=alan,brenda CreateBuffer=/usr/local/slurm/17.11/sbin/CB DestroyBuffer=/usr/local/slurm/17.11/sbin/DB GetSysState=/usr/local/slurm/17.11/sbin/GSS StartStageIn=/usr/local/slurm/17.11/sbin/SSI StartStageIn=/usr/local/slurm/17.11/sbin/SSO StopStageIn=/usr/local/slurm/17.11/sbin/PSI StopStageIn=/usr/local/slurm/17.11/sbin/PSO Allocated Buffers: JobID=18 CreateTime=2017-08-19T16:46:05 Pool=dwcache Size=10T State=allocated UserID=alan(1000) JobID=20 CreateTime=2017-08-19T16:46:45 Pool=dwcache Size=10T State=allocated UserID=alan(1000) Name=DB1 CreateTime=2017-08-19T16:46:45 Pool=dwcache Size=22T State=allocated UserID=brenda(1001) Per User Buffer Use: UserID=alan(1000) Used=20T UserID=brenda(1001) Used=22T
Access to the Cray burst buffer status tool, dwstat, is available from
the scontrol command using the "scontrol show bbstat ..." or
"scontrol show dwstat ..." command. Options following "bbstat" or "dwstat" on
the scontrol execute line are passed directly to the dwstat command as shown
below. See
Cray DataWarp documentation
for details about dwstat options and output.
Crayバーストバッファステータスツールdwstatへのアクセスは、scontrolコマンドから「scontrol show bbstat ...」または「scontrol show dwstat ...」コマンドを使用して実行できます。scontrol実行行で「bbstat」または「dwstat」に続くオプションは、以下に示すようにdwstatコマンドに直接渡されます。dwstatオプションと出力の詳細については、Cray DataWarpのドキュメントを参照してください。
/opt/cray/dws/default/bin/dwstat $ scontrol show dwstat pool units quantity free gran' wlm_pool bytes 7.28TiB 7.28TiB 1GiB' $ scontrol show dwstat sessions sess state token creator owner created expiration nodes 832 CA--- 783000000 tester 12345 2015-09-08T16:20:36 never 20 833 CA--- 784100000 tester 12345 2015-09-08T16:21:36 never 1 903 D---- 1875700000 tester 12345 2015-09-08T17:26:05 never 0 $ scontrol show dwstat configurations conf state inst type access_type activs 715 CA--- 753 scratch stripe 1 716 CA--- 754 scratch stripe 1 759 D--T- 807 scratch stripe 0 760 CA--- 808 scratch stripe 1
Advanced Reservations
Burst buffer resources can be placed in an advanced reservation using the
BurstBuffer option.
The argument consists of four elements:
バーストバッファリソースは、BurstBufferオプションを使用して事前予約に配置できます。引数は4つの要素で構成されます。
[plugin:][pool:]#[units]
plugin is the burst buffer plugin name, currently either "datawarp" or
"generic".
If no plugin is specified, the reservation applies to all configured burst
buffer plugins.
pluginは、バーストバッファプラグインの名前で、現在は「datawarp」または「generic」です。プラグインが指定されていない場合、予約は構成されているすべてのバーストバッファープラグインに適用されます。
pool specifies a Cray generic burst buffer resource pool.
If "type" is not specified, the number is a measure of storage space.
poolは、Cray汎用バーストバッファーリソースプールを指定します。「タイプ」が指定されていない場合、数値はストレージスペースの測定値です。
units may be "N" (nodes), "K|KiB", "M|MiB", "G|GiB", "T|TiB", "P|PiB"
(for powers of 1024) and "KB", "MB", "GB", "TB", "PB" (for powers of 1000). The
default units are bytes for reservations of storage space.
NOTE: Usually Slurm interprets KB, MB, GB, TB, PB, TB units as powers of 1024,
but for Burst Buffers size specifications Slurm supports both IEC/SI formats.
This is because the Cray DataWarp API supports both formats.
単位は「N」(ノード)、「K | KiB」、「M | MiB」、「G | GiB」、「T | TiB」、「P | PiB」(1024の累乗の場合)、「KB」、 "MB"、 "GB"、 "TB"、 "PB"(1000の累乗の場合)。デフォルトの単位は、ストレージスペースの予約のバイトです。注:通常、SlurmはKB、MB、GB、TB、PB、TBの単位を1024の累乗として解釈しますが、バーストバッファーのサイズ仕様では、Slurmは両方のIEC / SIフォーマットをサポートしています。これは、Cray DataWarp APIが両方の形式をサポートしているためです。
Jobs using this reservation are not restricted to these burst buffer resources,
but may use these reserved resources plus any which are generally available.
Some examples follow.
この予約を使用するジョブは、これらのバーストバッファーリソースに制限されていませんが、これらの予約済みリソースに加えて、一般的に利用可能なリソースを使用できます。次にいくつかの例を示します。
$ scontrol create reservation starttime=now duration=60 \ users=alan flags=any_nodes \ burstbuffer=datawarp:100G,generic:20G $ scontrol create reservation StartTime=noon duration=60 \ users=brenda NodeCnt=8 \ BurstBuffer=datawarp:20G $ scontrol create reservation StartTime=16:00 duration=60 \ users=joseph flags=any_nodes \ BurstBuffer=datawarp:pool_test:4G
Job Dependencies
If two jobs use burst buffers and one is dependent on the other (e.g.
"sbatch --dependency=afterok:123 ...") then the second job will not begin until
the first job completes and its burst buffer stage out completes.
If the second job does not use a burst buffer, but is dependent upon the first
job's completion, then it will not wait for the stage out operation of the first
job to complete.
The second job can be made to wait for the first job's stage out operation to
complete using the "afterburstbuffer" dependency option (e.g.
"sbatch --dependency=afterburstbuffer:123 ...").
2つのジョブがバーストバッファーを使用し、一方が他方に依存している場合(例: "sbatch --dependency = afterok:123 ...")、2番目のジョブは、最初のジョブが完了し、そのバーストバッファーステージが完了するまで開始されません。2番目のジョブがバーストバッファーを使用せず、最初のジョブの完了に依存している場合、最初のジョブのステージアウト操作が完了するまで待機しません。2番目のジョブは、「afterburstbuffer」依存オプション(「sbatch --dependency = afterburstbuffer:123 ...」など)を使用して、最初のジョブのステージアウト操作が完了するのを待機させることができます。
Last modified 31 March 2020