scancel
Section: Slurm Commands (1)Updated: Slurm Commands
Index
NAME
scancel - Used to signal jobs or job steps that are under the control of Slurm.scancel-Slurmの制御下にあるジョブまたはジョブステップを通知するために使用されます。
SYNOPSIS
scancel [OPTIONS...] [job_id[_array_id][.step_id]] [job_id[_array_id][.step_id]...]DESCRIPTION
scancel is used to signal or cancel jobs, job arrays or job steps.scancelは、ジョブ、ジョブ配列、またはジョブステップを通知またはキャンセルするために使用されます。
An arbitrary number of jobs or job steps may be signaled using job specification filters or a space separated list of specific job and/or job step IDs.
任意の数のジョブまたはジョブステップは、ジョブ仕様フィルターまたはスペースで区切られた特定のジョブおよび/またはジョブステップIDのリストを使用して通知されます。
If the job ID of a job array is specified with an array ID value then only that job array element will be cancelled.
ジョブ配列のジョブIDが配列ID値で指定されている場合、そのジョブ配列要素のみがキャンセルされます。
If the job ID of a job array is specified without an array ID value then all job array elements will be cancelled.
ジョブ配列のジョブIDが配列ID値なしで指定されている場合、すべてのジョブ配列要素がキャンセルされます。
While a heterogeneous job is in pending state, only the entire job can be cancelled rather than its individual components.
異機種混合ジョブが保留状態の場合、キャンセルできるのは、個々のコンポーネントではなく、ジョブ全体のみです。
A request to cancel an individual component of a heterogeneous job not in pending state will return an error.
保留状態ではない異種ジョブの個々のコンポーネントをキャンセルするリクエストは、エラーを返します。
After the job has begun execution, the individual component can be cancelled.
ジョブが実行を開始した後、個々のコンポーネントをキャンセルできます。
A job or job step can only be signaled by the owner of that job or user root.
ジョブまたはジョブステップは、そのジョブの所有者またはユーザーrootによってのみ通知されます。
If an attempt is made by an unauthorized user to signal a job or job step, an error message will be printed and the job will not be signaled.
権限のないユーザーがジョブまたはジョブステップを通知しようとすると、エラーメッセージが出力され、ジョブは通知されません。
OPTIONS
- -A, --account=account
-
Restrict the scancel operation to jobs under this charge account.
scancel操作をこの請求アカウントのジョブに制限します。
- -b, --batch
-
By default, signals other than SIGKILL are not sent to the batch step (the shell
script). With this option scancel signals only the batch step, but not
any other steps.
デフォルトでは、SIGKILL以外の信号はバッチステップ(シェルスクリプト)に送信されません。このオプションを使用すると、scancelはバッチステップのみを通知し、他のステップは通知しません。
This is useful when the shell script has to trap the signal and take some application defined action.
これは、シェルスクリプトがシグナルをトラップし、アプリケーション定義のアクションを実行する必要がある場合に役立ちます。
Note that most shells cannot handle signals while a command is running (child process of the batch step), the shell use to wait wait until the command ends to then handle the signal. Children of the batch step are not signaled with this option, use -f, --full instead.
ほとんどのシェルは、コマンドの実行中(バッチステップの子プロセス)に信号を処理できないことに注意してください。シェルは、コマンドが終了するまで待機してから信号を処理します。バッチステップの子は、このオプションでは通知されません。代わりに-f、-fullを使用してください。
NOTE: If used with -f, --full, this option ignored.
注:-f、-fullと併用すると、このオプションは無視されます。
NOTE: This option is not applicable if step_id is specified.
注記:step_idが指定されている場合、このオプションは適用されません。
NOTE: The shell itself may exit upon receipt of many signals.
注:多くのシグナルを受信すると、シェル自体が終了する場合があります。
You may avoid this by explicitly trap signals within the shell script (e.g. "trap <arg> <signals>"). See the shell documentation for details.
シェルスクリプト内でシグナルを明示的にトラップすることでこれを回避できます(例: "trap ")。詳細については、シェルのドキュメントを参照してください。
- --ctld
-
Send the job signal request to the slurmctld daemon rather than directly to the
slurmd daemons.
ジョブ信号要求を直接slurmdデーモンに送信するのではなく、slurmctldデーモンに送信します。
This increases overhead, but offers better fault tolerance.
これによりオーバーヘッドが増加しますが、耐障害性が向上します。
This is the default behavior on architectures using front end nodes (e.g. Cray ALPS computers) or when the --clusters option is used.
これは、フロントエンドノード(Cray ALPSコンピューターなど)を使用するアーキテクチャーのデフォルトの動作、または--clustersオプションが使用されている場合のデフォルトの動作です。
- -f, --full
-
By default, signals other than SIGKILL are not sent to the batch step (the shell
script).
デフォルトでは、SIGKILL以外の信号はバッチステップ(シェルスクリプト)に送信されません。
With this option scancel signals also the batch script and its children processes.
このオプションを使用すると、scancelはバッチスクリプトとその子プロセスも通知します。
Most shells cannot handle signals while a command is running (child process of the batch step), the shell use to wait until the command ends to then handle the signal.
ほとんどのシェルは、コマンド(バッチステップの子プロセス)の実行中はシグナルを処理できません。シェルは、コマンドが終了するまで待機してからシグナルを処理します。
Unlike -b, --batch, children of the batch step are also signaled with this option.
-b、-batchとは異なり、バッチステップの子もこのオプションで通知されます。
NOTE: srun steps are also children of the batch step, so steps are also signaled with this option.
注:実行ステップはバッチステップの子でもあるため、ステップもこのオプションで通知されます。
- --help
-
Print a help message describing all scancel options.
すべてのscancelオプションを説明するヘルプメッセージを印刷します。
- -H, --hurry
-
Do not stage out any burst buffer data.
バーストバッファデータをステージアウトしないでください。
- -i, --interactive
-
Interactive mode. Confirm each job_id.step_id before performing the cancel operation.
対話モード。キャンセル操作を実行する前に、各job_id.step_idを確認してください。
- -M, --clusters=<string>
-
Clusters to issue commands to.
コマンドを発行するクラスター。
Note that the SlurmDBD must be up for this option to work properly.
このオプションが正しく機能するには、SlurmDBDが稼働している必要があります。
- -n, --jobname=job_name, --name=job_name
-
Restrict the scancel operation to jobs with this job name.
scancel操作をこのジョブ名のジョブに制限します。
- -p, --partition=partition_name
-
Restrict the scancel operation to jobs in this partition.
scancel操作をこのパーティションのジョブに制限します。
- -q, --qos=qos
-
Restrict the scancel operation to jobs with this quality of service.
scancel操作をこのサービス品質のジョブに制限します。
- -Q, --quiet
-
Do not report an error if the specified job is already completed.
指定したジョブがすでに完了している場合は、エラーを報告しません。
This option is incompatible with the --verbose option.
このオプションは--verboseオプションと互換性がありません。
- -R, --reservation=reservation_name
-
Restrict the scancel operation to jobs with this reservation name.
scancel操作をこの予約名のジョブに制限します。
- --sibling=cluster_name
-
Remove an active sibling job from a federated job.
連携ジョブからアクティブな兄弟ジョブを削除します。
- -s, --signal=signal_name
-
The name or number of the signal to send.
送信するシグナルの名前または番号。
If this option is not used the specified job or step will be terminated.
このオプションを使用しない場合、指定したジョブまたはステップは終了します。
Note. If this option is used the signal is sent directly to the slurmd where the job is running bypassing the slurmctld thus the job state will not change even if the signal is delivered to it.
注意。このオプションを使用すると、slurmctldをバイパスしてジョブが実行されているslurmdに信号が直接送信されるため、信号が配信されてもジョブの状態は変化しません。
Use the scontrol command if you want the job state change be known to slurmctld.
ジョブの状態変化をslurmctldに認識させる場合は、scontrolコマンドを使用します。
- -t, --state=job_state_name
-
Restrict the scancel operation to jobs in this
state.
scancel操作をこの状態のジョブに制限します。
job_state_name may have a value of either "PENDING", "RUNNING" or "SUSPENDED".
job_state_nameの値は、「PENDING」、「RUNNING」、または「SUSPENDED」のいずれかです。
- -u, --user=user_name
-
Restrict the scancel operation to jobs owned by this user.
scancel操作をこのユーザーが所有するジョブに制限します。
- --usage
-
Print a brief help message listing the scancel options.
scancelオプションを一覧表示する簡単なヘルプメッセージを印刷します。
- -v, --verbose
-
Print additional logging. Multiple v's increase logging detail.
追加のログを出力します。複数のvはログの詳細を増やします。
This option is incompatible with the --quiet option.
このオプションは--quietオプションと互換性がありません。
- -V, --version
-
Print the version number of the scancel command.
scancelコマンドのバージョン番号を出力します。
- -w, --nodelist=host1,host2,...
-
Cancel any jobs using any of the given hosts.
指定されたホストのいずれかを使用しているジョブをキャンセルします。
The list may be specified as a comma-separated list of hosts, a range of hosts (host[1-5,7,...] for example), or a filename.
リストは、ホストのコンマ区切りリスト、ホストの範囲(たとえば、host [1-5,7、...])、またはファイル名として指定できます。
The host list will be assumed to be a filename only if it contains a "/" character.
ホストリストは、「/」文字が含まれている場合にのみファイル名と見なされます。
- --wckey=wckey
-
Restrict the scancel operation to jobs using this workload
characterization key.
このワークロード特性キーを使用して、scancel操作をジョブに制限します。
- ARGUMENTS
-
- job_id
-
The Slurm job ID to be signaled.
通知されるSlurmジョブID。
- step_id
-
The step ID of the job step to be signaled.
通知されるジョブステップのステップID。
If not specified, the operation is performed at the level of a job.
指定しない場合、操作はジョブのレベルで実行されます。
If neither --batch nor --signal are used,
--batchも--signalも使用されていない場合、
the entire job will be terminated.
ジョブ全体が終了します。
When --batch is used, the batch shell processes will be signaled.
--batchを使用すると、バッチシェルプロセスが通知されます。
The child processes of the shell will not be signaled by Slurm, but the shell may forward the signal.
シェルの子プロセスはSlurmによってシグナルされませんが、シェルはシグナルを転送できます。
When --batch is not used but --signal is used, then all job steps will be signaled, but the batch script itself will not be signaled.
--batchを使用せずに--signalを使用すると、すべてのジョブステップは通知されますが、バッチスクリプト自体は通知されません。
PERFORMANCE
Executing scancel sends a remote procedure call to slurmctld.
scancelを実行すると、リモートプロシージャコールがslurmctldに送信されます。
If
enough calls from scancel or other Slurm client commands that send remote
procedure calls to the slurmctld daemon come in at once, it can result in
a degradation of performance of the slurmctld daemon, possibly resulting
in a denial of service.
リモートプロシージャコールをslurmctldデーモンに送信するscancelまたは他のSlurmクライアントコマンドからの十分な呼び出しが一度に着信すると、slurmctldデーモンのパフォーマンスが低下し、サービス拒否が発生する可能性があります。
Do not run scancel or other Slurm client commands that send remote
procedure calls to slurmctld from loops in shell scripts or other
programs.
シェルスクリプトまたは他のプログラムのループからslurmctldにリモートプロシージャコールを送信するscancelまたは他のSlurmクライアントコマンドを実行しないでください。
Ensure that programs limit calls to scancel to the minimum
necessary for the information you are trying to gather.
プログラムがscancelへの呼び出しを、収集しようとしている情報に必要な最小限に制限していることを確認してください。
ENVIRONMENT VARIABLES
Some scancel options may be set via environment variables.
一部のscancelオプションは、環境変数を介して設定できます。
These
environment variables, along with their corresponding options, are listed below.
これらの環境変数と対応するオプションを以下に示します。
(Note: commandline options will always override these settings)
(注:コマンドラインオプションは常にこれらの設定を上書きします)
- SCANCEL_ACCOUNT
- -A, --account=account
- SCANCEL_BATCH
- -b, --batch
- SCANCEL_CTLD
- --ctld
- SCANCEL_FULL
- -f, --full
- SCANCEL_HURRY
- -H, --hurry
- SCANCEL_INTERACTIVE
- -i, --interactive
- SCANCEL_NAME
- -n, --name=job_name
- SCANCEL_PARTITION
- -p, --partition=partition_name
- SCANCEL_QOS
- -q, --qos=qos
- SCANCEL_STATE
- -t, --state=job_state_name
- SCANCEL_USER
- -u, --user=user_name
- SCANCEL_VERBOSE
- -v, --verbose
- SCANCEL_WCKEY
- --wckey=wckey
- SLURM_CONF
-
The location of the Slurm configuration file.
Slurm構成ファイルの場所。
NOTES
If multiple filters are supplied (e.g. --partition and --name)
only the jobs satisfying all of the filtering options will be signaled.
複数のフィルターが指定されている場合(例--partitionと--name)、すべてのフィルターオプションを満たすジョブのみが通知されます。
Cancelling a job step will not result in the job being terminated.
ジョブステップをキャンセルしても、ジョブは終了しません。
The job must be cancelled to release a resource allocation.
リソース割り当てを解放するには、ジョブをキャンセルする必要があります。
To cancel a job, invoke scancel without --signal option.
ジョブをキャンセルするには、-signalオプションなしでscancelを呼び出します。
This
will send first a SIGCONT to all steps to eventually wake them up followed by
a SIGTERM, then wait the KillWait duration defined in the slurm.conf file
and finally if they have not terminated send a SIGKILL.
これにより、最初にすべてのステップにSIGCONTが送信され、最終的にそれらがウェイクアップされてからSIGTERMが送信されます。次に、slurm.confファイルで定義されたKillWait期間待機し、最後に終了していない場合はSIGKILLを送信します。
This gives
time for the running job/step(s) to clean up.
これは、実行中のジョブ/ステップがクリーンアップする時間を与えます。
If a signal value of "KILL" is sent to an entire job, this will cancel
the active job steps but not cancel the job itself.
「KILL」のシグナル値がジョブ全体に送信されると、アクティブなジョブステップはキャンセルされますが、ジョブ自体はキャンセルされません。
On Cray systems, all signals except
SIGCHLD, SIGCONT, SIGSTOP, SIGTSTP, SIGTTIN, SIGTTOU, SIGURG, or SIGWINCH
cause the ALPS reservation to be released.
Crayシステムでは、SIGCHLD、SIGCONT、SIGSTOP、SIGTSTP、SIGTTIN、SIGTTOU、SIGURG、またはSIGWINCHを除くすべてのシグナルにより、ALPS予約が解放されます。
The job however will not be terminated except in the case of SIGKILL and
may then be used for post processing.
ただし、SIGKILLの場合を除いてジョブは終了せず、後処理に使用できます。
AUTHORIZATION
When using SlurmDBD, users who have an AdminLevel defined (Operator
or Admin) and users who are account coordinators are given the
authority to invoke scancel on other users jobs.
SlurmDBDを使用する場合、AdminLevelが定義されているユーザー(オペレーターまたは管理者)およびアカウントコーディネーターであるユーザーには、他のユーザーのジョブでスキャンセルを呼び出す権限が与えられます。
EXAMPLES
- Send SIGTERM to steps 1 and 3 of job 1234:
ジョブ1234のステップ1と3にSIGTERMを送信します。 -
scancel --signal=TERM 1234.1 1234.3
- Cancel job 1234 along with all of its steps:
ジョブ1234とそのすべての手順をキャンセルします。 -
scancel 1234
- Send SIGKILL to all steps of job 1235, but do not cancel the job itself:
ジョブ1235のすべてのステップにSIGKILLを送信しますが、ジョブ自体はキャンセルしません。 -
scancel --signal=KILL 1235
- Send SIGUSR1 to the batch shell processes of job 1236:
ジョブ1236のバッチシェルプロセスにSIGUSR1を送信します。 -
scancel --signal=USR1 --batch 1236
- Cancel job all pending jobs belonging to user "bob" in partition "debug":
パーティション「デバッグ」のユーザー「ボブ」に属するすべての保留中のジョブをキャンセルします。 -
scancel --state=PENDING --user=bob --partition=debug
- Cancel only array ID 4 of job array 1237
ジョブアレイ1237のアレイID 4のみをキャンセルします -
scancel 1237_4
COPYING
Copyright (C) 2002-2007 The Regents of the University of California. Produced at Lawrence Livermore National Laboratory (cf, DISCLAIMER).Copyright (C) 2008-2011 Lawrence Livermore National Security.
Copyright (C) 2010-2015 SchedMD LLC.
This file is part of Slurm, a resource management program. For details, see <https://slurm.schedmd.com/>.
Slurm is free software; you can redistribute it and/or modify it under the terms of the GNU General Public License as published by the Free Software Foundation; either version 2 of the License, or (at your option) any later version.
Slurm is distributed in the hope that it will be useful, but WITHOUT ANY WARRANTY; without even the implied warranty of MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE. See the GNU General Public License for more details.
SEE ALSO
slurm_kill_job (3), slurm_kill_job_step (3)
Index
- NAME
- SYNOPSIS
- DESCRIPTION
- OPTIONS
- PERFORMANCE
- ENVIRONMENT VARIABLES
- NOTES
- AUTHORIZATION
- EXAMPLES
- COPYING
- SEE ALSO
This document was created by man2html using the manual pages.
Time: 20:44:46 GMT, May 21, 2020