Download Slurm
Slurm source can be downloaded from
https://www.schedmd.com/downloads.php.
Slurmソースはhttps://www.schedmd.com/downloads.phpからダウンロードできます。
Slurm has also been packaged for
Debian and
Ubuntu
(named slurm-wlm or slurm-llnl depending upon the version),
Fedora, and
NetBSD (in pkgsrc) and
FreeBSD.
Slurmは、DebianおよびUbuntu(バージョンに応じてslurm-wlmまたはslurm-llnlという名前)、Fedora、およびNetBSD(pkgsrc内)、およびFreeBSD用にもパッケージ化されています。
Download Related Software
- Authentication plugins identifies the user originating
a message.
認証プラグインは、メッセージを発信したユーザーを識別します。 - MUNGE (recommended)
In order to compile the "auth/munge" authentication plugin for Slurm, you will need to build and install MUNGE, available from https://dun.github.io/munge/ and Debian and Fedora and Ubuntu.
Slurm用の「auth / munge」認証プラグインをコンパイルするには、https://dun.github.io/munge/、Debian、Fedora、Ubuntuから入手できるMUNGEをビルドしてインストールする必要があります。 - Authentication tools for users that work with Slurm.
Slurmを使用するユーザー用の認証ツール。 - AUKS
AUKS is an utility designed to ease Kerberos V credential support addition to non-interactive applications, like batch systems (Slurm, LSF, Torque, etc.). It includes a plugin for the Slurm workload manager. AUKS is not used as an authentication plugin by the Slurm code itself, but provides a mechanism for the application to manage Kerberos V credentials.
AUKSは、バッチシステム(Slurm、LSF、Torqueなど)などの非対話型アプリケーションへのKerberos V資格情報サポートの追加を容易にするために設計されたユーティリティです。Slurmワークロードマネージャーのプラグインが含まれています。AUKSはSlurmコード自体では認証プラグインとして使用されませんが、アプリケーションがKerberos V資格情報を管理するためのメカニズムを提供します。 - Databases can be used to store accounting information.
See our Accounting web page for more information.
データベースは、アカウンティング情報を格納するために使用できます。詳細については、会計のWebページを参照してください。
- Debuggers and debugging tools
デバッガーとデバッグツール - TotalView
is a GUI-based source code debugger well suited for parallel applications.
TotalViewは、並列アプリケーションに最適なGUIベースのソースコードデバッガーです。 - Padb
is a job inspection tool for examining and debugging parallel programs, primarily it simplifies the process of gathering stack traces but also supports a wide range of other functions.
It's an open source, non-interactive, command line, scriptable tool intended for use by programmers and system administrators alike.
Padbは、並列プログラムを検査およびデバッグするためのジョブ検査ツールです。主にスタックトレースを収集するプロセスを簡略化しますが、他のさまざまな機能もサポートします。これは、プログラマーとシステム管理者の両方が使用することを目的とした、オープンソースの非対話型のコマンドラインスクリプト可能なツールです。 - DRMAA (Distributed Resource Management Application API)
DRMAA(分散リソース管理アプリケーションAPI)
PSNC DRMAA for Slurm is an implementation of Open Grid Forum DRMAA 1.0 (Distributed Resource Management Application API) specification for submission and control of jobs toSlurm. Using DRMAA, grid applications builders, portal developers and ISVs can use the same high-level API to link their software with different cluster/resource management systems.
PSNC DRMAA for Slurmは、ジョブをSlurmに送信および制御するためのOpen Grid Forum DRMAA 1.0(分散リソース管理アプリケーションAPI)仕様の実装です。DRMAAを使用すると、グリッドアプリケーションビルダー、ポータル開発者、ISVは同じ高レベルAPIを使用して、ソフトウェアを異なるクラスター/リソース管理システムにリンクできます。
There is a variant of PSNC DRMAA providing support for Slurm's --cluster option available from https://github.com/natefoo/slurm-drmaa.
PSNC DRMAAのバリアントがあり、https://github.com/natefoo/slurm-drmaaから入手可能なSlurmの--clusterオプションをサポートしています。
Perl 6 DRMAA bindings are available from https://github.com/scovit/Scheduler-DRMAA.
Perl 6 DRMAAバインディングは、https://github.com/scovit/Scheduler-DRMAAから入手できます。
- Hostlist
A Python program used for manipulation of Slurm hostlists including functions such as intersection and difference. Download the code from:
交差や差分などの関数を含むSlurmホストリストの操作に使用されるPythonプログラム。以下からコードをダウンロードします。
http://www.nsc.liu.se/~kent/python-hostlist
Lua bindings for hostlist functions are also available here:
ホストリスト関数のLuaバインディングもここで利用できます。
https://github.com/grondo/lua-hostlist
NOTE: The Lua hostlist functions do not support the bracketed numeric ranges anywhere except at the end of the name (i.e. "tux[0001-0100]" and "rack[0-3]_blade[0-63]" are not supported).
注:Luaホストリスト関数は、名前の末尾を除いて、括弧で囲まれた数値範囲をサポートしていません(つまり、「tux [0001-0100]」と「rack [0-3] _blade [0-63]」はサポートされていません)。 。 - Interactive Script
インタラクティブスクリプト
A wrapper script that makes it very simple to get an interactive shell on a cluster. Download the code from:
クラスター上でインタラクティブなシェルを取得することを非常に簡単にするラッパースクリプト。以下からコードをダウンロードします。
https://github.com/alanorth/hpc_infrastructure_scripts/blob/master/slurm/interactive - Interconnect plugins (Switch plugin)
相互接続プラグイン(スイッチプラグイン) - Infiniband
インフィニバンド
The topology.conf file for an Infiniband switch can be automatically generated using the slurmibtopology tool found here:
Infinibandスイッチのtopology.confファイルは、次のslurmibtopologyツールを使用して自動的に生成できます。
https://ftp.fysik.dtu.dk/Slurm/slurmibtopology.sh. - I/O Watchdog
I / Oウォッチドッグ
A facility for monitoring user applications, most notably parallel jobs, for hangs which typically have a side-effect of ceasing all write activity. This facility attempts to monitor all write activity of an application and trigger a set of user-defined actions when write activity as ceased for a configurable period of time. A SPANK plugin is provided for use with Slurm. See the README and man page in the package for more details.
通常はすべての書き込みアクティビティが停止するという副作用があるハングのために、ユーザーアプリケーション、特に並列ジョブを監視するための機能。この機能は、アプリケーションのすべての書き込みアクティビティを監視し、構成可能な期間に書き込みアクティビティが停止したときに一連のユーザー定義アクションをトリガーしようとします。Slurmで使用するためのSPANKプラグインが提供されています。詳細については、パッケージのREADMEおよびmanページを参照してください。
https://github.com/grondo/io-watchdog - MPI versions supported
サポートされているMPIバージョン - Workload Simulator
ワークロードシミュレーター
A Slurm simulator is available to assess various scheduling policies using historic workload data. Under simulation, jobs are not actually executed. Instead, a job execution trace from a real system, or a synthetic trace, are used.
Slurmシミュレーターは、履歴ワークロードデータを使用してさまざまなスケジューリングポリシーを評価するために利用できます。シミュレーションでは、ジョブは実際には実行されません。代わりに、実際のシステムからのジョブ実行トレースまたは合成トレースが使用されます。
NOTE: This sofware is currently not maintained.
注:このソフトウェアは現在維持されていません。 - PAM Module (pam_slurm)
PAMモジュール(pam_slurm)
Pluggable Authentication Module (PAM) for restricting access to compute nodes where Slurm performs workload management. Access to the node is restricted to user root and users who have been allocated resources on that node. NOTE: pam_slurm is included within the Slurm distribution. For earlier Slurm versions, pam_slurm is available for download here.
Slurmがワークロード管理を実行する計算ノードへのアクセスを制限するためのプラグ可能な認証モジュール(PAM)。ノードへのアクセスは、ユーザーrootおよびそのノードでリソースが割り当てられているユーザーに制限されています。注:pam_slurmはSlurmディストリビューションに含まれています。以前のSlurmバージョンの場合、pam_slurmはここからダウンロードできます。
Slurm's PAM module has also been packaged for Debian and Ubuntu (both named libpam-slurm).
SlurmのPAMモジュールもDebianとUbuntu(どちらもlibpam-slurmという名前)用にパッケージ化されています。 - Command wrappers
コマンドラッパー
There is a wrapper for Maui/Moab's showq command here.
ここにはMaui / Moabのshowqコマンドのラッパーがあります。
- Job Script Generator
ジョブスクリプトジェネレーター
Brigham Young University has developed a Javascript tool to generate batch job scripts for Slurm which is available here.
ブリガムヤング大学は、Slurmのバッチジョブスクリプトを生成するJavascriptツールを開発しました。
- Scripting interfaces
スクリプトインターフェイス
- A Perl interface is included in the Slurm distribution in the
contribs/perlapi directory and packaged in the perapi RPM.
Perlインターフェイスは、contribs / perlapiディレクトリのSlurmディストリビューションに含まれており、perapi RPMにパッケージ化されています。 - PySlurm is a
Python/Pyrex module to interface with Slurm.
There is also a Python module to expand and collect hostlist expressions
available
here.
PySlurmは、SlurmとのインターフェースとなるPython / Pyrexモジュールです。ここで利用可能なホストリスト式を拡張して収集するPythonモジュールもあります。 - Lua may be used to implement a
Slurm process tracking plugin.
The Lua script available in contribs/lua/protrack.lua
implements containers using CPUSETs.
Luaは、Slurmプロセス追跡プラグインを実装するために使用できます。contribs / lua / protrack.luaにあるLuaスクリプトは、CPUSETを使用してコンテナーを実装します。
- A Perl interface is included in the Slurm distribution in the
contribs/perlapi directory and packaged in the perapi RPM.
- SPANK Plugins
SPANKプラグイン
SPANK provides a very generic interface for stackable plug-ins which may be used to dynamically modify the job launch code in Slurm. SPANK plugins may be built without access to Slurm source code. They need only be compiled against Slurm‘s spank.h header file, added to the SPANK config file plugstack.conf, and they will be loaded at runtime during the next job launch. Thus, the SPANK infrastructure provides administrators and other developers a low cost, low effort ability to dynamically modify the runtime behavior of Slurm job launch. As assortment of SPANK plugins are available from
SPANKは、Slurmのジョブ起動コードを動的に変更するために使用できるスタック可能なプラグイン用の非常に一般的なインターフェイスを提供します。SPANKプラグインは、Slurmソースコードにアクセスせずにビルドできます。これらは、Slurmのspank.hヘッダーファイルに対してコンパイルして、SPANK構成ファイルplugstack.confに追加するだけでよく、次回のジョブの起動時に実行時にロードされます。したがって、SPANKインフラストラクチャは、管理者やその他の開発者に、Slurmジョブ起動のランタイム動作を動的に変更するための低コスト、低労力の機能を提供します。SPANKプラグインの品揃えは、
https://github.com/grondo/slurm-spank-plugins.
A SPANK plugin called "spunnel" to support ssh port forwarding is available from Harvard University. It can be downloaded from the spunnel repository.
sshポート転送をサポートする「spunnel」と呼ばれるSPANKプラグインは、ハーバード大学から入手できます。これは、spunnelリポジトリからダウンロードできます。 - Sqlog
A set of scripts that leverages Slurm's job completion logging facility in provide information about what jobs were running at any point in the past as well as what resources they used. Download the code from:
Slurmのジョブ完了ロギング機能を利用する一連のスクリプトは、過去の任意の時点で実行されていたジョブと、それらが使用したリソースに関する情報を提供します。以下からコードをダウンロードします。
https://github.com/grondo/sqlog - Task Affinity plugins
タスクアフィニティプラグイン - Node Health Check
ノードヘルスチェック
Probably the most comprehensive and lightweight health check tool out there is LBNL Node Health Check. It has integration with Slurm as well as Torque resource managers.
おそらく、最も包括的で軽量なヘルスチェックツールは、LBNLノードヘルスチェックです。SlurmおよびTorqueリソースマネージャと統合されています。 - Accounting Tools
会計ツール
- UBMoD is a web based tool for displaying accounting data from various
resource managers. It aggregates the accounting data from sacct into a MySQL
data warehouse and provide a front end web interface for browsing the data.
For more information, see the
UDMod home page and
source code.
UBMoDは、さまざまなリソースマネージャーからのアカウンティングデータを表示するためのWebベースのツールです。アカウンティングデータをsacctからMySQLデータウェアハウスに集約し、データを閲覧するためのフロントエンドWebインターフェイスを提供します。詳細については、UDModのホームページとソースコードを参照してください。 - XDMoD (XD Metrics on Demand)
is an NSF-funded open source tool designed to audit and facilitate the utilization
of the XSEDE cyberinfrastructure by providing a wide range of metrics on XSEDE
resources, including resource utilization, resource performance, and impact on
scholarship and research.
XDMoD(XD Metrics on Demand)は、リソースの使用状況、リソースのパフォーマンス、奨学金や研究への影響など、XSEDEリソースに関する幅広いメトリックを提供することにより、XSEDEサイバーインフラストラクチャの利用を監査および促進するために設計されたNSF資金のオープンソースツールです。 。
- UBMoD is a web based tool for displaying accounting data from various
resource managers. It aggregates the accounting data from sacct into a MySQL
data warehouse and provide a front end web interface for browsing the data.
For more information, see the
UDMod home page and
source code.
- STUBL (Slurm Tools and UBiLities)
STUBL(SlurmツールとUBiLities)
STUBL is a collection of supplemental tools and utility scripts for Slurm.
STUBLはSlurmの補足ツールとユーティリティスクリプトのコレクションです。
STUBL home page.
- pbs2sbatch
- Converts PBS directives to equivalent Slurm sbatch directives. Accommodates
old UB CCR-specific PBS tags like IB1, IB2, etc.
PBSディレクティブを同等のSlurm sbatchディレクティブに変換します。IB1、IB2などのような古いUB CCR固有のPBSタグに対応 - pbs2slurm
- A script that attempts to convert PBS scripts into corresponding sbatch
scripts. It will convert PBS directives as well as PBS environment variables
and will insert bash code to create a SLURM_NODEFILE that is consistent with
the PBS_NODEFILE.
PBSスクリプトを対応するsbatchスクリプトに変換しようとするスクリプト。PBSディレクティブとPBS環境変数を変換し、bashコードを挿入して、PBS_NODEFILEと一致するSLURM_NODEFILEを作成します。 - slurmbf
- Analogous to the PBS "showbf -S" command.
PBSの「showbf -S」コマンドに似ています。 - snodes
- A customized version of sinfo. Displays node information in an
easy-to-interpet format. Filters can be applied to view (1) specific nodes,
(2) nodes in a specific partition, or (3) nodes in a specifc state.
カスタマイズされたバージョンのsinfo。ノード情報をわかりやすい形式で表示します。フィルターは、(1)特定のノード、(2)特定のパーティションのノード、または(3)特定の状態のノードの表示に適用できます。 - sqstat
- A customized version of squeue that produces output analogous to the PBS
qstat and xqstat commands (requires clush).
PBS qstatおよびxqstatコマンドに類似した出力を生成する、カスタマイズされたバージョンのsqueue(clushが必要)。 - fisbatch
- Friendly Interactive sbatch. A customized version of sbatch that provides a
user-friendly interface to an interactive job with X11 forwarding enabled.
It is analogous to the PBS "qsub -I -X" command. This code was adopted from
srun.x11 (requires clush).
フレンドリーなインタラクティブバッチ。カスタマイズされたバージョンのsbatchは、X11転送を有効にした対話型ジョブへのユーザーフレンドリーなインターフェースを提供します。これは、PBSの「qsub -I -X」コマンドに似ています。このコードはsrun.x11から採用されました(フラッシュが必要です)。 - sranks
- A command that lists the overall priorities and associated priority
components of queued jobs in ascending order. Top-ranked jobs will be given
priority by the scheduler but lower ranked jobs may get slotted in first if
they fit into the scheduler's backfill window.
キューに入れられたジョブの全体的な優先順位および関連する優先順位コンポーネントを昇順でリストするコマンド。上位ランクのジョブはスケジューラによって優先されますが、下位ランクのジョブは、スケジューラのバックフィルウィンドウに収まる場合、最初にスロットに入れられる可能性があります。 - sqelp
- A customized version of squeue that only prints a double-quote if the
information in a column is the same from row to row. Some users find this
type of formatting easier to visually digest.
列の情報が行ごとに同じである場合にのみ二重引用符を出力する、カスタマイズされたバージョンのsqueue。一部のユーザーは、このタイプのフォーマットを視覚的に消化しやすいと感じています。 - sjeff
- Determines the efficiency of one or more running jobs. Inefficient jobs are
high-lighted in red text (requires clush).
1つ以上の実行中のジョブの効率を決定します。非効率的なジョブは赤いテキストで強調表示されます(フラッシュが必要です)。 - sueff
- Determines the overall efficiency of the running jobs of one or more users.
Users that are inefficient are highlighted in red text (requires clush).
1人以上のユーザーの実行中のジョブの全体的な効率を決定します。効率の悪いユーザーは、赤いテキストで強調表示されます(フラッシュが必要です)。 - yasqr
- Yet Another Squeue Replacement. Fixes squeue bugs in earlier versions of
Slurm.
さらに別のSqueueの交換。Slurmの以前のバージョンのsqueueバグを修正しました。 - sgetscr
- Retrieves the Slurm/sbatch script and environment files for a job that is
queued or running.
キューに入れられているか実行中のジョブのSlurm / sbatchスクリプトと環境ファイルを取得します。 - snacct
- Retrieves Slurm accounting information for a given node and for a given
period of time.
特定のノードおよび特定の期間のSlurmアカウンティング情報を取得します。 - suacct
- Retrieves Slurm accounting information for a given user's jobs for a given
period of time.
特定の期間の特定のユーザーのジョブのSlurmアカウンティング情報を取得します。 - slist
- Retrieves Slurm accounting and node information for a running or completed
job (requires clush).
実行中または完了したジョブのSlurmアカウンティングおよびノード情報を取得します(フラッシュが必要です)。 - slogs
- Retrieves resource usage and accounting information for a user or list of
users. For each job that was run after the given start date, the following
information is gathered from the Slurm accounting logs: Number of CPUs,
Start Time, Elapsed Time, Amount of RAM Requested, Average RAM Used, and
Max RAM Used.
ユーザーまたはユーザーのリストのリソース使用状況とアカウンティング情報を取得します。特定の開始日以降に実行された各ジョブについて、Slurmアカウンティングログから次の情報が収集されます:CPU数、開始時間、経過時間、要求されたRAMの量、平均RAM使用量、最大RAM使用量。
- pestat
Prints a consolidated compute node status line, with one line per node including a list of jobs.
統合された計算ノードのステータス行を出力します。ノードごとに1行で、ジョブのリストが含まれます。
Home page - Slurmmon
Slurmmon is a system for gathering and plotting data about Slurm scheduling and job characteristics. It currently simply sends the data to ganglia, but it includes some custom reports and a web page for an organized summary. It collects all the data from sdiag as well as total counts of running and pending jobs in the system and the maximum such values for any single user. It can also submit probe jobs to various partitions in order to trend the times spent pending in them, which is often a good bellwether of scheduling problems.
Slurmmonは、Slurmのスケジューリングとジョブの特性に関するデータを収集してプロットするためのシステムです。現在はデータを神経節に送信するだけですが、いくつかのカスタムレポートと、まとめられた要約のWebページが含まれています。これは、sdiagからすべてのデータを収集するだけでなく、システムで実行中および保留中のジョブの総数、および単一ユーザーのそのような最大値を収集します。また、さまざまなパーティションにプローブジョブを送信して、保留に費やされた時間を傾向分析することもできます。これは、多くの場合、スケジューリングの問題の前兆です。
Slurmmon code - Graphical Sdiag
The sdiag utility is a diagnostic tool that maintains statistics on Slurm's scheduling performance. You can run sdiag periodically or as you modify Slurm's configuration. However if you want a historical view of these statistics, you could save them in a time-series database and graph them over time as performed with this tool:
sdiagユーティリティは、Slurmのスケジューリングパフォーマンスに関する統計を維持する診断ツールです。sdiagは定期的に実行することも、Slurmの構成を変更するときに実行することもできます。ただし、これらの統計の履歴ビューが必要な場合は、これらを時系列データベースに保存し、このツールで実行されるように時間をかけてグラフ化できます。
- MSlurm
Such a superstructure for the management of multiple Slurm environments is done with MSlurm. Thereby several Slurm clusters - even across multiple Slurm databases - can run parallel on a Slurm master and can be administered in an easy and elegantly manner.
複数のSlurm環境を管理するためのこのような上部構造は、MSlurmで実行されます。これにより、複数のSlurmクラスターが(複数のSlurmデータベースにまたがる場合でも)Slurmマスター上で並列に実行でき、簡単かつエレガントな方法で管理できます。
- JSON
Some Slurm plugins (burst_buffer/datawarp and power/cray_aries) plugins parse JSON format data. These plugins are designed to make use of the JSON-C library for this purpose. Instructions for the build are as follows:
一部のSlurmプラグイン(burst_buffer / datawarpおよびpower / cray_aries)プラグインは、JSON形式のデータを解析します。これらのプラグインは、この目的でJSON-Cライブラリを使用するように設計されています。ビルドの手順は次のとおりです。
- Download json-c version 0.12 (or higher) from
json-cバージョン0.12(またはそれ以上)を以下からダウンロードします。
https://github.com/json-c/json-c/wiki - Unpackage json-c
gunzip json-c-0.12.tar.gz
tar -xf json-c-0.12.tar - Built and install json-c
json-cをビルドしてインストールする
- If you have current build tools
現在のビルドツールがある場合
cd json-c-0.12
export CFLAGS=-Wno-error=unused-but-set-variable
./configure --prefix=DESIRED_PATH
make
make install - If you have old build tools
古いビルドツールがある場合
cd json-c-0.12
mv aclocal.m4 aclocal.m4.orig
mv ltmain.sh ltmain.sh.orig
./autogen.sh
export CFLAGS=-Wno-error=unused-but-set-variable
./configure --prefix=DESIRED_JSON_PATH
make
make install
- If you have current build tools
- Build and install Slurm
Slurmをビルドしてインストールする
./configure --with-json=DESIRED_JSON_PATH ...
make -j
- Download json-c version 0.12 (or higher) from
- Slurm-web
Slurm-web is a free software, distributed under the GPL version 2 license, that provides both a HTTP REST API (based on JSON format) and a web GUI with dashboards and graphical views of the current state of your Slurm-based HPC supercomputers. The website of Slurm-web, with screenshots:
Slurm-webは、GPLバージョン2ライセンスに基づいて配布される無料のソフトウェアで、HTTP REST API(JSON形式に基づく)と、SlurmベースのHPCスーパーコンピューターの現在の状態のダッシュボードとグラフィカルビューを備えたWeb GUIの両方を提供します。スクリーンショット付きのSlurm-webのウェブサイト:
http://edf-hpc.github.io/slurm-web
Last modified 15 July 2019