Ein Ort zum sammeln von Dingen rund um den HPC-Cluster.. Ansible scripte, Notizen, Dokumentation, ...
Go to file
Fabian Goebel 82f14a7c89 add Switch config and latest firmware 2020-01-13 22:32:07 +01:00
.idea removed files 2020-01-12 16:00:25 +01:00
ansible-ctdo added psmisc 2020-01-12 18:15:19 +01:00
dhcp added ipmi 2020-01-12 17:34:22 +01:00
network add Switch config and latest firmware 2020-01-13 22:32:07 +01:00
smart-data not necessary in this context 2020-01-11 16:27:23 +01:00
README.md added readme 2020-01-12 18:15:57 +01:00

README.md

HPC-Cluster

ADD general Info for Cluster here

Smart-data

Enthält die Smart-Daten für die Festplatten in den Storage Servern, kann aber auch noch um weitere Daten erweitert werden. Die Daten können mit dem Skript blastor.sh, welches automatisch auf das einstecken neuer Platten reagiert, automatisch generiert und abgelegt werden.

Die Daten können anschließend mit dem Skript smartGUI.py durchsucht werden. Dafür muss "python3" und "python-support" installiert sein. Möglich ist sowohl eine Suche nach konkreten Seriennummern, als auch nach Mehreren Festplatten, die eine bestimmte Eigenschaft erfüllen.

network

master server enp0s8 is WAN with DHCP-Client, it forwards traffic from LAN to WAN and does currently no NAT.

nodes network (LAN) (10.10.0.0/23) is on enp0s9

Nodes are configured from 10.10.0.100 and above

dhcp range is 10.10.0.20-10.10.0.80

useful commands

for i in `seq 136 142`; do echo $i; ssh root@10.10.0.$i reboot; done
for i in `seq 100 142`; do echo $i; ssh root@10.10.0.$i "sh -c 'nohup stress -c 8 > /dev/null 2>&1 &'"; done
for i in `seq 100 105`; do echo $i; ssh root@10.10.0.$i "sh -c 'nohup killall stress > /dev/null 2>&1 &'"; done
for i in `seq 100 143`; do echo $i; ssh root@10.10.0.$i "sh -c 'nohup poweroff > /dev/null 2>&1 &'"; done

ansible-playbook  -i inventory site.yml --limit "node42" --tags "hostname,telegraf" -K --ask-pass