Suche


drucken PDF

Der Rescue Modus



Beschreibung


Bei OVH haben Sie jederzeit Zugriff auf den Rescue Pro Modus. Er erlaubt es, per SSH auf die Maschine zuzugreifen und auch die Hardware zu überprüfen.
Der Vorteil ist dass es nicht notwendig ist, den Kundendienst zu kontaktieren um einen Eingriff zu planen, denn mit dem Rescue können Sie selbst den Test durchführen, und zwar dann wenn es Ihnen passt und es am wenigsten die Nutzung des Servers stört.

Software & Administration

  • Einen fsck / e2fsck starten
  • Die Logs einsehen und analysieren
  • Probleme mit Software korrigieren
  • Den RAID wieder aufbauen / überprüfen
  • Daten sichern
Hardware

  • memtest: Den Arbeitsspeicher (RAM) überprüfen
  • cpuburn: Den Prozessor (CPU) überprüfen
  • fsck: Einen Check des Dateisystems durchführen
  • state: Einen Check der Festplatte durchführen
  • explorer: Ein Explorer für Ihre Dateien


Wenn einer der Tests scheitert oder Fehler findet, dann genügt es wenn Sie sich in Ihren Manager begeben, in der Rubrik "Kontaktieren Sie den Kundendienst" können Sie dann unter "Melden Sie eine Störung" ein Ticket dazu eröffnen.
Übermitteln Sie einfach das Ergebnis Ihres Tests, zum Beispiel: "Der Server hat sich beim CPU Burn aufgehängt".
Wir greifen dann umgehend ein um Ihre Hardware auszutauschen.

Achtung: Sie dürfen nicht das Webinterface und SSH gleichzeitig verwenden! Wenn Sie einen Check der Festplatten über das Webinterface starten und die Partitionen per SSH mounten dann kann dies zum Verlust Ihrer Daten führen!!


Den Rescue Modus aktivieren


Wählen Sie in Ihrem Manager v3 Ihren Server aus. und klicken Sie auf die Rubrik "Dienstleistungen" und dann "Netboot". Wählen Sie dort in dem Menü den Modus "Rescue Pro".

Führen Sie danach wenn möglich einen Soft Reboot Ihres Servers durch (per SSH: /sbin/reboot), verwenden Sie den Hard Reboot über den Manager nur wenn Sie keine andere Möglichkeit haben.
Sie erhalten dann eine E-Mail, die einen Link und das Passwort enthält mit denen Sie auf Ihren Server im Rescue Modus zugreifen können.

Es kann auch vorkommen, dass unsere Techniker bereits auf Ihrem Server eingegriffen haben. Wenn die Techniker keinen Hardwaredefekt auf dem Server feststellen können, dann starten diese Ihren Server im Rescue Modus, damit Sie die notwendigen Überprüfungen/Korrekturen vornehmen können, die notwendig sind, um den Server wieder in Produktion zu nehmen.


Hardware Check


Sobald Ihr Server in den Rescue Pro Modus versetzt wurde erhalten Sie eine E-Mail mit einem Link und einem Passwort, mit denen Sie sich mit den Hardware Tests verbinden können (ip.adresse.ihres.servers:81). Hier ein Überblick über das Interface:



Liste der Checks


  • Hard Drives: Erlaubt es Ihnen die installierten Festplatten zu sehen
  • Processors: Führt einen Check der CPU durch. Es kann hier möglich sein dass Sie keinen Bericht erhalten, aber der Server bootet neu oder hängt sich auf. Dies ist ein Anzeichen für ein Problem. Bitte kontaktieren Sie uns in diesem Fall sofort.
  • Partitions State: Überprüft die Festplatte
  • Partitions File System: Überprüft das Dateisystem. Oft wird eine Inkonsistenz des Filesystems mit einer defekten Festplatte verwechselt. In dem Fall genügt es meistens, das Betriebssystem neu zu installieren, damit wieder alles funktioniert. Dies ist vor allem der Fall wenn der Server Dateien im Verzeichnis lost+found einträgt.
  • Partitions Explore: Erlaubt es Ihnen die Dateien anzuzeigen. Diese können mit diesem Werkzeug nicht editiert werden, aber man kann sie zum Beispiel sichern. Vor allem Wichtig: man kann die Logs der Maschine lesen ohne unbedingt SSH verwenden zu müssen
  • Memory: Überprüft den Arbeitsspeicher (RAM) Ein Memtest benötigt sehr viel CPU-Leistung. Wenn also der Test hängenbleibt oder Ihre Maschine abstürzt kann es gut möglich sein, dass Ihre CPU schlecht gekühlt oder kaputt ist. Wenn das RAM defekt ist, dann erhalten Sie nach Anschluss des Tests einen Report, in dem die Fehler aufgeführt sind.
  • Network: Die Übertragungsgeschwindigkeit in folgenden Richtungen wird geprüft: (Ihr Server -> OVH Server), (OVH Server -> Ihr Server), (Ihr Server -> Ihr Internetanschluss), (Ihr Internetanschluss -> Ihr Server)

Es können nicht alle Probleme mit diesem Interface erkannt werden, wie zum Beispiel unregelmässige Reboots usw.
Zögern Sie nicht, den Test durchzuführen und anschliessend den technischen Kundendienst zu kontaktieren, der Ihnen helfen kann den Server zu analysieren.

Achtung:
Sie werden wahrscheinlich folgende Fehlermeldung bei etwa 64% Fortschritt des RAM-Tests erhalten:
Your server hasn't reacted for a least 20 seconds. it is probably down you can try to refresh the page if the server crashed while doing a cpu test. it is possible that the cpu is faulty.
Sie können auf "OK" klicken, dies geschieht meistens weil der Test der bei 64% durchgeführt wird sehr lange dauert.


Rescue mit SSH


Verbindung herstellen

Verbinden Sie sich wie gewohnt per SSH mit Ihrem Server. Die einzige Sache die sich ändert ist das Passwort. Es muss das temporäre Rootpasswort verwendet werden das Sie per E-Mail nach dem Wechsel in den Rescue Modus erhalten.
angie@amazone:~$ ssh root@213.186.xx.yy
The authenticity of host '213.186.xx.yy (213.186.xx.yy)' can't be established.
RSA key fingerprint is 02:11:f2:db:ad:42:86:de:f3:10:9a:fa:41:2d:09:77.
Are you sure you want to continue connecting (yes/no)? yes
Warning: Permanently added '213.186.xx.yy' (RSA) to the list of known hosts.
Password:
rescue:~#

Sie sind jetzt verbunden, können aber noch nicht auf Ihre Dateien zugreifen. Sie müssen zuerst das Dateisystem "mounten".

Festplatte mounten

Normalerweise ist die erste Partition Ihr Wurzelverzeichnis "/" und die zweite Partition entspricht dem Verzeichnis "/home". Die genaue Partitionierung
auf Ihrem Server können Sie auf der Konsole mit dem Befehl fdisk sehen.

Die Devices sind dann vom Typ:
  • /dev/sd für SCSI, SATA, Hardware RAID
  • /dev/hd für IDE Festplatten
  • /dev/md für Software RAID
  • /dev/rd/c0d0p für Mylex RAID

Sie können auch die devfs Bezeichnungen verwenden.
Wenn Sie nicht wissen was für eine Festplatte Sie haben und wie deren Partitionstabelle ist, dann verwenden Sie die Befehle fdisk oder sfdisk. Hier ein Beispiel für die Verwendung des Befehls und die zurückgegebene Antwort:

rescue:~# fdisk -l

Disk /dev/hda 40.0 GB, 40020664320 bytes
255 heads, 63 sectors/track, 4865 cylinders
Units = cylinders of 16065 * 512 = 8225280 bytes

Device Boot Start End Blocks Id System
/dev/hda1 * 1 1305 10482381 83 Linux
/dev/hda2 1306 4800 28073587+ 83 Linux
/dev/hda3 4801 4865 522112+ 82 Linux swap / Solaris

Disk /dev/sda 8254 MB, 8254390272 bytes
16 heads, 32 sectors/track, 31488 cylinders
Units = cylinders of 512 * 512 = 262144 bytes

Device Boot Start End Blocks Id System
/dev/sda1 1 31488 8060912 c W95 FAT32 (LBA)


Hier ist der Server mit 2 Devices ausgestattet.
Man sieht bei /dev/hda ein Sternchen (*) das zeigt dass es sich um eine bootbare Platte handelt. Als zweites sieht man eine USB Flash Disk.
Um das Wurzelverzeichnis / des Servers zu mounten genügt es folgendes auszuführen:
rescue:~# mount /dev/hda1 /mnt/

Normalerweise ist /home auf /dev/hda2. Wir mountenes nach / mit dem Befehl mount /dev/hda2 /mnt/home.
Das /home Verzeichnis ist nicht unbedingt auf /dev/hda2 und es kann auch sein dass Ihre Daten in /var liegen, bei Plesk zum Beispiel. Um bei der Konfiguration sicher zu sein können Sie / mounten und anschliessend cat /mnt/etc/fstab ausführen.
Diese Datei enthält die PArtitionen des Servers wenn dieser von seiner Festplatte bootet. Hier ein Beispiel:

rescue:# cat /mnt/etc/fstab
/dev/hda1 / ext3 errors=remount-ro 0 1
/dev/hda2 /var ext3 defaults,usrquota,grpquota 1 2
/dev/hda3 swap swap defaults 0 0
/dev/devpts /dev/pts devpts gid=5,mode=620 0 0
/dev/shm /dev/shm tmpfs defaults 0 0
/dev/proc /proc proc defaults 0 0
/dev/sys /sys sysfs defaults 0 0


In diesem Fall befindet sich /dev/hda2 also in /var und nicht in /home.
Mounten müssen Sie darum hier mit: mount /dev/hda2 /mnt/var .

RPS

Für die RPS die unter NFS betrieben werden genügt es, im Rescue Modus folgendes einzugeben: mount -a.
Das NFS wird sich dann ganz allein mounten (im Pfad /mnt).

Chroot

Man kann jetzt die Dateien editieren, indem man zum Beispiel den Pfad /mnt/var/.... verwendet oder /mnt/etc/lilo.conf. Aber um manche Dinge zu tun (z.B. Passwortänderung) muss man root auf dem System das auf der Festplatte installiert ist sein, was mit dem root des Rescue Modus nicht möglich ist.
Für diese Operationen muss man den Befehl chroot verwenden:

rescue:~# chroot /mnt/
rescue:/#


Man sieht dass nachdem ich gechrootet habe die eingabeaufforderung mich im / des Servers platziert.
Nun kann ich Befehle auf meinem System ausführen.

Beispiele

Einige Beispiele für die Möglichkeiten des Rescue Modus werden derzeit zusammengestellt.
Wir werden bald eine kleine Liste der Eingriffe, um die man uns oft bittet, zur Verfügung stellen.

Passwort eines Linux Servers im Rescue Modus ändern


Um das root-Passwort Ihres Servers zu ändern starten Sie Ihren Server im Rescue Modus. Nachdem Sie die Zugangsdaten erhalten haben (ca. 5-10 Minuten) können Sie sich einloggen und die Festplatte mounten:

mount /dev/*partition* /mnt

Mit *partition* ist die Partition gemeint, die im normalen Betrieb die Rootpartition "/" enthält (z.B. sda1 oder md1). Sie können mit dem Befehl "df" prüfen, welche Partition Ihr System verwendet.

Nach dem Mounten wechseln Sie mit folgendem Befehl in das System auf der Festplatte:

chroot /mnt

Ändern Sie anschließend das root-Passwort mit dem Befehl:

passwd

Geben Sie danach das neue Passwort zwei Mal ein.

Der Wechsel zurück ins normale System erfolgt wie oben beschrieben, nur dass beim Netboot-Modus dann wieder die Festplatte (HD) ausgewählt wird.

Rescue Modus verlassen


Nachdem wir die Änderungen vorgenommen haben müssen wir in den Manager zurückkehren, um im Menü mit den Bootoptionen unsere normale Bootmethode wieder einzustellen.
Wenn dies erfolgt ist führen wir einen Soft Reboot des Servers durch (den Hard Reboot im Manager sollten Sie nur verwenden, wenn ein Soft Reboot nicht möglich ist).

rescue:~# /sbin/reboot
Broadcast message from root (pts/0) (Tue Apr 12 15:56:17 2005):
The system is going down for reboot NOW!


Abschliessend


Wenn Sie einige grundlegende Regeln zur Administration berücksichtigen, wie in der Hilfe Nützliche Informationen zur Verwendung Ihres Servers beschrieben, dann können Sie jederzeit wieder die Kontrolle über Ihren Server zurückerlangen und so dessen Ausfallzeiten reduzieren.