[EasyLinux-Suse] Benachrichtigung von Smartd und Systemdiensten in SUSE war: Samba

Jan-Uwe Kögel klappstulle at directbox.com
So Jan 22 18:14:57 CET 2017


> Ich bin zwar alt aber lernfähig und nehme erstmal alles zurück. Dann
> helfen Sladko nur die smartmontools. Mit smartctl testen ob sie
> installiert sind und notfalls die tools installieren. Mit Hilfe von
> Kofler kann er die datei /etc/smartd.conf nach seinen Wünschen
> einstellen (die mit den tools installierte Datei ist sehr
> ausführlich)und smartd in Yast aktivieren.  

Das ist die Theorie. Die Praxis mit SUSE sieht so aus, dass bei einer
SUSE 42.2 der Daemon von SMART, zwar lt. Yast ->
Diensteverwaltung zumindest, läuft. Er hinterlässt aber keinerlei Spuren
in den Systemlogs bzw. im Journal. Auch dann nicht, wenn zu Testzwecken
bewusst eine defekte Festplatte gewählt wird. Und selbst wenn der
Smartd so arbeiten würde wie er soll, es kämen keine Warnmail bei ROOT
(bzw. einem in der /etc/aliases dafür definierten User) an. Denn
wie ich an anderer Stelle vor einigen Tagen gelesen habe stellt Postfix
solche Systemmail schlicht und ergreifend nicht zu. Fehler in seiner
Grundkonfiguration, wenn ich das richtig verstanden habe.

Was sollte man denn nun erwarten? Und worum geht es mir eigentlich?
Schon wenn ich die Platte aus Sladkos 1. Rechner per einem IDE auf
SATA-Adapter in meinen Rechner hänge schrillen alle nur möglichen
Alarmglocken. Der Smart-Notifier (kennt SUSE offenbar nicht) meldet
sofort per Pop Up Probleme mit der für ihn neu erkannten Festplatte.
Wenige Sekunden danach liegt im Systempostfach eine E-Mail vom Smartd,
die mir mitteilt, dass diese Platte 

Device: /dev/sdc [SAT], 921 Currently unreadable (pending) sectors
			996 Offline uncorrectable sectors	

aufweisen tut. Diese Mail kommt im Anschluss alle 24 Stunden erneut. In
der zu jeder vollen Stunde+2 Minuten verteilten Mail mit der
Zusammenfassung wichtiger Logereignisse steht diese Smartwarnung ganz,
ganz oben. Logcheck, verantwortlich dafür, gibt es bei SUSE auch nicht.
Und Logwatch, welches in SUSE offenbar ähnliche Aufgaben erfüllen
sollte, läuft nicht als Daemon, sondern als Cronjob. Liefert beim
Versuch diesen zu starten aber ein Fehlermeldung.

Alles was ich bei mir dafür vor ungefähr 2,5 Jahren machen musste war?
Logcheck und die Smartmontools installieren. Und dann wenige Sekunden
mit einem Editor arbeiten, um die Anweisung, den Smartdaemon beim
Booten zu starten, fest zu schreiben. Dann ein Befehl und seit dem
läuft es. Ausnahme: nach der Umstellung auf Systemd war ein erneuter
Start mit der Befehlskette von Systemd erforderlich. Darüber wurde ich
allerdings von apt-listchange gleich 2x informiert. 1x musste ich die
Kenntnisnahme direkt beim Update durch drücken von Q (= quit)
bestätigen, und 2. kam das per System-E-Mail ins Postfach.

Ich kannte das auch alles nicht bis zum vorzeitigen Ende meiner SUSE
11.3-Installation, obwohl ich seit Mitte der 80'er sehr viel
mit UNIX und UNIX-artigen Betriebssystem zu tun hatte. Nach einem
Systemcrash, mit ähnlichen Ursachen und Ablauf wie bei Sladko, habe ich
das was ich hier versuche weiter zu geben erklärt und gezeigt bekommen.
Heute will ich auf diese Form der vorbeugenden Systemüberwachung und
Benachrichtigung nie mehr verzichten. Besonders nicht auf den beiden
Rechner, die von immer noch zum mehr oder weniger arbeiten benutzt
werden.

> Nur ist SMART nicht sehr zuverlässig.

Zu der Ausgabe von SMART vielleicht eine Anmerkung: SMART steht für
Self-Monitoring, Analysis and Reporting Technology. Ich kenne heute nur
noch einen einzigen Typ von Festplatten der diese Technik nicht
unterstützt bzw. auf Grund der technischen Gegebenheiten die Ausgabe
der ermittelten Werte unterdrückt. Das sind billigste USB-Festplatten,
wie sie manchmal u. a. von Aldi oder Lidl verschleudert wurden. Western
Digital Elements fällt mir dafür ein. Hier liegt es wohl daran, dass
diese Platten, bzw. deren Gehäuse, offenbar keinen richtigen Controller
mehr haben. Da gibt es nur noch einen einfach Chip, direkt in der
Festplatte selbst.

Die Interpretation der von der Festplatte an die Smartmontools
übergebenen Werte ist natürlich eine Sache für sich. Es gibt da
praktisch keine einheitlichen Standards.
Eins ist aber allen gemeinsam. Derart ausgeweitete Fehler, wie sie auf
der Festplatte von Sladko (WD Caviar Blue 500 GB) nicht erst seit dem
plötzlichen vergessen der deutschen Lokalisierung auftraten, wären mit
Sicherheit immer und auch rechtzeitig angezeigt worden.

> Besser wärs deshalb, wenn er sein BIOS dazu bringen kann,
> dass es beim Booten den Plattenfehler meldet.

Da muss das BIOS auch eine derartige Technik aktiv unterstützen. Und
ich kenne nur wenige, die das können, bzw. in denen sich das aktivieren
lässt. 
Im konkreten Fall wäre eine wie auch immer geartet Benachrichtigung vom
System auf jeden Fall wertvoll gewesen. Der Verlust von Daten hielt
sich noch in Grenzen.
Anders bei Bernhard Müller, wo sich die Platte (auch eine Western
Digital) offenbar überhaupt nicht mehr ansprechen lässt. Hier werden
vermutlich nun erhebliche Kosten anfallen, denn ein paar Dinge drauf
sind nicht so ohne weiteres zu ersetzen, bedürfen also eines
professionellen Datenretters.

-- 
Jan-Uwe Kögel
-------------- nächster Teil --------------
Ein Dateianhang mit Binärdaten wurde abgetrennt...
Dateiname   : nicht verfügbar
Dateityp    : application/pgp-signature
Dateigröße  : 488 bytes
Beschreibung: nicht verfügbar
URL         : <http://www.easylinux.de/pipermail/suse/attachments/20170122/06a9b463/attachment.pgp>


Mehr Informationen über die Mailingliste Suse