Karl Rothenhöfer, Leonberg


Home

Linux-Arbeitskreis

Linux-Schulung

Heim-/Referenznetz

Datensicherung

Problem-Lösungen

Impressum

Probleme und Lösungen

Bei Arbeiten im Bereich von Computer- und Netz-Administration stößt man gelegentlich auf Probleme, für deren Lösung eine Internet-Recherche empfehlenswert erscheint. Zuweilen findet man dann zwar gleich mehrfach andere Leidensgefährten mit gleichen Problemen, jedoch keine hilfreiche Lösung. Danach mit Hartnäckigkeit selbst gefundene Lösungen habe ich oft  in Foren zur Verfügung gestellt. Solche Lösungen möchte ich zukünftig auf meiner Homepage veröffentlichen und in Foren nur noch auf meine Homepage verweisen.

Probleme bei Austausch und Erweiterung eines Hauptspeichers

Rechner-Steckbrief
Anfangsfehler
Anfangsdiagnose
Folgeprobleme nach Ausbau von 3 neuen Speicherriegeln
Bei Diagnose und Entstörmaßnahmen aufgetretene Systemfehler
Speichertest Fehler nach Einsestzen von 3 Speicherriegeln
Speichertest Ergebnis nach Einbau von einem einzigen Speicherriegel
Internet Fundstellen zu den Speicherfehlern
Speichertest-Ergebnis beim Online-Test
Weitere Untersuchungs- und Entstörmaßnahmen
System läuft korrekt


Probleme bei Austausch und Erweiterung  eines Hauptspeichers

Rechner-Steckbrief

  • Mainboard Asus A7V
  • CPU Athlon900
  • 2 Speicherriegel à 512MB mit PC133
  • Grafikkarte Hercules 3D Prophet IIMX an AGP-Schnittstelle

Zurück zum Anfang dieser Seite

Anfangsfehler

Mein Rechner bleibt ab und an stehen (Bild friert ein, Mauszeiger lässt sich nicht mehr bewegen, keine Reaktion auf Ctrl-Alt-Del). Diese Situation kann nur durch Aus- und Wiedereinschalten des Rechners bzw. Benützung der Restart-Taste überwunden werden.

Zurück zum Anfang dieser Seite

Anfangsdiagnose

Bei einem Test mit memtest86 mittels Bootdiskette zeigen sich Fehler (die Fehler sind möglicherweise im Testschritt 6 aufgetreten, das ist aber nicht mehr sicher). Ich unterstelle deshalb einen Speicherfehler als Ursache für den Anfangsfehler und beschaffe 3 Riegel mit maximal 512MB als Ersatz.

Zurück zum Anfang dieser Seite

Folgeprobleme nach Einbau von 3 neuen Speicherriegeln

Nach Einbau der drei Riegel beginnt eine mehrtägige Leidensgeschichte, die mich durch mehrere Internet-Recherchen und über bedenkliche Systemfehler schließlich zu erfolgreicher Wiederherstellung der Systemstabilität und guter Performance führt.

Die Systemfehler sind wohl verursacht worden, weil das System nach Einbringung der neuen Riegel nicht mehr mit der gegebenen HW klarkommen konnte. Um die Übersichtlichkeit des Diagnose- und Entstörablaufs nicht zu beeinträchtigen, erwähne ich diese Systemfehler mit den jeweiligen Abhilfemaßnahmen zuerst d.h. vor dem eigentlichen Diagnose- und Entstör-Ablauf und ohne Zuordnung zu den einzelnen Schritten dieses Ablaufs:

Zurück zum Anfang dieser Seite

Bei Diagnose und Entstörmaßnahmen aufgetretene Systemfehler

  1. Nach kurzer Systemlaufzeit tritt ein akkustischer Lüfteralarm auf. Diesen versuche ich zu vermeiden durch Verwendung eines neuen Lüfters, dessen Drehzahl nach Einbau mit 4200U/min um ca 300U/min über der Drehzahl des alten Lüfters liegt. Der beklagte Alarm tritt auch mit dem neuen Lüfter auf. Das Hilfsprogramm Asusprobe bezeichnet den CPU Lüfter und die CPU-Temperatur als ok. Deshalb habe ich den Lüfteralarm im Bios abgeschaltet mit folgenden Bios-Einstellungen:
    a) CPU Temperatur-Überwachung ein
    b) CPU bei Überhitzung abschalten
    c) Lüfteralmarm aus
    Die CPU wurde bis jetzt nach vielen Tagen Arbeit nicht abgeschaltet. Der Alarm kommt nicht mehr.
  2. Meldung beim Systemanlauf, dass die Registry wiederhergestellt werden musste und dass die Wiederherstellung erfolgreich verlaufen sei.
  3. Outlook verlangt beim Abholen der Mails immer wieder erneut das Passwort, obwohl dieses gespeichert ist und eine Testmail mit diesem Passwort erfolgreich gesendet wird.
    Abhilfe:
    Da Neueinrichten der Konten und Neuinstallation von Outlook den Fehler nicht beseitigt und auch eine Wiederherstellung der Anwender-spezifischen Registry-Dateien nicht hilft, ersetze ich schließlich das gesamte Anwender-Profil des leidenden Anwenders karl in Dokumente und Einstellungen durch ein früher gesichertes Profil und kann damit den Fehler erfolgreich beseitigen.
  4. Beim Starten des Rechners beklagt das System das Fehlen oder die Beschädigung eines Betriebssystemmoduls und kommt nicht durch den Startup. Nach Ersetzen des offensichtlich fehlerhaften Moduls durch ein Modul aus einem alten Backup des Rechners läuft der Rechner zwar hoch, zeigt aber Fehler im Verhalten des Betriebssystems (ping funktioniert zwar, löst jedoch einen Ton aus, http-Zugriffe funktionieren nicht). Diesen Fehler konnte ich nur durch Wiederherstellung der gesamten Partition anhand einer vorhandenen Sicherung beseitigen.
Zurück zum Anfang dieser Seite

Speichertest-Fehler nach Einsetzen von 3 Speicherriegeln

Ein Offline Test des Speichers von der Bootdiskette mit memtest86 zeigt Fehler in Testschritt 6 („Modulo 20 test, cached“). Die Testschritte 1 bis 5 und der Testschritt 7 funktionieren dagegen ohne Fehlererkennung. Test 6 schreibt ein Muster aus 32 bit mit lauter Nulllen oder lauter Einsen. Dann schreibt er auf den folgenden hex 20 Adressen ein inverses Muster mit lauter Einsen oder lauter Nullen. Danach kommt er zurück zur ersten beschriebenen Adresse und prüft deren Inhalt. Bei dieser Prüfung kommt es dann zu den beklagenswerten Fehlern. Die Fehler weisen immer auf 32 bit ein einziges verfälschtes bit auf, treten bei wiederholten Durchläufen, von Ausnahmen abgesehen, an den gleichen Stellen und an diesen mit jeweils gleichen Mustern wieder auf und liegen pro Gesamtdurchlauf (7 Tests) in der Größenordnung von 300 Fehlern.


Zurück zum Anfang dieser Seite 

Speichertest Ergebnis nach Einsetzen von einem einzigen Speicherriegel

Die Tests der einzelnen Riegel auf dem untersten memoryslot verlaufen für alle drei Riegel fehlerfrei.

Zurück zum Anfang dieser Seite

Fundstellen im Internet zu den festgestellten Speicherfehlern.

Im Internet findet man, dass dieses Fehlverhalten auch von anderen Anwendern erfahren wurde. Dies folgt zum Beispiel aus

http://forums.cnet.com/5208-6618_102-0.html?threadID=7982

Weiterer Tiefgang innerhalb dieser Fundstelle führt zu einer Theorie für das Zustandekommen des Fehlers durch eine Charge fehlerhafter Kondensatoren aus Taiwan. Ein Reparatur-Betrieb hat sogar geschrieben, er habe reihenweise Mainboards wegen dieses Fehlers ausgetauscht. Meine weiteren Maßnahmen zeigen jedoch, dass mein System ohne Austausch von Kondensatoren oder des Mainboards entstört werden kann.

Zurück zum Anfang dieser Seite

Speichertest-Ergebnis bei Online-Test

Trotz Scheiterns des Offline Tests kann das System erfolgreich eingeschaltet werden. Ein memory Test mit online-Version 4 von memtest86 hat innerhalb eines kompletten Durchlaufs (ca. 6 h) keine Fehler gefunden. Der Anfangsfehler mit Einfrieren des Bildschirms und des Rechners tritt zwar nicht mehr auf, jedoch zeigen sich auf dem Bildschirm immer wieder kurzzeitige Bildausfälle mit dunklem Bildschirm. Man kann damit nicht arbeiten. Dieser Fehler lässt sich schließlich durch schnelle Bewegungen des Scrollbalkens eines hohen Browserbildes reproduzieren. Ich habe mich dann per RemoteDesktop von einem anderen Rechner auf den zu entstörenden Rechner aufgeschaltet und konnte feststellen, dass sich der Fehler dort unter ansonsten gleichen Bedingungen mit dem Scrollbalken nicht reproduzieren ließ. An dieser Stelle wird klar, dass das Fehlverhalten von der lokalen Grafik-Funktion verursacht ist.

Zurück zum Anfang dieser Seite

Weitere Untersuchungs- und Entstörmaßnahmen

  1. Austausch des Bildschirms ändert das Verhalten nicht
  2. Lösen und erneutes Stecken des Bildschirm-Kabels bringt keine Besserung
  3. Ersatz der seitherigen Grafikkarte durch eine uralt PCI Grafikkarte lässt die Dunkelperioden verschwinden. Die Bildbearbeitung wird durch die alte Grafikkarte jedoch so verlangsamt, dass bei rascher Bewegung des Scrollbalkens Bildinhalte nicht mehr zur Darstellung kommen. Das ist also auch keine Dauerlösung.
  4. Da Grafikkarten auch den Hauptspeicher in Anspruch nehmen, könnten theoretisch Fehler im Hauptspeicher zu Fehlern in der Grafikanzeige führen. Also, reduziere ich den Hauptspeicher auf einen memory-Riegel (500MB) und teste erneut mit der alten Grafikkarte (AGP). Der Fehler ist verschwunden. An dieser Stelle wird klar, dass die Grafik-Fehlfunktion verursacht wird durch die Zusammenarbeit der Grafikkarte mit dem Hauptspeicher. Die Fehlerursache kann dabei auf der Grafikkarte oder dem Rechner selbst liegen oder von den Prinzipien der Zusammenarbeit zwischen Rechner und Grafikkarte verursacht sein. Der mit einem Riegel von 500MB laufende Hauptspeicher ist noch keine befriedigende Lösung und verlangt nach weiteren Maßnahmen.
  5. Auf dem Rechner selbst kann theoretisch das BIOS einen solchen Fehler verursachen. Also bringe ich die neueste BIOS-Version in den Rechner ein. Dies beseitigt allerdings das Fehlverhalten der Grafikfunktion nicht.
  6. Um Fehler auf der Grafikkarte auszuschließen, ersetze ich diese durch eine neue Karte (AGP-Grafik FSC GM1000-16 nVidia TNT2 M64 [3117]). Leider tritt der gleiche Fehler auf wie mit der alten Grafikkarte. Die neue Graphikkarte ist der alten funktional sowie in Aufbau und Schnittstellen-Nutzung sehr ähnlich.
  7. Wenn man den Fehler zweier Grafikkarten (neu, alt) ausschließt, dann bleibt nur noch die Annahme eines Fehlers auf dem mainboard oder die Annahme einer prinzipiellen Inkompatibilität zwischen dem seither benützten Grafik-Typ und dem mainboard. Also habe ich eine neue Grafikkarte (ATI RADEON 7500 PCI 128MB / 64Bit / DDR VGA /DVI / TV-OUT) erstanden, die in einem PCI-Slot arbeiten kann, und diese eingesetzt. Sie funktioniert gut auch mit 3 Speicherriegeln. Der kurzeitige Bildausball mit dunklem Bildschirm tritt damit nicht mehr auf. Die Karte arbeitet sehr schnell und deckt meinen Bedarf vollständig ab.
  8. Durchführung des Offline Tests mit memtest86 zeigt keinen Fehler mehr (auch nicht bei Test 6). Es zeigt sich also hier, dass auch die vorher mit memtest86 in Test 6 festgestellten Fehler ihren Anlass in der Grafikkarte gefunden haben. Es ist für mich, wenn auch nicht sicher so doch recht wahrscheinlich, dass die gleiche Fehlerursache auch bei anderen Leidensgefährten vorgelegen hat.
Zurück zum Anfang dieser Seite

System läuft korrekt

Der Rechner arbeitet seit Einsatz der neuen PCI-Grafikkarte (ATI RADEON 7500 PCI 128MB / 64Bit / DDR VGA /DVI / TV-OUT) absolut stabil und durch den vergrößerten Hauptspeicher auch mit merklich verbesserter Geschwindigkeit.

Zurück zum Anfang dieser Seite