laufend Hardware-Fehlermeldungen

Dieses Forum dient der grundlegenden Hilfe und Unterstützung :

Stelle hier Deine Fragen zur Grundinstallation und zur Benutzung von Mageia. Beispielsweise gehören hierhin Fragen zum Download der ISOs und deren Installation, zur Einrichtung des Druckers, Benutzung der Textbearbeitung, usw.

Bitte versuche, Deine Fragen im richtigen Subforum zu stellen und gib dabei so viele Informtionen wie möglich. Je präziser die Frage gestellt wird, um so eher bekommst Du eine hilfreiche Antwort.

laufend Hardware-Fehlermeldungen

Beitragvon elch4729x » Sep 25th, '11, 09:51

Ich erhalte jetzt laufend "Benachrichtigungen" wie diese: (bei jedem Einschalten)

Message from syslogd@localhost at Sep 25 10:46:56 ...
kernel:[Hardware Error]: MC4_STATUS[Over|CE|MiscV|-|AddrV|CECC]: 0xdc02400000080a13

Message from syslogd@localhost at Sep 25 10:46:56 ...
kernel:[Hardware Error]: Northbridge Error (node 0): DRAM ECC error detected on the NB.

Message from syslogd@localhost at Sep 25 10:46:56 ...
kernel:[Hardware Error]: cache level: L3/GEN, mem/io: MEM, mem-tx: RD, part-proc: RES (no timeout)

Was hat das denn zu bedeuten?
Ist nun wirklich etwas an meiner Hardware kaputt?
Unter Windows konnte bei einem CPU+RAM Stresstest nichts gefunden werden.

Hat da mal jemand einen Plan?
elch4729x
 
Beiträge: 10
Registriert: Sep 25th, '11, 09:45

Re: laufend Hardware-Fehlermeldungen

Beitragvon man-draker » Sep 25th, '11, 10:09

elch4729x hat geschrieben:Hat da mal jemand einen Plan?

Nach dem hier zu urteilen:
http://permalink.gmane.org/gmane.linux.kernel.edac/252
hast du einen schwächelnden RAM-Baustein, dessen Fehler aber zur Zeit noch korrigiert werden können.
"Die letzte Stimme, die man hört, bevor die Welt explodiert, wird die Stimme eines Experten sein, der sagt: 'Das ist technisch unmöglich.'"
(Peter Ustinov)
Benutzeravatar
man-draker
 
Beiträge: 4992
Registriert: Jun 1st, '11, 12:56

Re: laufend Hardware-Fehlermeldungen

Beitragvon doktor5000 » Sep 25th, '11, 10:51

Windows reizt im Normalbetrieb die Hardware nicht so stark aus,
wie das unter Linux der Fall ist, da einige Treiber hier einfach näher an der Hardware arbeiten.
Außerdem nimmt es der Linux-Kernel bei Fehlern etwas genauer, und zeigt diese an, obwohl
si u.U. momentan noch keine sichtbaren Fehler produzieren.
Ich bin nicht böse, sondern nur ehrlich. Und wer lesen kann, ist klar im Vorteil.
----
Mageia - the magic continues
Benutzeravatar
doktor5000
 
Beiträge: 6062
Registriert: Jun 2nd, '11, 09:39

Re: laufend Hardware-Fehlermeldungen

Beitragvon elch4729x » Sep 25th, '11, 14:05

Danke, für die schlechten News!

Hätte da nichts von "Northbridge" gestanden, wäre ich da vielleicht von selbst drauf gekommen.

Ich hasse es, wenn Hardware versagt.

Sicherlich uninteressant für die meisten hier: Neuer RAM ist ja schon unterwegs, nur war der eben zur Aufrüstung gedacht und nicht als Ersatz.

Bei dem Einschalten jetzt kommen keine Fehler-Meldungen. Wirklich zuverlässig sieht das aber nicht aus.

Dann kann ich ja die RAM-Riegel einzeln ausbauen und schauen bei welchem dann die Fehlermeldungen kommen. Mist!
elch4729x
 
Beiträge: 10
Registriert: Sep 25th, '11, 09:45

Re: laufend Hardware-Fehlermeldungen

Beitragvon doktor5000 » Sep 25th, '11, 15:21

Deshalb bei sowas wichtigem wie Speicher nur Produkte kaufen, wo man ausreichend lange Garantien bekommt,
meist nur wenige Cent/Euro teurer als Billig-Speicher. Etwa Kingston gibt eine Lebenszeitgarantie, auch schon auf den ValueRAM.
Auch ist die generelle Haltbarkeit höher und die Fehlerquote bei Kingston etwas geringer.
Ich bin nicht böse, sondern nur ehrlich. Und wer lesen kann, ist klar im Vorteil.
----
Mageia - the magic continues
Benutzeravatar
doktor5000
 
Beiträge: 6062
Registriert: Jun 2nd, '11, 09:39

Re: laufend Hardware-Fehlermeldungen

Beitragvon elch4729x » Sep 25th, '11, 16:06

Und wieder einmal: Danke! Denn an die "lebenslange Garantie" bei Kingston hätte ich jetzt nicht so ohne weiteres gedacht.
Die RAM-Riegel sind nämlich tatsächlich von Kingston. :lol:

Ich hab' ja noch nie RAM-Riegel wieder eingeschickt, aber diesmal werd' ich's wohl tun. Denn dann klappt's auch mit der Aufrüstung! He! He!

Ihren Dienst haben die Teile je eigentlich schon längst getan. Ich hab' tatsächlich noch die Rechnung (und die Verpackung) gefunden und die ist von Dezember 2008. Keine Ahnung, warum ich ein DDR2-System noch mal RAM-mäßig aufrüste. Es läuft halt.

Auf den Einfluss von "kosmischer Strahlung" habe ich auch gleich noch mal gecheckt: Nö, da is nix. 13-15 µREM/h.
Dann könnte sich noch das Mainboard durch mechanische Einflüsse etwas verzogen haben. Durch Bank-Tausch auch ausgeschlossen.
So exotische Einflüsse halt. Checkt man halt auch mal ab. ;)

Welcher Riegel es nun endgültig ist, steht noch nicht so ganz fest, weil im Einzel-Test alle funktionieren, aber bei dem einem wollte das System gleich 2x gar nicht erst starten. Der kommt dann wohl am ehesten in Betracht.

Vielen Dank für die schnelle und fachkundige Hilfe. Hoffentlich ist nun auch die RMA-Abwicklung bei Kingston reibungslos.

Die Chips sind übrigens von Elpida. Da hatte ich schon von Anfang an nicht das beste Gefühl. Hynix wäre mir lieber gewesen. Aber das ist ja immer so eine Sache, was gerade verfügar ist. Bei DDR3-RAM ist das jetzt ja einfacher. Da ist der Chip-Typ ja tlw. selbst in Preissuchmaschinen erkennbar.
elch4729x
 
Beiträge: 10
Registriert: Sep 25th, '11, 09:45

Re: laufend Hardware-Fehlermeldungen

Beitragvon elch4729x » Sep 25th, '11, 18:30

Irgendwie war das doch noch nicht die Lösung und zwar aus folgendem Grund:

Der Fehler / die Benachrichtigungen kommen nun bei beiden RAM-Riegeln, wenn ich sie einzeln betreibe,
und das die beide gleichzeitig nach fast 3 Jahren abkratzen, also die Wahrscheinlichkeit ist doch gleich 0.

Ich werde das System ja ohnehin bald neu wieder aufsetzen, aber merkwürdig ist die Sache hier schon.

Dafür muss es irgendeinen anderen Grund geben, als defektes RAM.

Na gut, die Häufigkeit der Fehlermeldungen unterscheidet sich, wie ich gerade sehe.
Bei diesem Riegel hier kommen die doch wesentlich öfter,

Ach, ich verstehe das irgendwie einfach nicht!
elch4729x
 
Beiträge: 10
Registriert: Sep 25th, '11, 09:45

Re: laufend Hardware-Fehlermeldungen

Beitragvon elch4729x » Sep 25th, '11, 19:48

Ich hab' jetzt mal memtest86+ v4.20 etwas durchlaufen lassen und zumindest in der Zeit traten dort keine Fehler auf.
Auch habe ich im Bios ECC dann extra dafür deaktiviert, damit es dann auch Fehler finden kann. Aber: Nichts!
Über Nacht kann ich es wohl noch einmal etwas länger laufen lassen.
Jetzt gerade kommen hier auch keine Fehlermeldungen bei deaktiviertem ECC.
Es sind übrigens die ältesten Bauteile in meinem PC. Selbst das Mainboard ist jünger.

Das mit der Garantie bei Kingston scheint wohl doch nicht so einfach zu sein.
Der Händler haftet 2 Jahre und danach nur noch auf Kulanz und bei K&M Elektronik bedeutet das,
dass die 30 Euro haben wollen. Also wäre eine Direktabwicklung über Kingston schon vorteilhafter,
nur da bin ich noch nicht dahinter gestiegen. Die Webseite ist als Sackgasse konstruiert wurden.
Funktionieren tut das nur für... Ach, ist ja egal.

So ein blöder, nerviger ECC-Fehler kann einem schon mächtig auf den Wecker fallen.
Hoffentlich kriege ich bald raus, woran's denn nun wirklich liegt.
Ich könnte die ganze Sache natürlich auch positiv sehen:
Besser einen Fehler angezeigt kriegen wo keiner ist,
als keinen angezeigt bekommen, wo einer ist. ;)
elch4729x
 
Beiträge: 10
Registriert: Sep 25th, '11, 09:45

Re: laufend Hardware-Fehlermeldungen

Beitragvon elch4729x » Sep 25th, '11, 20:32

Irgendwie liegt hier immer noch etwas mächtig im Argen.
Ohne ECC ist mir der Rechner nach einer Weile eingefroren,
und ließ sich nicht mehr neu booten. Zweimal blieb er sogar im Bios stehen.

Don't touch a running system! scheint sich wohl wieder einmal zu bewahrheiten.

Fast sieht es so aus, als würde sich die CPU oder zumindest ein Kern davon
verabschieden. Das scheint aber auch eine falsche Fährte zu sein.

Entgegen allen Wahrscheinlichkeiten scheinen sich doch 2 RAM-Riegel zur
selben Zeit zu verabschieden.
elch4729x
 
Beiträge: 10
Registriert: Sep 25th, '11, 09:45

Re: laufend Hardware-Fehlermeldungen

Beitragvon BicycleRepairMan » Sep 25th, '11, 22:04

elch4729x hat geschrieben:Der Fehler / die Benachrichtigungen kommen nun bei beiden RAM-Riegeln, wenn ich sie einzeln betreibe,
und das die beide gleichzeitig nach fast 3 Jahren abkratzen, also die Wahrscheinlichkeit ist doch gleich 0.

Vielleicht ist ja eine RAM-Bank des Mainboards kaputt?
17''-Laptop Samsung R730-JT07: 4GB RAM, 2x2,53 Ghz, NVIDIA GeForce310M + Netbook: Acer Aspire One 532 mit 2GB RAM + Bastelrechner

"Yes! Wherever bicycles are broken or menaced by international communism, BicycleRepairMan is ready!"
Avatar © Phoenix
Benutzeravatar
BicycleRepairMan
 
Beiträge: 157
Registriert: Jun 13th, '11, 10:29

Re: laufend Hardware-Fehlermeldungen

Beitragvon alf » Sep 25th, '11, 22:15

Auch eine instabile Spannungsversorgung kann für ein solches Verhalten verantwortlich sein, evtl. ist das Kraftwerk dabei, den Geist aufzugeben.
Das Gehirn ist nicht wie Seife, es wird nicht weniger wenn es benutzt wird. -- Lisa Fitz
Benutzeravatar
alf
 
Beiträge: 2443
Registriert: Jun 1st, '11, 13:39
Wohnort: Paderborn

Re: laufend Hardware-Fehlermeldungen

Beitragvon elch4729x » Sep 25th, '11, 22:49

RAM-Bank: schon getestet, alles mal gewechselt, das ist es auch nicht

komplett anderes RAM aus anderem Rechner genommen: ebenso ECC-Fehler bzw. totale Black-Screens
Des öfteren wollte hier jetzt gleich gar nichts mehr starten. Das war schon echt zum Verzweifeln!

bleibt noch: Netzteil, Mainboard, ...

So, und "das Kraftwerk" hatte ich jetzt auch im Blick, weil das bloß so ein Billig-Teil ist. be-quiet pure power L7-350W.
Das ist schon das Austausch-Netzteil, weil da schon mal der Ein-Aus-Schalter kaputt ging, (benutze ich halt manchmal)
und in diversen Tests erweist es sich zwar als sparsam, die Kurven, die es so abliefert, sind zwar noch ganz ordentlich,
aber gewiß nicht überragend.

Soeben habe ich da auch hochwertiges Netzteil eingebaut (von Corsair) (auch wieder aus einem anderen Rechner),
und siehe da bis jetzt wird mir hier noch kein Fehler angezeigt. Na mal sehen, wie sich das entwickelt.
(Das hat aber einen etwas höheren Stromverbrauch im Leerlauf.)

Das wird es dann wohl sein.

Soeben habe ich auch den Kühler von der CPU mit Hammer und Schraubenzieher entfernt (nach dem Ausbau),
weil der Kühler sich gar nicht mehr von der CPU entfernen ließ. Total festgeklebt durch die Wärmeleitpaste.
Raus ging's ja merkwürdigerweise. Aber beim Einbauen war dann der Hebel der CPU-Halterung im Weg.
Also musste ich irgendwie den Kühler von der CPU kriegen.

Mit Hammer und Schraubenzieher 45 nm Technik bearbeiten. Was macht man sonst 2011?
elch4729x
 
Beiträge: 10
Registriert: Sep 25th, '11, 09:45


Zurück zu Basis-Support

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 0 Gäste

cron