Stress mit nVidia-Graka: NVRM und Xid
Ein skurriles technisches Problem, das mich langsam aber sicher in den Wahnsinn treibt…
Mein Rechner friert mir dauernd ein. Hauptsächlich bei Spielen. Öfters aber auch nur beim Video-schauen oder browsen. Manchmal läuft der Rechner aber auch einen Tag lang durch ohne Probleme, auch mit Spielesessions.
Details zu meinem System:
- Biostar 8200 AM2+ Mainboard
- AMD Phenom X4 9550 CPU
- GEIL 2x 1024MB DDR2-800 RAM
- Palit / XpertVision (nVidia) 9600 GT
- OCZ 500W ModXStream Pro Netzteil
Spiele, die meistens relativ schnell einen Crash nach sich ziehen: FarCry, Burnout Paradise, HL²-Spiele wie CS:S und Garry’s Mod, aber auch WarCraft III.
Spiele, die ich stundenlang ohne Freeze spielen kann: TeeWorlds, CS 1.6, UrbanTerror.
Der Verdacht fiel zuerst auf den RAM, jedoch habe ich das durch Testen mit anderen (neuen) Modulen und durch Experimentieren mit den Latenzen und der Spannung widerlegt.
Jetzt bin ich mir ziemlich sicher, dass es an der Grafikkarte liegt. An den Treibern liegt es wahrscheinlich nicht. Ich habe unter Windows XP, Windows 7 und Arch Linux mehrere Treiberversionen von nVidia ausprobiert, immer das gleiche Problem.
Es kommt (unter Windows) auch kein BlueScreen, das System friert komplett ein, der Sound stottert. Nur ein Reset hilft.
Unter Linux frieren die Spiele (mit wine) mir den PC übrigens auch ein. Allerdings läuft da der Rest des Systems weiter, die Musik läuft z.B. noch weiter. Per Magic SysRQ führe ich dann “schonend” einen Reboot durch.
Nach dem Reboot funktioniert alles auch wieder.
Die einzelnen Komponenten habe ich alle Stresstests unterzogen. Prime95 und FurMark liefen stabil eine knappe Stunde, MemTest86+ und 3DMark liefen problemlos durch.
Praktischerweise führt der Linux-Kernel logs, aus denen man im Gegensatz zu den Windows “Fehlerberichterstattungen” auch schlau wird vielleicht einen Hinweis bekommt.
Diese Zeilen hier stehen meist im Log, bevor ich einen Reboot / Reset durchführe:
kernel: NVRM: Xid (0002:00): 6, PE0001
kernel: hda-intel: IRQ timing workaround is activated for card #0. Suggest a bigger bdl_pos_adj.
kernel: NVRM: Xid (0002:00): 6, PE0001
kernel: NVRM: Xid (0002:00): 6, PE0001
kernel: NVRM: Xid (0002:00): 6, PE0001
Manchmal aber auch folgendes:
kernel: NVRM: Xid (0002:00): 8, Channel 00000002
kernel: NVRM: Xid (0002:00): 13, 0002 00000000 00005039 00000328 00000000 00000002
kernel: NVRM: Xid (0002:00): 13, 0002 00000000 00005039 00000328 00000000 00000002
kernel: NVRM: Xid (0002:00): 13, 0002 00000000 00005039 00000328 00000000 00000002
kernel: NVRM: Xid (0002:00): 13, 0002 00000000 00005039 00000328 00000000 00000002
kernel: NVRM: Xid (0002:00): 13, 0002 00000000 00005039 00000328 00000000 00000002
kernel: NVRM: Xid (0002:00): 13, 0002 00000000 00005039 00000328 00000000 00000002
kernel: NVRM: Xid (0002:00): 13, 0002 00000000 00005039 00000328 00000000 00000002
kernel: X[4009]: segfault at 8 ip 00007f7e6cdae4bf sp 00007fff6b14e130 error 4 in nvidia_drv.so[7f7e6cd64000+3ac000]
Ich würde die Grafikkarte ja reparieren lassen, allerdings funktioniert sie ja an sich super. Ich kann als Beschreibung ja schlecht schreiben “Spielen Sie damit mal eine halbe Stunde WarCraft III und Ihr System wird einfrieren” xD
UPDATE: Ich hab das Teil kurz vor Weihnachten 2009 eingeschickt. Der Support hat mir bestätigt, dass die Karte defekt ist und hat mein Geld erstattet.
schon mal Graka sauber gemacht?? Die hat bei mir mal 2 Tage lang gestreickt, bevor sie sich mit einem blauen Bildschirm (kein BlueScreen!!) verabschiedet hatte…
Nachm sauber machen ging sie aber wieder – zum Glück
MfG Schecki
Jep, sauber gemacht ist sie. Ich schließ mal von den Fehlercodes darauf, dass der Grafikspeicher evtl. defekt ist. Mal sehen, was ich da machen kann…
Was vllt ne idee wäre: Die beanspruchung für den VRAM hat ja nicht nur was mit dem Spiel zutun, sondern auch mit der Größe des Monitors. Wenn du vllt irgendwo noch n kleineren Rumfliegen hast schließ’ den ma an und schau, ob das dann immer noch ist.
Könnte ich mal ausprobieren, allerdings hab ich das Teil jetzt mal eingeschickt. Mal sehen was die Techniker dazu sagen. Ich hab die Leute vom Support mal angerufen und denen mein Problem grob so geschildert: “System friert nach einiger Zeit beim Spielen komplett ein, unter allen Betriebssystemen, mit anderer Grafikkarte funktioniert es alles prima. GK wird nicht zu heiß.”.
Der hat mir dann daraufhin gesagt, dass ichs einschicken soll. Also hab ich das getan
Und was hast du jetzt für ne Karte?
Ich nehm an da du Linux-User bist wieder ne Geforce?
Richtig, ich hab mir jetzt ne GT240 zugelegt. Und die funktioniert prächtig im Gegensatz zur vorigen Karte.^^