Ram a 100ºC

Picota92

Chapuzas Jr
Registrado
26 Jul 2016
Mensajes
27
Puntos
3
Edad
28
Hola buenas.

Ultimamente he tenido problemas en el ordenador, jugando a ciertos juegos tarde o temprano me da un pantallazo azul, el codigo que pone es "unrecoverable error". He revisado por internet y segun dicen puede ser un problema de hardware. He chequeado las temperaturas de la GPU y de la CPU (5800X RTX3800) y la GPU max ronda sobre los 70-75ºC y la CPU llega como mucho a 80ºC o algun grado más.

Los problemas seguian asique le hice un memtest a la RAM (no se si fue solo a la RAM o a mas cosas porque en total duro 4 horas) pero no encontro fallos. Tambien probe quitando un modulo de la ram (2x16gb), alternando los slots, incluso bajando la frecuencia de 3600 al modo automatico de la placa. Pero siguen pasando.

Entonces en el propio GPU-z, resulta que salen las temperaturas de las memorias y cuando estoy jugando alcanzan los 104ºC. Segun lei en redit puede ser por la 3800 que el backplate igual no disipa muy bien y se lo come todo la ram pero queria preguntar por si acaso.

Entiendo que es una temperatura bastante elevada, es posible que sea lo que esté causando los fallos?

Muchas gracias.

Edito: tambien pensandolo imagino que la RAM siempre haya estado a esa temperatura cuando el ordenador tiene carga y es algo que ha empezado a pasarme recientemente asique no estoy seguro de que realmente sea eso.

Edito 2: de hecho no estoy seguro de que sea la memoria RAM o la propia memoria de la grafica. Alguien me confirma?
 
Última edición:

Vagus

_
Registrado
11 Ago 2016
Mensajes
6.086
Puntos
113
La memoria que te dice que esta a 100ºC gpuz es la VRAM de la gráfica, la verdad que por desgracia es una temperatura "normal" para las 3080-3090, sobre todo las FE. Con normal me refiero a que pasa a todas las unidades por diseño, no que sea una temperatura "sana".

De hecho mucha gente cambia los pads térmicos que lleva de 1,5mm por unos buenos y consiguen bajar las temperaturas máximas de las memorias a unos 80 grados, lo que es mas aceptable.

La verdad que no es seguro que sea ese el problema, aunque alcancen esa temperatura son memorias que no arrojan errores y que simplemente bajan frecuencia en ese punto para no calentarse mas.

Por ir descartando cosas:

¿Tienes el XMP activado?

¿Alguna configuración de voltaje, PBO, frecuencia en la CPU?

¿Bios actualizada a la ultima versión?

¿Drivers actualizados, sobre todo los de la gráfica?
 

Picota92

Chapuzas Jr
Registrado
26 Jul 2016
Mensajes
27
Puntos
3
Edad
28
La memoria que te dice que esta a 100ºC gpuz es la VRAM de la gráfica, la verdad que por desgracia es una temperatura "normal" para las 3080-3090, sobre todo las FE. Con normal me refiero a que pasa a todas las unidades por diseño, no que sea una temperatura "sana".

De hecho mucha gente cambia los pads térmicos que lleva de 1,5mm por unos buenos y consiguen bajar las temperaturas máximas de las memorias a unos 80 grados, lo que es mas aceptable.

La verdad que no es seguro que sea ese el problema, aunque alcancen esa temperatura son memorias que no arrojan errores y que simplemente bajan frecuencia en ese punto para no calentarse mas.

Por ir descartando cosas:

¿Tienes el XMP activado?

¿Alguna configuración de voltaje, PBO, frecuencia en la CPU?

¿Bios actualizada a la ultima versión?

¿Drivers actualizados, sobre todo los de la gráfica?

Ya he visto, puede que en algun momento me anime a hacerlo ya que no sienta nada bien la verdad. Ahora justo probe con el MSI Afterburner a subir el ventilador de la grafica al 100% para ver si mejoraba pero poca ostia, me ha dado pantallazo igualmente.

El caso es que despues del pantallazo, me ha salido la mitica pantalla de American Megatrends y abajo del todo ponia algo como "CPU overheat". El caos es que tenia el GPU-z rulando cuando me dio fallo y justo en ese momento estaba en 75ºC que no me parece mucho. De hecho hoy mismo le cambie la pasta térmica.

El XMP si entiendo lo que es si que estaba activado, o almenos desde la BIOS tenia las frecuencias de la RAM en 3600mhz en vez de en automatico. Ahora he vuelto a entrar y las he puesto en automatico pero no creo que sea el problema la verdad.

Nada de OC, todo esta por defecto.

Las Bios la actualice hace no mucho, juraria que incluso es una beta. Puedo mirar a ver si hay version definitiva por si eso cambia las cosas.

Los drivers los reinstale el otro dia los ultimos que hay.

Podria ser un fallo de software? Porque hoy mismo hice un usb booteable por si puede ser eso le meto un formateo preventivo mañana mismo.
 

Vagus

_
Registrado
11 Ago 2016
Mensajes
6.086
Puntos
113
Ya he visto, puede que en algun momento me anime a hacerlo ya que no sienta nada bien la verdad. Ahora justo probe con el MSI Afterburner a subir el ventilador de la grafica al 100% para ver si mejoraba pero poca ostia, me ha dado pantallazo igualmente.

El caso es que despues del pantallazo, me ha salido la mitica pantalla de American Megatrends y abajo del todo ponia algo como "CPU overheat". El caos es que tenia el GPU-z rulando cuando me dio fallo y justo en ese momento estaba en 75ºC que no me parece mucho. De hecho hoy mismo le cambie la pasta térmica.

El XMP si entiendo lo que es si que estaba activado, o almenos desde la BIOS tenia las frecuencias de la RAM en 3600mhz en vez de en automatico. Ahora he vuelto a entrar y las he puesto en automatico pero no creo que sea el problema la verdad.

Nada de OC, todo esta por defecto.

Las Bios la actualice hace no mucho, juraria que incluso es una beta. Puedo mirar a ver si hay version definitiva por si eso cambia las cosas.

Los drivers los reinstale el otro dia los ultimos que hay.

Podria ser un fallo de software? Porque hoy mismo hice un usb booteable por si puede ser eso le meto un formateo preventivo mañana mismo.
Los XMP en AMD a veces no funcionan del todo bien, no porque las rams no sean estables, si no por que cambian más cosas los perfiles, voltajes secundarios por ejemplo. En estos casos se suele poner manualmente los timmings de las rams para que funcionen a su frecuencia sin alterar el resto se voltajes que afecta a la controladora de la CPU por ejemplo, o de cambiarlos, porque lo ajustas tú.

Como recomendación hasta que des con el problema yo dejaría las rams sin XMP ni nada.

Lo de la BIOS beta no me termina de convencer, yo instalaría la última versión completamente estable.

No descartes que sea cosa de software si hace mucho que no formateas. Si no es una tarea pesada para ti, instalar el sistema en limpio siempre sienta bien.

De todo esto haría las cosas por orden y probando después de cada una, si haces todo de golpe y de casualidad se arregla no sabrás que ha sido.

Nos vas diciendo
 

Picota92

Chapuzas Jr
Registrado
26 Jul 2016
Mensajes
27
Puntos
3
Edad
28
Los XMP en AMD a veces no funcionan del todo bien, no porque las rams no sean estables, si no por que cambian más cosas los perfiles, voltajes secundarios por ejemplo. En estos casos se suele poner manualmente los timmings de las rams para que funcionen a su frecuencia sin alterar el resto se voltajes que afecta a la controladora de la CPU por ejemplo, o de cambiarlos, porque lo ajustas tú.

Como recomendación hasta que des con el problema yo dejaría las rams sin XMP ni nada.

Lo de la BIOS beta no me termina de convencer, yo instalaría la última versión completamente estable.

No descartes que sea cosa de software si hace mucho que no formateas. Si no es una tarea pesada para ti, instalar el sistema en limpio siempre sienta bien.

De todo esto haría las cosas por orden y probando después de cada una, si haces todo de golpe y de casualidad se arregla no sabrás que ha sido.

Nos vas diciendo
Buenas tardes.

Te comento. He formateado el PC e instalado todo de 0 (ciertamente no todo ya que los juegos los tenia en otro disco duro pero no creo que sea problema). Tambien me he bajado la ultima version de la BIOS disponible que no es beta. Las RAM estan en modo automatico en la BIOS (creo que por defecto a 2666)

Me he bajado el juego con el que me ha estado dando los fallos (tambien antes de formatear me dio fallo otro juego, por eso no creo que sea algo especial del juego) Despues de jugar 10 minutos me ha dado fallo de nuevo. Y lo mismo que la ultima vez, al volver a arrancar me salio la pantalla de American Trends "CPU Overtemperature error!"

El caso es que tenia el GPU-z funcionando y cuando fallo lo ultimo que registro (registra cada 1s) era 73.6ºC. Tambien es cierto que hoy la memoria de la grafica estuvo incluso un poco más caliente, llego a 108ºC. Juraria que ayer leyendo sobre el tema ponñia que apartir de 105ºC podñia provocar thermal throttle o algo asi (ni puta idea de lo que es) Compensaria de alguna forma echarle pasta termica a la grafica? (juraria que no es al nucleo si no a las memorias que no se si lo llevan)

Puedo entender que sea un fallo de temperatura ya que la pantalla que tengo es superancha (relacion 32:9), 2K y 240Hz asique no es facil abastecerla. Igual puedo probar a bajar la resolucion de carajo a ver si pasa porque ciertamente solo pasa jugando. Pero tambien lo que me mosquea es que ponga temperatura alta de CPU cuando estaba a 74ºC que tampoco parece muy alta diria yo.

Si quieres puedo adjuntar el archivo del GPU-z y la foto que saque a la pantalla de American Trends.

Tambien te digo que tengo un disipador por aire que juraria que es bastante bueno (ESTE), es normal que la CPU este tan caliente siempre? Igual la caja no es la mejor de todas puede ser por eso?

Muchas gracias.
 

Vagus

_
Registrado
11 Ago 2016
Mensajes
6.086
Puntos
113
La verdad que despista un poco, porque no, 74ºC no es una temperatura que deba provocar un fallo en la CPU ni mucho menos. 108ºC en las VRAM creo que es excesivo, no se si es capaz la gráfica de mandar apagar el sistema por exceso en esa temperatura, la lógica me dice que sí, pero en foros solo se escucha hablar sobre freno térmico debido a la temperatura en las memorias.

Llegado a este punto solo veo dos caminos:

- Cambiar los thermal pads de la gráfica, cosa que haría sinceramente aunque no me diese problemas el equipo, estar tan cerca del limite de operación de un componente acelera claramente su envejecimiento y no están las cosas como para despreocuparse de cuando puede dejar de funcionar una gráfica.

- Empezar a pensar que la placa está defectuosa, en concreto lo que esté relacionado con los sensores de temperatura. Revisa la temperatura de la CPU que te marca en la bios, a ver si es "extrañamente alta", pudiera ser que la placa "lea" mas temperatura de la real. También conviene revisar los límites de temperatura, a ver si por lo que sea tienes 75ºC puestos como limite de temperatura para la CPU y por eso te la apaga.
 

Picota92

Chapuzas Jr
Registrado
26 Jul 2016
Mensajes
27
Puntos
3
Edad
28
La verdad que despista un poco, porque no, 74ºC no es una temperatura que deba provocar un fallo en la CPU ni mucho menos. 108ºC en las VRAM creo que es excesivo, no se si es capaz la gráfica de mandar apagar el sistema por exceso en esa temperatura, la lógica me dice que sí, pero en foros solo se escucha hablar sobre freno térmico debido a la temperatura en las memorias.

Llegado a este punto solo veo dos caminos:

- Cambiar los thermal pads de la gráfica, cosa que haría sinceramente aunque no me diese problemas el equipo, estar tan cerca del limite de operación de un componente acelera claramente su envejecimiento y no están las cosas como para despreocuparse de cuando puede dejar de funcionar una gráfica.

- Empezar a pensar que la placa está defectuosa, en concreto lo que esté relacionado con los sensores de temperatura. Revisa la temperatura de la CPU que te marca en la bios, a ver si es "extrañamente alta", pudiera ser que la placa "lea" mas temperatura de la real. También conviene revisar los límites de temperatura, a ver si por lo que sea tienes 75ºC puestos como limite de temperatura para la CPU y por eso te la apaga.
Comprare unos thermal pads y tratare de ponerselos a la grafica entonces.

Entiendo que los limites de temperatura es algun parametro de la BIOS no? A cuanto deberia estar? El problema es que para mirar la temperatura de la CPU en la BIOS tengo que apagar el ordenar o almenos no estar jugando, de modo que en esos pocos segundos cae un huevo. Hay alguna otra forma de hacerlo?

Igual pruebo a ponerle pasta térmica de nuevo a la CPU ya que viendo los videos sobre como colocar los PADS en la grafica he visto la cantidad que le echan (a la GPU eso si) y me da la sensacion de que yo eche muy poco a la CPU. Aunque cuando le cambie la pasta ayer más o menos si que estaba esparcida por todo el contorno.

Muchas gracias.
 

Vagus

_
Registrado
11 Ago 2016
Mensajes
6.086
Puntos
113
Comprare unos thermal pads y tratare de ponerselos a la grafica entonces.
Infórmate bien sobre el grosor, juraría que son de 1,5mm los que necesitas. Pero en internet con toda la gente que ya lo ha hecho seguro que encuentras el grosor.
Entiendo que los limites de temperatura es algun parametro de la BIOS no? A cuanto deberia estar? El problema es que para mirar la temperatura de la CPU en la BIOS tengo que apagar el ordenar o almenos no estar jugando, de modo que en esos pocos segundos cae un huevo. Hay alguna otra forma de hacerlo?
Si, la mayoría de BIOS dejan ajustar ese valor, al menos las ASUS. A lo que yo me refería es que si estas en la bios y el procesador esta a 50-60ºC en cambio luego en windows los programas te detectan 30-40ºC cuando estas en el escritorio puede ser que la bios realmente esté leyendo mal la temperatura y cuando a ti te marca 75ºC la bios lee 100ºC y por eso te apaga. Obviamente sería motivo de RMA si la placa está en garantía. Esto es todavía una especulación, pero compruébalo por si acaso, que en la BIOS no marque una temperatura muy alta (en bios los procesadores apenas se utilizan y la temperatura está cerca del mínimo que alcanza cuando estas en el escritorio en windows).
 

Picota92

Chapuzas Jr
Registrado
26 Jul 2016
Mensajes
27
Puntos
3
Edad
28
Infórmate bien sobre el grosor, juraría que son de 1,5mm los que necesitas. Pero en internet con toda la gente que ya lo ha hecho seguro que encuentras el grosor.

Si, la mayoría de BIOS dejan ajustar ese valor, al menos las ASUS. A lo que yo me refería es que si estas en la bios y el procesador esta a 50-60ºC en cambio luego en windows los programas te detectan 30-40ºC cuando estas en el escritorio puede ser que la bios realmente esté leyendo mal la temperatura y cuando a ti te marca 75ºC la bios lee 100ºC y por eso te apaga. Obviamente sería motivo de RMA si la placa está en garantía. Esto es todavía una especulación, pero compruébalo por si acaso, que en la BIOS no marque una temperatura muy alta (en bios los procesadores apenas se utilizan y la temperatura está cerca del mínimo que alcanza cuando estas en el escritorio en windows).
Mirare entonces lo del grosor.

Acabo de mirar lo de la Bios y mas o menos parece que marca la temperatura correcta. En la BIOS la CPU ronda los 50 grados y en el escritorio en reposo tambien anda sobre esas temperaturas. He probado a jugar al juego este con los graficos al absoluto minimo (resolucion de 600x480 o una mierda similar) y no dio fallo (obviamente las temperaturas eran bastante bajas) Luego subi un poco la resolucion y me volvio a dar fallo.

Ahora voy a estar 1 semana fuera asique no podre hacer muchas pruebas pero cuando vuelva igual abro le quito el cristal a la caja para que ventile mas y le pongo un ventilador de grande que tengo (un ventilador de personas) para que asi ventile mas, igual asi baja la temperatura y aguanta. Si con el ventilador no me da fallo si que podria ser un tema de temperaturas imagino.

De todos modos igual cambio la caja ya que la verdad mucho no me gusta, no tiene mucho espacio. Y en caso de que la cambie igual tambien le cambio el disipador y me trato de montar un loop de liquida, lo unico que no se por cuando podria salir pero al fin y al cabo el PC este va a durar unos cuantos años asique tampoco me importaria.

Edito: Como ves que utilize algun programa de benchmark que someta al ordenador a fatiga para ver si peta en ese momento tambien?
 

Vagus

_
Registrado
11 Ago 2016
Mensajes
6.086
Puntos
113
Edito: Como ves que utilize algun programa de benchmark que someta al ordenador a fatiga para ver si peta en ese momento tambien?
OCCT tiene un test especifico de VRAM, podrías ponerlo y monitorizar la temperatura de la memoria a la vez. En ese test SOLAMENTE debería calentarse la VRAM y un poco la gráfica, pero nada la CPU. Creo que de esa manera podríamos comprobar si cuando se apaga, aunque ponga cpu overtemperature, es por culpa de la temperatura de la VRAM. Y dado el caso, pues a cambiar los thermalpads de cabeza.
 

Picota92

Chapuzas Jr
Registrado
26 Jul 2016
Mensajes
27
Puntos
3
Edad
28
OCCT tiene un test especifico de VRAM, podrías ponerlo y monitorizar la temperatura de la memoria a la vez. En ese test SOLAMENTE debería calentarse la VRAM y un poco la gráfica, pero nada la CPU. Creo que de esa manera podríamos comprobar si cuando se apaga, aunque ponga cpu overtemperature, es por culpa de la temperatura de la VRAM. Y dado el caso, pues a cambiar los thermalpads de cabeza.
He estado haciendo unas cuantas pruebas y testeando la CPU, la GPU y la Vram de la gpu y no ha dado fallo. Curiosamente cuando se testea solo la VRAM la temperatura no sube tanto, es cuando testea las GPU que debe disipar en direccion a las VRAM imagino que suben bastante pero no tanto como cuando juego.

Asique la semana que viene a ver si le meto los thermalpads si cambia la cosa.

Muchas gracias por la ayuda.
 
Arriba