G84 y G86 defectuosos, ¿G92 y G94 también?

Lugar para comentarios respecto de software y hardware
Lole_JPS
Orco
Orco
Mensajes: 1783
Registrado: Mar Mar 29, 2005 5:04 pm
Ubicación: La Plata

G84 y G86 defectuosos, ¿G92 y G94 también?

Mensaje por Lole_JPS » Mié Ago 13, 2008 2:07 am

Este es un tema que parecia más a una campaña de desprestigio, vaporware o simplemente dichos de alguien que tenia bronca con nvidia.

Repasando los hechos:

En junio aparecio un reporte en The Inquirer donde hablaba de problemas en las notebooks que integraban chips gráficos basados en los procesadores G84 y G86, en resumen se trataba de cuelgues y pantallas negras al bootear luego de usar la maquina, generalmente jugando.

Se desmintió rapidamente el problema diciendo que era una partida defectuosa que habia sido enviada a HP, pero rapidamente aparecio tambien el problema en otras marcas, como por ejemplo Dell. tambien se dijo y luego se comprobo mentira que el problema era nomas en los ultimos chips fabricados.

El problema esta dado por los ciclos de calentamiento-enfriamiento que sufre cualquier componente en su uso, en cualquier caso normal estos componentes se diseñan y fabrican pensando en ese ciclo (que expande y comprime al material del componente), en este caso aparentemente lo que falla es una soldadura en el chip.

Aca en ingles el articulo insinuando que todos los chips estan mal (laptop y desktop)http://www.theinquirer.net/gb/inquirer/ ... 84-g86-bad

Los dichos de nvidia sobre la culpa del problema:
http://www.theinquirer.net/gb/inquirer/ ... blame-game
(en resumen le tira con un palo grande como la catedral)

aca se menciona que se separaron 200 millones del presupuesto para cubrir este problema, en anandtech:http://www.anandtech.com/weblog/showpost.aspx?i=469
Another black hole for revenue this quarter will be defective products. NVIDIA is expecting to lose some 200 million dollars on replacing defective products above and beyond the usual failure rates. They have not specified what exactly is broken and in need of replacement, but the best theory we've heard so far is that there's a substrate problem with some of their mobile GPUs, resulting in the chips breaking their own substrate at temperatures they should be able to handle. 200 million dollars buys a lot of chips, so this doesn't appear to be a small problem. The bigger loss however will be the loss of faith in the company from OEMs who will be repairing laptops using these defective chips.
en toms: http://www.tomshardware.com/news/nvidia ... ,5815.html


Por qué no paso revuelo con las desktop como con las laptop?

1. en las laptop el proceso ciclico de calentamiento-enfriamiento esta mucho mas acentuado, el GPU constantemente acelera y desacelera su potencia para poder cumplir la potencia necesaria requerida (hablando de los graficos) pero tambien para que el calor y el consumo no sean altos.

2. dado lo anterior es de esperar tambien que en las laptop, el GPU labure siempre muy cerca de su TDP critico.

3. las soluciones desktop tienen lejos mejor solucionado el asunto de la disipación de calor (mas espacio libre = coolers mas grandes).

Algunos fabricantes (aparentemente forzados por Nvidia segun algunos articulos) pusieron como solucion una BIOS que mantiene el ventilador de la GPU andando a altas RPM, pero con la contra que obviamente consume mucha mas bateria, algo inaceptable como solución y peor aun en una laptop.

A dia de hoy internet se lleno de este tema y esta bastante aceptado dado las altas tasas de fallas que tienenn los poseedores de las notebooks implicadas (se las manda a RMA a cambiar la GPU).

Hoy podemos ver como Tomshardware ya levanto esta noticia a su pagina: http://www.tomshardware.com/news/nvidia ... ,6121.html

sigue en el próximo post.

Lole_JPS
Orco
Orco
Mensajes: 1783
Registrado: Mar Mar 29, 2005 5:04 pm
Ubicación: La Plata

Mensaje por Lole_JPS » Mié Ago 13, 2008 2:28 am

A todo esto, de ser un rumor tira-bomba, la noticia ya esta aceptada y confirmada para los G84 y G86.

Hoy, 12 de agosto, charlie, el mismo de la noticia sobre las fallas de los G84 y 86 comenta en un articulo que este problema es solo la punta del iceberg y que ya se reportan fallos en los G92 y G94, es decir
the G92 chip is used in the 8800GT, 8800GTS, 8800GS, several mobile flavours of 8800, most of the 9800 suffixes, and a few 9600 variants just to confuse buyers. The G94 is basically only the 9600GT
aparentemente los G80 estarian afuera del problema (8800 GTX).

http://www.theinquirer.net/gb/inquirer/ ... reportedly

aca también hablan del tema.
http://www.techspot.com/news/31208-nvid ... g-too.html

En lo que parece ser quisas una exageración como lo fue el error del TLB en los primeros Phenom el tema se expande rapido, afectando la imagen de nvidia, aunque exageraciòn no parece ser una palabra agradable si uno es dueño de una notebook con estos gráficos.

Yenki
Admin
Mensajes: 15734
Registrado: Mié Feb 16, 2005 8:23 pm
Ubicación: La Plata, Argentina

Re: G84 y G86 defectuosos, G92 y G94 tambien?

Mensaje por Yenki » Mié Ago 13, 2008 5:48 am

Lole_JPS escribió:Este es un tema que parecia más a una campaña de desprestigio, vaporware o simplemente dichos de alguien que tenia bronca con nvidia.
Respecto de esto me sorprendió la virulencia de los dichos contra Nvidia en los artículos de The Inquirer.


El 7 de julio en la nota ya enlazada por Lole titulada Nvidia plays the meltdown blame game Demerjian dice:

En resumen, todo puede resumirse por mala ingeniería , cubriéndose el trasero y esperando que reviente encima. El mensaje corporativo de Nvidia es , muy incompetente, más guiado por el hecho de que son peones de personas más arriba en la cadena alimenticia que cualquiera, y que sólo tienen una herramienta, un martillo.
Cuando algo va mal, ellos no saben como resolverlo los problemas, sólo golpear cosas.

...
Entonces básicamente, Nvidia la arruinó totalmente, y está culpando a todos menos a la única compañía que debería, ella misma.





En el primer enlace que puso Lole, del artículo All Nvidia G84 and G86s are bad el 9 de julio, Charlie Demerjian dice:

Culpar a los proveedores, OEMs, y usuarios en completamente infundado y dice que NV no muestra deseos de enfrentar el problema, sólo de esconderse de él. NV sabe, ellos hicieron cambios en el silicio para arreglar otro problema que llevó directamente a este.


Ayer 12 de agosto en la nota, que también puso Lole, titulada Nvidia G92s and G94 reportedly failing, Charlie Demerjian dice:

NV aún insiste en andar con evasivas y giros porque el costo de reconocer el problema podría muy bien hundir la compañía.



Imagen


Imagen de techarp.com.


Yo tengo la esperanza que nuestros chips G92, que impulsan las queridas 8800 GT, como ya tienen mucho tiempo andando, (se presentaron el 29 de octubre del año pasado), se salven de este error de diseño.
Quiero confiar en que con lo exitoso que fueron estos modelos ( Nvidia no daba a basto con la entrega en diciembre), de haber habido algún error hubiese saltado ya.

Veremos que pasa, como de Nvidia no dan una respuesta clara, los dichos de gente como la de The Inquirer, no son refutados.... pero por ahora creo que van teniendo razón... :(



(Lole te pasaste con el tema, .... pero espero que no sea una campaña psicológica para tratar de copar el mercado con las LoleForce ... :D )

math
Lombriz mortífera
Lombriz mortífera
Mensajes: 1456
Registrado: Dom Jul 17, 2005 1:04 am
Ubicación: La Plata

Mensaje por math » Mié Ago 13, 2008 1:32 pm

no creo yen, la tuya y las de los chicos pensa que son importadas, con todas las vueltas del caso seguro son de una linea anterior a la que pensas ;)

y les dije que esas 8800 son una kk!!!! :P

Lole_JPS
Orco
Orco
Mensajes: 1783
Registrado: Mar Mar 29, 2005 5:04 pm
Ubicación: La Plata

Mensaje por Lole_JPS » Jue Ago 14, 2008 1:51 pm

http://news.softpedia.com/news/More-Nvi ... 1890.shtml

Muy bien explicado (en resumen) como se dio cronologicamente este tema, aunque en ingles.

algunos puntos destacables para mencionar:

1. los chips de las notebooks (G84 y 86) se vienen rompiendo en un porcentaje muy alto, y en todas las marcas (incluso en las Apple).

2. como nvidia no sale a decir claramente cual es el problema ni demuestra que los GPU en las placas dedicadas estan hechos con otro proceso distinto al de las GPU de las notebooks, varios canales de distribución mandaron placas con estos chips para reemplazo a los fabricantes, es lo que entendi de este parrafo:
"Due to Nvidia not clearly explaining the details of the faults reported in its notebook GPUs, some channel vendors have demanded graphics card makers issue a recall for desktop-based discrete graphics cards using the same GPU core, according to sources at graphics card makers"
3. con respecto a los G92/94 segun dicen, 4 partners de nvidia estan observando altas tasas de fallos en las placas dedicadas
The issue with the desktop cards seems to be a rather serious one. Four Nvidia partners are said to experience G92 and G94 chips failures in the field at high rates. The failures follow a bell curve, starting slow and going up very quickly, and Nvidia has yet another problem to deal with. The G92 chip is used in numerous cards, including 8800GT, 8800GTS, 8800GS, several mobile versions of 8800, most of the 9800 line, and a few 9600 flavors, while G94 is packed on the 9600GT. If all these cards are susceptible of failure, the costs will be dramatically increased for Nvidia.

Yenki
Admin
Mensajes: 15734
Registrado: Mié Feb 16, 2005 8:23 pm
Ubicación: La Plata, Argentina

Mensaje por Yenki » Jue Ago 14, 2008 9:33 pm

En el artículo enlazado por Lole cuentan como Dell y HP para sus computadoras portátiles con problemas sacaron parches para el BIOS pero (Traduzco)

" ... estas soluciones no intentan arreglar el problema, solamente posponer el momento de falla más allá del período de garantía".

Uno más ladri que el otro .... :evil:

Lole_JPS
Orco
Orco
Mensajes: 1783
Registrado: Mar Mar 29, 2005 5:04 pm
Ubicación: La Plata

Mensaje por Lole_JPS » Vie Ago 22, 2008 1:05 pm

Dell ampliará garantía de portátiles con GPUs NVIDIA


Como consecuencia de estar afectada su línea de productos por las GPUs de NVIDIA defectuosas, Dell compensará a los clientes afectados con un programa de ampliación de garantía, dedicado principalmente a corregir ese problema.
http://www.noticias3d.com/noticia.asp?idnoticia=27824

Lole_JPS
Orco
Orco
Mensajes: 1783
Registrado: Mar Mar 29, 2005 5:04 pm
Ubicación: La Plata

Mensaje por Lole_JPS » Mar Ago 26, 2008 12:27 pm

Posible confirmación del problema en las GPU debido al material usado en las soldaduras:

http://www.tomshardware.com/news/Nvidia ... ,6248.html

El texto el largo, y en ingles, asique aca les dejo un link a la versión traducida de google, ingles-> español robótico :lol:

http://translate.google.com/translate?u ... l=en&tl=es

Yenki
Admin
Mensajes: 15734
Registrado: Mié Feb 16, 2005 8:23 pm
Ubicación: La Plata, Argentina

Mensaje por Yenki » Mar Ago 26, 2008 7:49 pm

Leí el artículo que puso Lole y quería ver bien a que culpan de fallar en los chips de Nvidia.

Así que antes de comentarlo les digo lo que averigué. Tiene que ver con el proceso de fabricación de los chips.


A las obleas de silicio circulares las dividen en los bloques con los circuitos integrados que pueden ser microprocesadores, a cada parte la llaman algo así como "dado", (die en inglés).
Cada trozo de silicio con los circuitos luego lo montan sobre un sustrato y lo conectan eléctricamente. En estos últimos van a ir los contactos eléctricos que enchufamos en las placas madre en caso de las CPUs.
Estas capas, los sustratos, que contienen al microcircuito pueden ser de diferentes materiales, comúnmente son verdes.

Imagen


En los microprocesadores en general no se ve el microcircuito sino una chapa de metal que disipa la temperatura que el silicio genera, pero algunos chips sí dejan ver el dado de silicio (o die en inglés). El viejo AMD a 1 GHz es un ejemplo de los que no usaban la chapa disipadora.


Del dado de silicio deben salir contactos eléctricos que se tienen que conectar con las patas que haya en el sustrato, y ahí van soldaduras.

Este gráfico de Intel ilustra el tema (fuente) : lo que hay que mirar son los depósitos del material de la soldadura que llaman bumps en inglés y sería algo así como protuberancia.

Imagen

La foto de la derecha la tomé de nims.go.jp e ilustra como una soldadura puede romperse por fatiga del material.

En el próximo mensaje comento el artículo que indicó Lole.

Lole_JPS
Orco
Orco
Mensajes: 1783
Registrado: Mar Mar 29, 2005 5:04 pm
Ubicación: La Plata

Mensaje por Lole_JPS » Mar Ago 26, 2008 11:25 pm

Muy bueno el articulo yen, y mejores imágenes que clarifican de que estamos hablando.

Yenki
Admin
Mensajes: 15734
Registrado: Mié Feb 16, 2005 8:23 pm
Ubicación: La Plata, Argentina

Mensaje por Yenki » Jue Ago 28, 2008 11:35 am

Me alegro que te gusten las imágenes, no me fue fácil hallarlas, Lole.



Ahora voy a traducir, yo, a pedal, lo que me interesa de la nota Nvidia GPU Failures Caused By Material Problem, Sources Claim, que vos enlazaste. Y espero que con lo que puse antes se pueda interpretar mejor.

Imagen
Imagen original acá


"Hay mucha especulación en el mercado, promovida por la decisión de Nvidia de no revelar ningún detalle sobre cual es la fuente del problema. Pero el consenso general en fuentes de la industria con las que hablamos es que un problema de materiales puede ser la razón del inconveniente, y dependiendo de a quien le creas, entre 15 y 75 millones de GPUs podrían estar afectadas.


De acuerdo a nuestras fuentes, las fallas son causadas por una protuberancia de soldadura [solder bump en inglés], que conecta la terminal I/O [de entrada y salida] del chip de silicio a la plancha en el sustrato. En las GPUs (unidades de procesamiento gráfico) de Nvidia, este depósito de soldadura es creado usando plomo [sospecho que una aleación con alto contenido de plomo, que en el original llaman high-lead, lead es plomo]. Una desajuste térmico entre el chip y el sustrato ha crecido en recientes generaciones de chips, aparentemente llevando a la rotura por fatiga. Agreguen a la ecuación un creciente tamaño en los chips (duplicar las dimensiones del chip, cuadruplica la presión en la soldadura) y también chips más calientes y podés tener la tormenta perfecta para llevar a la aleación con plomo, [high lead en el original], más allá de los límites. Aparentemente, los problemas surgen a lo que Nvidia llama "temperaturas extremas" y por lo que oimos pueden ser temperaturas no mucho más arriba de 70 grados Celsius".



El autor de la nota comenta que estas creencias se ven respaldadas por el hecho de que a fines de julio Nvidia cambió el tipo de soldaduras esas con la aleación de plomo a otras llaman eutécticas. (Como las que usan los de AMD-ATI ), que sólo Nvidia sabe si la aleación de plomo es el problema.


Otro parrafito que merece traducción palabra a palabra :
"De acuerdo a nuestras fuentes, ambos los chips para computadoras de escritorio y portátiles, [notebooks en la jerga], están afectados, pero el problema es más probable que aparezca en las portátiles debido al incremento en las exigencias al material amplificado por los procesos de encendido apagado. Oimos que los chips gráficos G84, G86 y G92 podrían mostrar fallas, pero no podemos confirmar los G94".

El autor destaca que lo concreto que saben es que Nvidia cambió el tipo de soldadura, y dicen que todo lo demás es especulación.

Lole_JPS
Orco
Orco
Mensajes: 1783
Registrado: Mar Mar 29, 2005 5:04 pm
Ubicación: La Plata

Mensaje por Lole_JPS » Jue Ago 28, 2008 4:39 pm

Las aleaciones son:

High-lead: plomo(Pb) 95%, estaño(Sn) 5%

Eutectic: estaño(Sn) 63%, plomo(Pb) 37%

Yenki
Admin
Mensajes: 15734
Registrado: Mié Feb 16, 2005 8:23 pm
Ubicación: La Plata, Argentina

Mensaje por Yenki » Sab Sep 06, 2008 12:37 am

Buen dato Lole.




Demerjian en The Inquirer hace un repaso de toda la historia, esta vez centrándose más en los fundamentos de lo que hace que funcionen mal los chips de Nvidia .

Es en tres partes, sí, es largo, pero también es entendible, la primera se titula Why Nvidia's chips are defective

Es bien ilustrativa y da datos que sorprenden, un chip de 1 cm de lado puede tener 1000 soldaduras (bumps en inglés) como conexiones.
Explica como la corriente afecta estas soldaduras, habla de las diferencias entre los tipos de alto contenido de plomo, y las eutécticas.
Comenta como aplicar más voltaje implica mayores corrientes y esto aumenta la electromigración, un efecto que hace que las soldaduras pierdan material. Y no es bueno que un conductor se afine pues puede dejar de cumplir su función.
Por esto el voltaje y el calor afectan la vida útil de los componentes electrónicos, por más que a los overclockers esto no les importe.

En la segunda página de esta primera parte habla sobre dilatación y como la misma en el circuito integrado de silicio y en el sustrato que lo conecta afectan las soldaduras y ponen presiones sobre ella.

Dice que lo afecta a Nvidia es que se rompen las soldaduras en la parte vecina al sustrato , (al revés de la foto que puse arriba, allí la fractura es contra el silicio).
Y presenta a un nuevo protagonista el "relleno inferior" ( undefill en inglés), es como se me ocurre traducirlo, es lo que va en los espacios entre las soldaduras.
Al artículo le falta una imagen como esta que aclare el asunto.

Imagen

Imagen de acá.

Pero cuenta por qué es importante elegir bien el relleno.
Cómo es básico que no se superen valores máximos de corrientes que pueden afectar a las soldaduras.
Y cómo las eutécticas soportan menos corrientes que las que usan alto contenido de plomo.

La segunda parte se titula Why Nvidia's duff chips are due to shoddy engineering.
En ella habla de como el relleno se puede "derretir" y perder su rigidez si se lo calienta demasiado y no cumplir la función de proteger las soldaduras de las fracturas.

El relleno que usa Nvidia se llama Namics 8439-1, y empieza a perder su rigidez a los 60 ºC , a los 80 es 100 veces menos rígido ... (recuerden que las 8800 de mesa podían rondar los 90º C)
Explica como rotura puede ser sinónimo de estrés térmico, el cambio brusco de temperatura que daña componentes.


La tercera parte se titula What Nvidia should do now.
Y comenta que desde Dell conocían el problema hace un año y desde HP desde noviembre.

También explica por qué el problema no se ve tanto en los chips de computadoras de mesa, es por la tensión térmica, las portátiles se prenden y apagan mucho más. Y más ciclos de frío calor (apagado encendido), implican más esfuerzos en los chips defectuosos.

Traduzco un párrafo :
Las fallas de ingeniería de Nvidia ponen exagerado estrés en las partes y muchas fallas agravadas para hacer dos generaciones de partes defectuosas. Los proveedores y subcontratistas hicieron lo que les dijeron, Nvidia les dijo que hicieran las cosas mal.

Termina diciendo que cuando pasó algo así antes, la otra empresa negó los fallos - tal como Nvidia ahora- a pesar de las evidencias que los avalaban, pero terminó reconociéndolos y le costó 1100 millones de dólares.
Era Microsoft y su problema el Anillo Rojo de la Muerte en la Xbox 360 .



Este grupo de artículos pone énfasis en explicar con más detalle las causas del problema , lo hace de forma bastante accesible y permite entender mucho mejor de qué se habla , pero lo más interesante para mí fueron las referencias a las complejidades que hay a la hora de diseñar un chip, (temperaturas, distribución del calor y de las soldaduras, elección de materiales, electromigración, etc.) que no se ven habitualmente.
Me gustó.

Lole_JPS
Orco
Orco
Mensajes: 1783
Registrado: Mar Mar 29, 2005 5:04 pm
Ubicación: La Plata

Mensaje por Lole_JPS » Jue Sep 11, 2008 10:47 am

La fiesta de las demandas judiciales en USA* se suma a la problemática de Nvidia y sus chips.

http://www.tomshardware.com/news/Nvidia ... ,6345.html
A lawsuit filed in California yesterday by New York law firm Shalov, Stone, Bonner & Rocco claims Nvidia knew about the problem with defective chips and knew of any ramifications such problems might have for the financial future of the company as early as November 2007.
A similar lawsuit, but with class action status, was also announced today from the law firm of Girard Gibbs http://en.wikipedia.org/wiki/Gibbs LLP. The suit is filed on behalf of all persons and entities who acquired the common stock of Nvidia Corp. between November 8, 2007, and July 2, 2008 and cites similar complaints.
*segun tengo entendido hay mucho lio por los juicios hipotecarios (parte del quilombo de las financieras que quebraron) en ese pais.

Yenki
Admin
Mensajes: 15734
Registrado: Mié Feb 16, 2005 8:23 pm
Ubicación: La Plata, Argentina

Mensaje por Yenki » Mié Sep 24, 2008 6:18 pm

Nvidia: "el problema solamente ha surgido en unos pocos modelos específicos de notebooks"


Por un lado
Mientras desde The Inquirer Demerjian sigue con su cruzada anti-Nvidia con la nota Nvidia chipsets are defective too. ( Es llamativo como algunos lectores descreen del autor y lo atacan en los comentarios).

Lo que comenta son informes llamados Notificaciones de Cambios de Productos de los verdes -en inglés Product Change Notification (PCN)- donde se cambian los materiales de las soldaduras que comentamos antes. Para él cambiar un producto implica que hay un problema, no sé si es tan así.



Desde Nvidia
Gracias a Lole en otro tema me enteré de una entrevista al presidente y fundador de Nvidia en digitimes.com.

Imagen

Literalmente a la pregunta ¿"Puede comentar sobre los recientes problemas encontrados en los chips para computadoras portátiles"?

Jen-Hsun Huang responde:
- "El problema involucra muchas causas potenciales incluyendo disipación del calor y diseño del chip. Todas las causas están actualmente bajo investigación. Es importante destacar que el problema solamente ha surgido en unos pocos modelos específicos de notebooks.
...
Nvidia es una compañía responsable y estamos dispuestos a gastar 200 dólares para resolver un problema causado en una GPU que vale 20. Actualmente, estamos negociando con los socios retirar los productos y esperamos dar a los consumidores una solución satisfactoria".




Como pueden ver la periodista sólo le pregunta sobre un problema específico, (ignora el tema de los chips normales para video y de los conjuntos de chips). Al hacer la pregunta tan puntual, frente al presidente de Nvidia , la mujer evitó que hable de todo el tema, - o es una incapaz improvisada o una vendida a la empresa-.
Por otro lado como es lógico el directivo sólo contesta sobre ese punto.
Pero sí le creo a Demerjian cuando dice que tratan de tapar todo, no puede ser que no dé motivos, los tipos diseñan chips, si algo falla tienen que ser los primeros en averiguar qué es.
El tema se hizo público en junio y desde Nvidia quieren que creamos que más de tres meses despues siguen sin saber nada. :x
Lo que es mucho más grave si es cierto lo que dice Demerjian, respecto de que los fabricantes de computadoras portátiles sabian el tema desde noviembre del año pasado ...

Para mí el verde huele a podrido... si desde uno de los sitios de noticias informáticas más mirados mintieran sobre los productos de mi empresa yo saldría inmediatamente a refutarlos.
Cuando el presidente no dice nada y sólo habla "sin dar causas" de uno de los problemas puntuales creo tapa algo.

Responder

¿Quién está conectado?

Usuarios navegando por este Foro: No hay usuarios registrados visitando el Foro y 4 invitados