Pourquoi Nvidia et AMD ne vendent-ils pas leurs GPU aux utilisateurs finaux comme le fait Intel avec ses CPU ?
Sommaire
Je vais d’abord donner une raison technique, puis une raison commerciale.
Raison technique :
Le CPU Socket est ce qui permet à Intel (et AMD aussi), de vendre leurs CPU aux utilisateurs finaux.
Le CPU Socket permet aux utilisateurs finaux d’acheter une carte mère, un dissipateur thermique pour CPU, etc. séparément du CPU, puis d’installer le CPU de leur choix dans la carte mère et d’installer le dissipateur thermique du CPU de manière appropriée. (bien sûr, ladite carte mère doit disposer d’un socle de CPU compatible et d’un support FW pour le CPU).
Si le client devait souder le CPU sur la carte mère, ce ne serait pas pratique. Il pourrait tout aussi bien acheter la carte mère avec un CPU soudé, directement, la difficulté de souder une grande puce comme le CPU est au-delà de celle d’un utilisateur final typique. (En outre, il est assez facile de retirer un processeur d’un socle, mais pas de le dessouder d’une carte mère).
Dans ce cas, pourquoi les cartes graphiques (GPU) ne sont-ils pas généralement vendus pour être enfichés dans les supports des cartes mères ?
C’est possible. L’une des principales raisons est que les GPU ont besoin de RAM, tout comme les CPU (appelons-la “DRAM” pour cet exemple), mais la “VRAM” (Video RAM) utilisée par les GPU doit être très rapide, pour faire le genre de choses que les GPU font bien, bien. Pour que la VRAM atteigne cette vitesse, le socle est un obstacle.
Si l’on compare la vitesse de l’interface entre un GPU soudé et des puces VRAM soudées, à celle d’un CPU soudé et d’une DRAM soudée :
- CPU->DRAM, DDR4-2133 à 2667, 2.667 GT/s, 64 bits * 2 = 128 bits
- GPU->VRAM, GDDR6 (10-18 Gbps), 18 GT/s, 256 à 384 bits.
Une interface commune entre le processeur et la DRAM est aujourd’hui la DDR4, avec des vitesses de 2133 à 2667 MHz.
Vous voyez la grande différence de vitesse et de largeur ? Un processeur typique aura 2 canaux de 64 bits aux vitesses DDR4, ce qui équivaut à 2,667 gigatransferts/seconde pour chaque bit.
Un GPU haut de gamme typique possède un bus de 256 à 384 bits vers la VRAM à des vitesses GDDR6, qui peut atteindre 18 Gbps, soit 18 gigatransferts/seconde.
Pour atteindre ce type de vitesse et de largeur entre le GPU et sa VRAM, l’interface doit être soudée. Pour diverses raisons liées à l’intégrité du signal et au routage de la carte, les prises rendront la chose difficile à réaliser, ce qui n’est donc pas pratique.
Vous pourriez vous demander si le CPU ne souffre pas de la lenteur de l’interface DRAM. Oui, mais cela est très bien masqué par le cache du CPU (L1, L2, LLC) dans le CPU, de sorte que dans une situation optimale avec des charges de travail typiques du CPU, les caches peuvent maintenir un taux de réussite du cache supérieur à 90 %, c’est-à-dire que la plupart des accès du CPU à la DRAM peuvent être satisfaits par le cache.
Une charge de travail typique d’un GPU ne peut pas être mise en cache de la même manière, elle a juste besoin d’un accès rapide à sa VRAM. (On pourrait dire que la VRAM est un grand cache pour le GPU et que l’alternative est d’accéder à la DRAM du CPU).
Donc, si un GPU doit être soudé à une carte avec sa VRAM, à ce moment-là, la carte sera assez grande pour être connectée comme un CPU. Techniquement parlant, il n’est pas pratique de construire le GPU sur un socket et de le faire fonctionner aux vitesses qu’il atteint.
Il n’en reste pas moins que les GPU sont vendus séparément, et c’est ce qu’on appelle une carte vidéo ! L’ensemble complet du GPU, de la VRAM et du bloc d’alimentation pour les deux sont regroupés sur une carte qui est vendue comme une carte vidéo, que vous pouvez acheter.
Raison commerciale :
nVidia et AMD doivent certainement fabriquer des cartes vidéo au départ pour pouvoir tester leurs GPU.
Mais, au lieu de vendre des cartes vidéo directement à l’utilisateur final, ils trouvent qu’il est préférable, en tant que petite entreprise, d’établir une relation avec divers fabricants de cartes, à qui ils transmettent ensuite leur “conception de référence d’une carte vidéo”, pour qu’ils conçoivent une variété de cartes autour des GPU, peut-être avec diverses combinaisons d’alimentation, de VRAM et de spécifications GPU.
Étant donné qu’une grande partie d’une carte vidéo n’est pas seulement le GPU, mais aussi tout le reste, comme la fourniture de la carte, de l’alimentation et de la VRAM, nVidia et AMD préfèrent ne pas se lancer dans la construction, la vente et le support des cartes, mais se contenter de concevoir des GPU, de les faire construire et de les vendre aux fabricants de cartes, puis de laisser ces derniers les incorporer dans les cartes et les vendre en tant que cartes vidéo, ainsi que de s’occuper individuellement du support des utilisateurs finaux.
nVidia et AMD préféreraient n’avoir qu’un nombre beaucoup plus restreint de relations avec les gros clients de GPU, tous les autres pouvant les acheter en tant que cartes vidéo ou ordinateurs avec les GPU intégrés et, en cas de problème d’assistance, ils appelleront le fabricant de l’ordinateur ou de la carte vidéo.