banner
Maison / Nouvelles / Intel Xeon 'Sapphire Rapids' contre AMD Ryzen Threadripper Pro
Nouvelles

Intel Xeon 'Sapphire Rapids' contre AMD Ryzen Threadripper Pro

Nov 27, 2023Nov 27, 2023

Il y a dix ans, il aurait été impensable qu'Intel rattrape aujourd'hui AMD dans les processeurs des stations de travail. Mais le succès retentissant d'AMD Ryzen Threadripper Pro, associé à l'échec d'Intel à lancer un véritable processeur de classe station de travail depuis 2019, nous a conduits à cette situation précise. Intel a désespérément besoin de ses nouveaux processeurs Xeon "Sapphire Rapids" - en particulier les Intel Xeon W-2400 et W-3400 - pour réussir.

Le géant des puces a certainement du pain sur la planche ici. Avec Threadripper Pro, AMD a fourni le Saint Graal des processeurs de station de travail, combinant un grand nombre de cœurs (jusqu'à 64) avec des fréquences turbo élevées et une bande passante à mémoire élevée pour offrir des performances impressionnantes partout où vos flux de travail peuvent vous mener - CAO monothread, multithread rendu ou simulation gourmande en mémoire, Threadripper Pro peut gérer à peu près tout ce que vous lui lancez.

Sans surprise, Intel a suivi une approche similaire pour ses nouveaux processeurs de station de travail «Sapphire Rapids» – jusqu'à 56 cœurs, jusqu'à 4,8 GHz turbo et mémoire DDR5 à 8 canaux. Il suit également AMD en termes d'architecture. Comme Threadripper Pro, les processeurs «Sapphire Rapids» présentent une conception «chiplet» où plusieurs puces plus petites sont regroupées en une seule. Cela contraste avec les conceptions monolithiques traditionnelles, où tous les cœurs sont sur une seule puce, ce qui la rend plus sujette aux défauts de fabrication, et donc à des rendements plus faibles et à des coûts plus élevés.

Intel propose une gamme de produits axée sur les stations de travail beaucoup plus large qu'AMD, avec un total de quinze modèles dans ses séries Intel Xeon W-2400 et W-3400 (voir les graphiques ci-dessous). En revanche, il n'y a que six modèles "Zen 3" Ryzen Threadripper Pro 5000 WX-Series, dotés de 12, 16, 24, 32 ou 64 cœurs. Tous ont une mémoire DDR4 3200 à 8 canaux.

Intel différencie ses familles de processeurs Xeon W-2400 et Xeon W-3400 de deux manières principales : par nombre de cœurs et par canaux mémoire.

La série Xeon W-2400 est classée comme un processeur de station de travail "grand public" avec huit modèles allant de 6 à 24 cœurs et une mémoire DDR5 4800 à 4 canaux.

Pendant ce temps, la série Intel Xeon W-3400 est destinée aux "experts" avec sept modèles allant de 12 à 56 cœurs et une mémoire DDR5 4400/4800 à 8 canaux.

Les nouveaux processeurs sont entièrement composés de cœurs "Golden Cove" - ​​ils n'ont pas l'architecture hybride Performance Core (P-Core) / Efficiency Core (E-core) lancée par les processeurs Intel Core de 12e et 13e génération.

"Golden Cove" n'est pas la dernière architecture CPU d'Intel. Il a constitué la base des P-Cores dans Intel Core de 12e génération.

Au-delà des cœurs, il existe d'autres différences importantes entre les deux familles de processeurs. Comparé à l'Intel Xeon W-2400, l'Intel Xeon W-3400 a plus de capacité de mémoire (4 To contre 2 To), plus de voies PCIe (112 contre 64) (il peut donc prendre en charge plus de GPU complémentaires), plus d'Intel Smart Cache (L3) et une puissance de base maximale plus élevée (350 W contre 225 W).

Comme première pour les processeurs Xeon, certains modèles - ceux avec un suffixe X - sont déverrouillés afin que le processeur puisse être overclocké. Une gamme de fonctionnalités de réglage est disponible via Intel Extreme Tuning Utility (Intel XTU).

Bien qu'il soit très peu probable que les principaux équipementiers empruntent la voie de l'overclocking, ce niveau de contrôle pourrait laisser les portes ouvertes aux fabricants de stations de travail spécialisées pour se différencier en extrayant plus de performances de la plate-forme. Cela pourrait être un pour l'avenir, cependant. Actuellement, nous ne connaissons pas de refroidisseurs d'eau tout-en-un (AIO) prêts à l'emploi pour les processeurs gourmands en énergie, bien que la société britannique Armari ait développé une solution de refroidissement liquide personnalisée pour sa station de travail en rack Intel Xeon W-3400. (voir encadré en bas de l'article).

Parmi la série Intel Xeon W-2400, les processeurs qui se démarquent sont les Xeon w7-2495X et w7-2475X qui combinent un nombre élevé de cœurs avec les fréquences de boost les plus élevées. Les modèles bas de gamme peuvent être adaptés à certaines analyses par éléments finis (FEA) ou à d'autres outils de simulation qui bénéficient d'une bande passante mémoire plus élevée mais ne peuvent pas nécessairement tirer parti d'un grand nombre de cœurs. Ils peuvent également fournir une plate-forme pour les flux de travail multi-GPU, tels que le rendu GPU.

Il existe un schéma similaire avec la série Intel Xeon W-3400, avec les modèles haut de gamme présentant le plus grand nombre de cœurs et les fréquences de suralimentation les plus élevées. La gamme se termine par le processeur Intel Xeon w9-3495X à 56 cœurs avec une fréquence de base de 1,9 GHz et un Turbo Boost Max 3.0 de 4,80 GHz.

Les processeurs bas de gamme de la famille, tels que l'Intel Xeon w5-3425, pourraient offrir des avantages potentiels similaires pour la simulation d'ingénierie, ainsi que la prise en charge d'encore plus de GPU. Vous pouvez voir les spécifications complètes dans les tableaux ci-dessus.

Pendant ce temps, Xeon W-2400 et Xeon W-3400 prennent en charge les dernières technologies, notamment PCIe Gen 5, la mémoire DDR5 4400/4800 (qui offre plus de bande passante mémoire que la DDR4 3200 de Threadripper Pro) et Intel WiFi 6E.

Alors que la majorité des stations de travail se concentrent sur le socket unique, les séries Intel Xeon W-2400 et Xeon W-3400 à nombre de cœurs élevé, « Sapphire Rapids » ne sonne pas la fin des stations de travail à double processeur.

Les processeurs Intel Xeon Scalable de 4e génération, qui sont principalement conçus pour les serveurs, ont déjà fait leur chemin dans les stations de travail de HP et Lenovo. Le modèle haut de gamme, l'Intel Xeon Platinum 8490H, offre 60 cœurs par processeur, ce qui vous donne un énorme 120 cœurs dans une station de travail à double socket. Cependant, parmi les principaux équipementiers, vous ne verrez cette puce que dans le Lenovo ThinkStation PX (lire notre critique) et, à 17 000 $ par processeur, le marché est quelque peu limité. Le HP Z8 G5 est également livré avec des processeurs Intel Xeon Scalable de 4e génération, mais uniquement les modèles avec jusqu'à 32 cœurs.

Pour nos tests, nous nous sommes concentrés sur les processeurs de station de travail haut de gamme d'Intel et d'AMD - l'Intel Xeon w9-3495X à 56 cœurs et l'AMD Ryzen Threadripper Pro 5995WX à 64 cœurs. Nous avons également testé l'Intel Xeon Platinum 8490H à double socket à 60 cœurs.

Vous trouverez ci-dessous les détails de nos machines de test. Cependant, il convient de noter que les deux stations de travail Lenovo étaient des unités de pré-production, elles peuvent donc être légèrement différentes des machines d'expédition finales. Les performances, par exemple, peuvent augmenter avec les mises à jour du BIOS, de sorte que nos résultats de test ne doivent pas être traités comme un évangile.

Lenovo Think Station P7

Lenovo Think Station PX

Scanner 3XS GWP-ME A1128T

Pour le dire franchement, les processeurs "Sapphire Rapids" d'Intel sont très gourmands en énergie. Les processeurs Intel Xeon w9-3495X et Intel Xeon Platinum 8490H ont une puissance de base de 350W. Mais ce n'est qu'une partie de l'histoire.

Lors du rendu dans Cinebench, par exemple, nous avons observé 530 W à la prise avec la ThinkStation P7 et 1 000 W à la prise avec la ThinkStation PX. Même lors du rendu avec un seul cœur, le Lenovo ThinkStation P7 a attiré 305 W substantiels.

Cela ne veut pas dire que le Threadripper Pro 5995WX est bien meilleur. Avec un TDP par défaut de 280 W, la station de travail Scan 3XS GWP-ME A1128T consommait toujours 474 W au niveau du socket lors du rendu dans Cinebench avec tous les 64 cœurs.

Enfin, il est important de noter que tous nos tests ont été effectués avec le plan d'alimentation Windows "performance ultime" et que la consommation électrique peut être différente avec les futures mises à jour du BIOS.

Nous avons testé les trois stations de travail avec une gamme d'applications réelles utilisées dans l'AEC et le développement de produits. Nous avons également comparé les performances des processeurs « grand public » d'Intel et d'AMD, notamment Intel Core de 12e génération (Core i9-12900K), Intel Core de 13e génération (Core i9-13900K) et AMD Ryzen 7000 Series « Zen 4 » (AMD Ryzen 7950X). ), même si nous n'avions pas de données pour tous nos benchmarks.

Conception assistée par ordinateur

La CAO n'est pas un flux de travail cible clé pour Intel 'Sapphire Rapids' ou AMD Ryzen Threadripper Pro. En fait, les architectes, ingénieurs et concepteurs qui n'utilisent que des outils de conception de pain et de beurre comme Solidworks, Inventor et Revit, seront presque certainement mieux servis par les processeurs Intel Core de 12e ou 13e génération ou AMD Ryzen 7000 (lire notre article de comparaison).

Les familles de processeurs d'entrée de gamme d'Intel et d'AMD ont généralement moins de cœurs et moins de bande passante mémoire, mais des vitesses d'horloge plus élevées et des instructions par horloge (IPC) plus élevées, qui sont importantes pour ces applications largement monothread.

Mais de nos jours, la CAO n'est souvent qu'un des nombreux outils utilisés par les architectes, les ingénieurs et les concepteurs, dont certains bénéficient d'un plus grand nombre de cœurs ou d'une bande passante mémoire plus élevée. Il est donc important de comprendre comment « Sapphire Rapids » fonctionne en CAO.

Nous avons utilisé Solidworks 2022 comme référence, une application de CAO mécanique qui est en grande partie mono-filetée ou légèrement filetée, donc n'utilise que quelques cœurs de processeur.

Comme prévu, les Intel Core i9-12900K, Intel Core i9-13900K et AMD Ryzen 7950X avaient une nette avance. Avec moins de cœurs, des fréquences turbo plus élevées et (à l'exception du Core i9-12900K) un meilleur IPC, les processeurs de station de travail haut de gamme d'Intel et d'AMD ne peuvent tout simplement pas suivre.

Le Xeon w9-3495X a montré une petite mais significative avance sur le Threadripper Pro 5995WX dans les tests de reconstruction, de conversion et de simulation. Mais le Xeon w9-3495X n'avait pas les choses à sa manière, à la traîne dans les tests de propriétés de masse et d'opérations booléennes.

Pour avoir une idée des performances pures d'un seul thread, bien que par le biais d'un test de rendu synthétique, nous avons également utilisé le benchmark Cinebench ST. Ici, le Xeon w9-3495X avait une nette avance de 22% sur le Threadripper Pro 5995WX. Fait intéressant, malgré sa fréquence turbo nettement inférieure, l'Intel Xeon Platinum 8490H n'était pas si loin derrière le processeur AMD.

Modélisation de la réalité

La modélisation de la réalité est de plus en plus répandue dans le secteur AEC. Agisoft Metashape 1.73 est un outil de photogrammétrie qui génère un maillage à partir de plusieurs photos haute résolution. Il est multithread, mais utilise plusieurs cœurs de processeur par à-coups. Il utilise également un traitement GPU, mais dans une bien moindre mesure.

Nous avons testé en utilisant une référence du fabricant américain spécialisé de stations de travail Puget Systems. Le Threadripper Pro 5995WX a à peu près devancé le Xeon w9-3495X dans le test du modèle Rock plus petit, mais était 13% plus rapide dans le test de carte scolaire plus large. Fait intéressant, le Xeon Platinum 8490H était loin du rythme. Nous nous demandons si le logiciel répartit la charge sur les deux processeurs mais n'est pas optimisé pour cela. Il est difficile d'expliquer cela par la seule fréquence inférieure.

Le logiciel de traitement des nuages ​​de points, Leica Cyclone Register 360, attribue les threads en fonction de la quantité de mémoire système. Sur une machine de 64 Go, il fonctionnera sur cinq threads et sur une machine de 128 Go ou plus, il fonctionnera sur six.

Le Threadripper Pro 5995WX était 10 % plus rapide que le Xeon w9-3495X lors de l'enregistrement de notre jeu de données de 99 Go. Les deux processeurs étaient à la traîne par rapport aux processeurs grand public d'AMD et d'Intel. Même si ces machines de test n'avaient que 64 Go de mémoire, donc ne fonctionnaient que sur 5 threads, leurs fréquences plus élevées et leur IPC leur donnaient la tête.

Le rendu

Le rendu du lancer de rayon est hautement évolutif. En gros, doublez le nombre de cœurs de processeur pour réduire de moitié le temps de rendu (si les fréquences sont maintenues).

Le Threadripper Pro 5995WX a largement surpassé le Xeon w9-3495X dans KeyShot et V-Ray, deux des outils les plus populaires pour la visualisation de conception, et dans Cinebench 23, la référence pour Cinema4D. Le Threadripper Pro 5995WX était 35% plus rapide dans Keyshot, 27% plus rapide dans V-Ray et 20% plus rapide dans Cinebench. C'est une avance considérable.

Mais l'avantage que détient le processeur de station de travail haut de gamme d'AMD sur le Xeon w9-3495X n'est pas seulement dû à ses 8 cœurs supplémentaires. L'efficacité énergétique relative des deux processeurs et, par conséquent, les fréquences de tous les cœurs qu'ils peuvent maintenir, ont un impact majeur sur les performances.

Dans Cinebench, par exemple, le Threadripper Pro 5995WX a maintenu 3,05 GHz sur les 64 cœurs tandis que le Xeon w9-3495X est descendu à 2,54 GHz. La relation du Xeon w9-3495X entre la puissance, la fréquence et les threads peut être vue plus en détail dans les graphiques ci-dessous.

Pendant ce temps, le double Intel Xeon Platinum 8490H a considérablement battu les deux processeurs à socket unique. Mais avec 120 cœurs et 240 threads pour jouer avec, cela n'a rien de surprenant.

Simulation d'ingénierie

La simulation d'ingénierie comprend l'analyse par éléments finis (FEA) et la dynamique des fluides computationnelle (CFD). La FEA peut aider à prédire comment un produit réagit aux forces ou aux températures du monde réel. La CFD peut être utilisée pour optimiser l'aérodynamisme des voitures ou prédire l'impact du vent sur les bâtiments. Les deux types de logiciels sont extrêmement exigeants en termes de calcul.

Il existe de nombreux types de « solveurs » différents utilisés dans FEA et CFD et chacun se comporte différemment, tout comme les différents ensembles de données.

En général, la CFD évolue très bien et les études devraient être résolues beaucoup plus rapidement avec plus de cœurs de processeur. Il est important de noter que la CFD peut également bénéficier grandement de la bande passante mémoire, car chaque cœur de processeur peut être alimenté en données plus rapidement. C'est un domaine dans lequel 'Sapphire Rapids' peut surpasser Threadripper Pro. Les deux ont une mémoire à 8 canaux, mais "Sapphire Rapids" utilise une DDR5 plus rapide à 4 800 MHz, tandis que Threadripper Pro utilise une DDR4 à 3 200 MHz.

Pour nos tests, nous avons utilisé trois charges de travail sélectionnées du benchmark SPECworkstation 3.1. Cela comprend deux benchmarks CFD (Rodinia, qui représente l'écoulement compressible, et WPCcfd, qui modélise la combustion et la turbulence) et un benchmark FEA (CalculiX, qui modélise la température interne d'une turbine de moteur à réaction).

À Rodinia, le Xeon w9-3495X a surpassé le Threadripper Pro 5995WX de 101 %. Dans WPCcfd, l'avance était plus petite mais, à 13%, toujours significative. Les performances des deux processeurs ont été éclipsées par le double processeur Intel Xeon Platinum 8490H.

Les deux processeurs Intel se sont bien moins bien comportés lors du test Calculix (FEA), où le Threadripper Pro 5995WX a pris une avance substantielle.

Outre les cœurs, la bande passante mémoire est l'un des principaux différenciateurs entre les processeurs de station de travail et leurs homologues grand public.

Ceci est régi en grande partie par le nombre de canaux mémoire pris en charge par chaque processeur, mais également par le type de mémoire.

Les canaux de mémoire agissent comme des voies entre la mémoire système et le CPU. Plus un CPU a de canaux, plus les données peuvent être livrées rapidement.

Intel Core de 13e génération et la série AMD Ryzen 7000 ont deux canaux de mémoire, tandis que la série Intel Xeon W-2400 en a quatre, et la série Intel Xeon W-3400, la série Intel Xeon Scalable de 4e génération et la série Threadripper Pro 5000 en ont toutes huit. Pour obtenir la pleine bande passante mémoire, tous les canaux mémoire doivent être remplis de modules mémoire, comme c'était le cas avec toutes nos machines de test.

Comme mentionné précédemment, les Xeons "Sapphire Rapids" ont un avantage sur la série AMD Ryzen Threadripper 5000 car ils prennent en charge une mémoire plus rapide - DDR5 4 800 MHz par rapport à DDR4 3 200 MHz.

Une analyse rapide du benchmark SiSoft Sandra montre la bande passante mémoire comparative à laquelle on peut s'attendre. Le Threadripper Pro 5995WX a enregistré 139,27 Go/sec, tandis que l'Intel Xeon w9-3495X a tiré 184,64 Go/sec et le double Intel Xeon Platinum 8490H est monté à 325,6 Go/sec. Ces chiffres aident à expliquer pourquoi Sapphire Rapids réussit si bien dans nos benchmarks CFD gourmands en mémoire.

Pour voir comment la bande passante mémoire affecte les performances dans différents flux de travail, nous avons testé le Xeon w9-3495X avec une variété de configurations de mémoire différentes, de 1 canal avec un seul module DIMM de 32 Go, jusqu'à 8 canaux avec 8 x 32 Go. DIMM. Fait intéressant, même avec 6 canaux, le Xeon w9-3495X a devancé le Threadripper Pro 5995WX en termes de bande passante mémoire, offrant 141,21 Go/sec dans SiSoft Sandra.

Comme la plupart de nos benchmarks tiennent dans 32 Go de mémoire, le fait que nous ayons réduit la capacité devrait avoir un impact minimal sur les résultats, bien qu'il ne puisse être ignoré complètement. L'exception est notre test Leica Cyclone Register 360, qui ajuste le nombre de cœurs utilisés par rapport à la mémoire système. C'est pourquoi les performances chutent massivement avec 32 Go.

Comme vous pouvez le voir dans les graphiques ci-dessous, la bande passante mémoire dans le benchmark WPCcfd a un impact considérable sur les performances. Fait intéressant, même avec 6 canaux remplis, l'Intel Xeon w9-3495X surpasse l'AMD Ryzen Threadripper Pro 5995WX.

Un autre flux de travail massivement influencé par la bande passante mémoire est la recompilation des shaders dans Unreal Engine 4.26 qui utilise tous les cœurs disponibles. Cependant, là où Threadripper Pro 5995WX perd en Go/sec, il compense en cœurs et en fréquence tous cœurs, car il a quand même réussi à battre le Xeon w9-3495X dans notre benchmark automobile.

Les performances en CAO (Solidworks), en rendu de lancer de rayons (V-Ray) et en modélisation de la réalité (Leica Cyclone Register 360 et Agisoft MetaShape Professional 1.73) ne semblent pratiquement pas affectées par la bande passante mémoire. Il y a quelques mises en garde dans Solidworks. Dans le test de simulation, les performances ont un peu chuté en passant de 4 canaux à 1 canal. Dans les opérations booléennes, la mémoire à 1 canal a en fait donné des résultats légèrement meilleurs.

L'importance pour Intel du succès des Xeon W-2400 et Xeon W-3400 « Sapphire Rapids » ne peut être surestimée. Au cours des dernières années, AMD a eu peu de concurrence dans les flux de travail qui bénéficient de nombreux cœurs ou d'une bande passante mémoire élevée. Intel aura certainement ressenti l'impact de Threadripper Pro.

D'après nos tests, cependant, Sapphire Rapids ne sera pas le tueur de la série Threadripper Pro 5000 WX que nous pensions qu'il pourrait être, du moins dans le secteur AEC plus large.

En rendu de lancer de rayons, le Threadripper Pro 5995X à 64 cœurs a toujours une avance considérable sur le Xeon w9-3495X à 56 cœurs. Et bien qu'Intel puisse éventuellement l'emporter à certains prix, simplement parce qu'il a tant de modèles différents dans ses familles Xeon W-2400 et W-3400, nous ne nous attendons certainement pas à ce que les spécialistes de viz passent massivement à « Sapphire Rapids ». De plus, au fur et à mesure que vous descendez dans la gamme, il sera confronté à plus de concurrence de la part d'Intel Core de 13e génération.

Mais 'Sapphire Rapids' a de gros avantages. Dans les flux de travail à un seul thread, il semble avoir une longueur d'avance sur Threadripper Pro, ce qui pourrait faire une réelle différence dans certaines applications CAO/BIM. De meilleures performances à un seul thread devraient également augmenter les fréquences d'images 3D dans les applications limitées par le processeur.

Le plus grand avantage potentiel de « Sapphire Rapids » provient de la simulation d'ingénierie, en particulier de la CFD. Nos tests montrent que 'Sapphire Rapids' peut offrir une amélioration massive des performances, en grande partie grâce à sa bande passante mémoire supérieure. Bien que les solveurs et les ensembles de données varient, les utilisateurs sérieux d'outils d'Ansys, d'Altair et d'autres devraient certainement explorer ce que les processeurs Xeon W-3400 et Intel Xeon Scalable de 4e génération peuvent faire pour eux. L'exécution de simulations extrêmement complexes peut prendre des heures, voire des jours. Réduire ce temps de moitié pourrait apporter des avantages monumentaux à un projet.

Tout cela est passionnant, mais on ne peut s'empêcher de garder un œil sur l'avenir. AMD devrait lancer sa prochaine génération de processeurs Threadripper Pro "Zen 4" plus tard cette année. Et, si les rumeurs de 96 cœurs et de mémoire à 12 canaux (DDR5) deviennent réalité, alors toute piste qu'Intel pourrait avoir pourrait être de courte durée.

Faites défiler vers le bas pour lire et vous abonner ici

Avec

Lenovo ThinkStation P7 Lenovo ThinkStation PX Scan 3XS GWP-ME A1128T Conception assistée par ordinateur Modélisation de la réalité Rendu Simulation d'ingénierie
Envoyer une demande
Envoyer