Comprendre le module optique 400g
Dec 16, 2025|
LeModule optique 400Greprésente un changement fondamental dans la façon dont les centres de données conçoivent leur structure d'interconnexion. Fonctionnant à 400 Gigabits par seconde, ces émetteurs-récepteurs utilisent la signalisation PAM4 (Pulse Amplitude Modulation 4-niveau) sur huit voies électriques-chacune fonctionnant à 50 Gbit/s-pour regrouper une bande passante qui aurait nécessité quatre liaisons 100G distinctes il y a quelques années à peine. La norme IEEE 802.3bs régit ces spécifications, et les principaux groupes MSA, notamment QSFP-DD et OSFP, ont conduit des définitions de facteurs de forme concurrentes qui continuent de façonner les décisions d'approvisionnement des opérateurs hyperscale et des réseaux d'entreprise.

Pourquoi 400G s'est produit quand c'est arrivé
Il existe une certaine inévitabilité de la progression de la bande passante à laquelle les vétérans de l'industrie s'attendent. Le passage de 10G à 40G semblait alors important. Puis le 100G est arrivé et tout à coup, tout le monde parlait d'architectures spine-feuilles et de modèles de trafic est-ouest. Mais 400G ? Cette transition a été différente.
Le schéma de modulation NRZ qui nous a bien servi du 1G au 25G ne pouvait tout simplement pas évoluer économiquement au-delà de 100G. La physique est devenue chère. L'intégrité du signal est devenue un cauchemar. Techniquement, vous pourriez pousser plus fort NRZ, bien sûr-mais les courbes de coûts n'avaient aucun sens pour un déploiement en volume. L’industrie s’est donc tournée vers PAM4.
Ce que fait PAM4-et cela vaut la peine d'être compris si vous spécifiez une infrastructure-c'est d'encoder deux bits par symbole au lieu d'un. Quatre niveaux d'amplitude au lieu de deux. Deux fois le débit de données sans doubler le débit en bauds. Le compromis ? Votre rapport signal-sur-bruit prend environ 10 dB par rapport au NRZ. Ce n'est pas anodin. C'est pourquoi chaque module 400G est livré avec une correction d'erreur directe intégrée, et pourquoi le DSP (processeur de signal numérique) est devenu un composant si essentiel dans ces émetteurs-récepteurs.

La guerre des facteurs de forme
Cela fait des années que je regarde le débat QSFP-DD contre OSFP se dérouler lors de salons professionnels et lors de réunions d'approvisionnement. Les deux parties ont des arguments valables. Ni l’un ni l’autre n’ont définitivement gagné.
QSFP-DD est issu de l'alliance QSFP-DD MSA avec la rétrocompatibilité comme fonctionnalité phare. Vous avez un tas de modules QSFP28 que vous n'êtes pas prêt à remplacer ? Ils s'inséreront directement dans une cage QSFP-DD. Les dimensions -18,35 mm de largeur et 89,4 mm de longueur gardent le facteur de forme familier. Vous pouvez installer 36 ports dans un panneau avant 1U. Cela représente 14,4 Tbit/s de débit global si vous remplissez chaque emplacement. Pour les opérateurs effectuant une mise à niveau progressive, cela est extrêmement important.
OSFP a adopté une approche différente. Le groupe Octal Small Form-factor Pluggable a déclaré : oublions la rétrocompatibilité, optimisons la gestion thermique et l'évolutivité future. Avec une largeur de 22,58 mm et une longueur de 107,8 mm, les modules OSFP ont plus de surface pour la dissipation thermique. Ils prennent en charge des enveloppes de puissance allant jusqu'à 15-20 watts par rapport au plafond de 12 à 15 W du QSFP-DD. Lorsque vous utilisez une optique cohérente ou que vous prévoyez 800G, cette marge devient pertinente.
NVIDIA a opté-sur OSFP pour sa plate-forme Quantum-2 InfiniBand. Ce n'est pas rien. Mais les commutateurs d'entreprise de Cisco et Arista sont toujours principalement équipés de ports QSFP-DD.
Ce que signifient réellement les lettres
Si vous avez déjà regardé une fiche technique en vous demandant pourquoi le DR4 coûte moins cher que le FR4 alors qu'il s'agit tous deux de « modules 400G », vous n'êtes pas seul. La nomenclature suit des modèles, mais ces modèles ont des exceptions et les exceptions ont leur propre logique.
- SR (courte portée): Fibre multimode, longueur d'onde 850 nm. Le 400G-SR8 utilise huit voies parallèles de 50G PAM4 sur un connecteur MPO-16. La portée atteint environ 100 mètres sur la fibre OM4 -70 mètres sur la fibre OM3. Il existe également le SR4, qui intègre 100G dans chacune des quatre voies en utilisant des VCSEL plus rapides. Même portée, moins de fibres. La variante 400G-SR4.2 (parfois appelée BIDI) devient intelligente avec une transmission bidirectionnelle, exécutant deux longueurs d'onde dans chaque direction pour atteindre 400G sur seulement quatre fibres.
- DR4 : Fibre monomode-, 1 310 nm, 500 mètres. Il s'agit du cheval de bataille pour les connexions intra-centre de données plus longues que ce que SR peut gérer. Chacune des quatre voies optiques transporte 100G PAM4 sur une paire de fibres dédiée. Connecteur MPO-12. La capacité de dérivation ici est significative : - un DR4 peut se diviser en quatre liaisons 100G-DR indépendantes, ce qui facilite la connexion d'équipements 100G existants.
- FR4 : Deux kilomètres, mode unique-. C'est ici que l'architecture de la boîte de vitesses gagne sa place. Le module prend huit voies électriques 50G, les convertit en quatre voies optiques 100G via DSP, puis multiplexe en longueur d'onde-les quatre sur une seule paire de fibres en utilisant l'espacement CWDM4 (1271, 1291, 1311, 1331 nm). Connecteur LC duplex. Câblage beaucoup plus soigné que l'approche parallèle de DR4.
- LR4 et au-delà: Même schéma de longueur d'onde que FR4, mais optimisé pour une portée de 10 km. ER4 pousse à 40km. Le ZR4 atteint 80 km mais nécessite une détection cohérente-une technologie entièrement différente, un prix différent, un cas d'utilisation différent. La norme 400ZR d'OIF cible spécifiquement les applications métropolitaines DCI où vous avez besoin d'une optique cohérente enfichable dans une plaque frontale de commutateur.

La question DSP
Chaque émetteur-récepteur 400G contient un processeur de signal numérique. Chacun. Ce n'est pas facultatif-La modulation PAM4 ne fonctionne tout simplement pas sans un conditionnement sophistiqué du signal.
Concrètement, que fait le DSP ? Égalisation-feedforward pour compenser la perte de canal. Égalisation du retour de décision pour les interférences inter-symboles. Récupération d'horloge et de données pour extraire la synchronisation du signal reçu. Codage FEC à l'émission, décodage FEC et correction d'erreur à la réception. Dans les modules cohérents, ajoutez à cette liste la compensation de la dispersion chromatique et la gestion de la dispersion du mode de polarisation.
Le DSP consomme de l'énergie. Beaucoup. Dans de nombreux modules 400G, le DSP représente plus de la moitié de la consommation électrique totale. Marvell, Broadcom et Inphi (qui font désormais partie de Marvell) sont en concurrence pour réduire les nœuds de processus et améliorer l'efficacité. Le passage des DSP de 7 nm à 5 nm a généré des économies d'énergie significatives-de l'ordre de 20 % pour des fonctionnalités équivalentes.
Un débat est en cours sur la question de savoir si les DSP devraient être intégrés dans l'ASIC du commutateur lui-même (ce que certains appellent « optiques linéaires enfichables » ou LPO). L'argument est le suivant : si vous effectuez déjà un traitement du signal sur le commutateur, pourquoi le reproduire dans chaque émetteur-récepteur ? Le contre-argument-implique l'interopérabilité des modules et les défis pratiques liés à la qualification des optiques sur différentes plates-formes de commutation. Celui-ci va se jouer au cours des prochaines années.
La photonique sur silicium entre en scène
Vous vous souvenez quand tout le monde pensait que les lasers InP (phosphure d'indium) domineraient le 400G ? Le récit a changé.
Intel et Cisco ont parié très tôt sur la photonique sur silicium-en intégrant des composants optiques sur des substrats en silicium à l'aide de processus de fabrication CMOS standards. La promesse a toujours été une question de coût à grande échelle. L'optique discrète traditionnelle nécessite l'assemblage manuel de puces laser, de modulateurs et de photodétecteurs, chacun étant constitué de matériaux différents. La photonique sur silicium vous permet de construire une grande partie du moteur optique sur une seule puce.
Les modules photoniques sur silicium 400G-DR4 livrés aujourd'hui offrent des performances économiques intéressantes pour les déploiements à grande échelle. Ils ne sont pas encore universellement moins chers que les alternatives basées sur EML---, mais la trajectoire des coûts favorise le silicium à mesure que les rendements des usines s'améliorent. La consommation électrique en profite également, en particulier dans la section modulateur.
Cela dit, le silicium fait un laser médiocre. Le problème de la bande interdite indirecte n’a pas été résolu. Ainsi, même les modules photoniques sur silicium utilisent généralement une puce de gain externe InP ou GaAs, hybride-intégrée à la plate-forme silicium. C'est une ingénierie élégante, mais la « photonique sur silicium » reste une terminologie quelque peu ambitieuse.
Réalités énergétiques et thermiques

Un commutateur 400G entièrement équipé chauffe. Il n'y a aucun moyen de contourner cela.
Considérez : 32 ports de modules 400 G-DR4, chacun consommant 10 à 12 watts. Cela représente 320-384 W uniquement pour les émetteurs-récepteurs, avant de tenir compte du commutateur ASIC, de la mémoire, des ventilateurs et des pertes de conversion de puissance. La densité thermique dans un centre de données moderne a doublé au cours des cinq dernières années. Les équipes des installations nous détestent.
Le facteur de forme plus grand d'OSFP répond à cette surface légèrement-plus grande, à de meilleurs canaux de circulation d'air et à des conceptions de dissipateurs thermiques intégrés qui peuvent s'interfacer directement avec les systèmes de refroidissement des commutateurs. Les modules QSFP-DD s'appuient davantage sur l'architecture thermique de l'équipement hôte. Ni l'un ni l'autre n'est "faux", mais les considérations thermiques doivent absolument éclairer votre décision en matière de facteur de forme si vous construisez pour des charges de travail soutenues à bande passante élevée-.
Le refroidissement par air atteint ses limites pratiques pour ces densités. Le refroidissement liquide-des plaques froides sur les ASIC de commutation, potentiellement immergées pour des racks entiers-n'est plus exotique. Il s'agit simplement d'une infrastructure coûteuse que les organisations d'installations apprennent encore à spécifier et à entretenir.
Scénarios d'évasion
Une fonctionnalité qui ne reçoit pas suffisamment d'attention : les modules 400G peuvent souvent être configurés pour une opération de dérivation, se présentant comme plusieurs interfaces à débit inférieur-avec le système hôte.
Un 400G-SR8 peut devenir deux liens 200G-SR4, ou deux liens 100G-SR4 fonctionnant à moitié débit, ou même huit canaux 50G indépendants (la variante "canalisée" ou SR8-C). Un 400G-DR4 peut se diviser en quatre connexions 100G-DR, ce qui est utile lorsque vous devez connecter un port de commutateur 400G à quatre serveurs 100G distincts.
Le câblage devient intéressant ici. Un harnais de dérivation duplex MPO-12 vers 4xLC prend un seul port DR4 et le répartit sur quatre paires SMF indépendantes. Les architectes réseau apprécient cette flexibilité, mais les implications en matière de gestion des câbles sont réelles. Votre plan de câblage structuré doit tenir compte des scénarios de rupture dès le premier jour, sinon vous utiliserez des câbles de raccordement ad hoc six mois après le déploiement.
Ce que 800G signifie pour 400G
Le secteur évolue rapidement. 800Les émetteurs-récepteurs G sont désormais livrés-principalement des variantes SR8 et DR8 pour les interconnexions de clusters IA. Est-ce que cela rend le 400G obsolète ? Pas même proche.
L'écosystème 400G a mûri. Les coûts des modules ont considérablement baissé. L'interopérabilité entre les fournisseurs est bien-établie. Pour la majorité des besoins en matière de réseaux d’entreprise et cloud, la 400G représente le compromis idéal en termes de performances, de coût et de familiarité opérationnelle. Cela restera le jeu de volume pour les tissus feuille-épine dorsale et la connectivité générale-des centres de données pendant des années.
Le 800G et éventuellement le 1,6T domineront dans les environnements IA/ML où les GPU doivent déplacer les données d'entraînement à des rythmes absurdes. Marché différent, exigences différentes, conversations budgétaires différentes. La plupart des réseaux n’auront pas besoin de suivre cette courbe.

Considérations pratiques sur lesquelles personne n’écrit
Certaines choses ont été apprises à nos dépens :
La compatibilité EEPROM du module est plus importante que ce que les fournisseurs l'admettent. Les émetteurs-récepteurs « compatibles » qui fonctionnent correctement dans un modèle de commutateur peuvent générer des erreurs dans un autre avec le même ASIC mais un micrologiciel différent. Intégrez du temps de test lors de la qualification des optiques-tiers.
Le connecteur LC sur les modules FR4 et LR4 est duplex-deux fibres au total-mais le connecteur MPO sur DR4 et SR8 utilise un polissage APC (contact physique angulaire). Le mélange des connecteurs APC et UPC vous permettra d'obtenir une perte de retour de plus de 20 dB et des erreurs intermittentes. Le codage couleur existe pour une raison.
Les modules PAM4 de différents fabricants peuvent avoir des implémentations FEC subtilement différentes. Les normes laissent place à l’interprétation. Si vous constatez un nombre d'erreurs corrigées inexplicablement élevé sur un lien, essayez d'échanger une extrémité contre un module du même -fournisseur avant de blâmer l'usine de fibre.
La température compte. Ces modules sont conçus pour des températures de boîtier allant généralement jusqu'à 70 degrés, mais les performances se dégradent avant d'atteindre ce plafond. Gardez-les au frais si vous souhaitez un comportement cohérent.
La voie à suivre
Les modules optiques 400G sont passés d’une infrastructure de pointe à une infrastructure grand public. Les décisions technologiques -QSFP-DD contre OSFP, parallèle contre WDM, silicium contre optique discrète-ne comportent plus le même risque qu'il y a trois ans. Des chaînes d’approvisionnement robustes existent. Plusieurs fournisseurs qualifiés sont en concurrence sur les prix et les fonctionnalités. Les organismes de normalisation ont résolu la plupart des cas extrêmes en matière d’interopérabilité.
Pour les architectes réseau qui planifient des déploiements aujourd'hui, le cadre de choix est simple : faites correspondre le facteur de forme à votre stratégie de plate-forme de commutation, sélectionnez le type d'émetteur-récepteur (SR/DR/FR/LR) en fonction des exigences de portée réelles et ne dépassez pas les-spécifications. Un 400G-LR4 coûte beaucoup plus cher qu'un 400G-DR4 : si vos courses les plus longues mesurent 300 mètres, vous brûlez votre budget sans aucun avantage opérationnel.
Les prochaines années apporteront des améliorations progressives : des DSP à faible consommation, de meilleurs rendements photoniques sur silicium, peut-être une certaine standardisation autour des architectures linéaires enfichables. Mais la plate-forme technologique fondamentale s'est stabilisée.. 400G n'émerge plus. Il ne s'agit désormais que d'infrastructures-du genre que vous pouvez planifier en toute confiance.
Et honnêtement ? Après le chaos du début de l’ère 100G, cette prévisibilité mérite d’être appréciée.


