El Intel Gaudi 3 es un ace­le­ra­dor de in­te­li­ge­n­cia ar­ti­fi­cial (IA) de alto re­n­di­mie­n­to, diseñado es­pe­cí­fi­ca­me­n­te para tareas de IA exigentes. El Gaudi 3 se fabrica con un proceso de 5 na­nó­me­tros, cuenta con 64 núcleos Tensor y ofrece el doble de re­n­di­mie­n­to en FP8 y cuatro veces más potencia de cálculo en IA que su pre­de­ce­sor. Por ello, el Intel Gaudi 3 es ideal para tareas de in­fe­re­n­cia y para el en­tre­na­mie­n­to de grandes modelos de IA.

¿Cuáles son las ca­ra­c­te­rí­s­ti­cas de re­n­di­mie­n­to del Intel Gaudi 3?

Con el Gaudi 3, Intel establece nuevos es­tá­n­da­res en cuanto a re­n­di­mie­n­to y efi­cie­n­cia ene­r­gé­ti­ca. El ace­le­ra­dor de IA se basa en la ar­qui­te­c­tu­ra del Gaudi 2, pero ofrece un re­n­di­mie­n­to de pro­ce­sa­mie­n­to mucho mayor, un ancho de banda de memoria superior y mejor efi­cie­n­cia ene­r­gé­ti­ca. A co­n­ti­nua­ción, en­co­n­tra­rás un resumen de las pri­n­ci­pa­les ca­ra­c­te­rí­s­ti­cas de re­n­di­mie­n­to del Intel Gaudi 3:

  • Re­n­di­mie­n­to en FP8: el Gaudi 3 alcanza un re­n­di­mie­n­to en FP8 de 1,835 PFLOPS. Su pre­de­ce­sor superaba li­ge­ra­me­n­te los 0,8 PFLOPS, lo que significa que el re­n­di­mie­n­to para cálculos en FP8 se ha más que duplicado.
  • Re­n­di­mie­n­to en BF16: en cálculos BF16, el Intel Gaudi 3 también alcanza 1,835 PFLOPS, lo que re­pre­se­n­ta una cua­dru­pli­ca­ción del re­n­di­mie­n­to en co­m­pa­ra­ción con el Gaudi 2.
  • Ancho de banda de red: el ancho de banda bi­di­re­c­cio­nal de la red se ha duplicado a 1200 gigabits por segundo, lo que permite una co­mu­ni­ca­ción más rápida entre los nodos en sistemas de clústeres de IA.
  • Capacidad y ancho de banda de HBM: con su memoria HBM de 128 gigabytes, el Gaudi 3 ofrece un 50 % más de ancho de banda de memoria que la ge­ne­ra­ción anterior. El ancho de banda de HBM de 3,7 terabytes por segundo supone un aumento del 33 %.
Nota

PFLOPS (Peta Floating Point Operations per Second u ope­ra­cio­nes en punto flotante por segundo en español) es una unidad que describe la velocidad de pro­ce­sa­mie­n­to de los or­de­na­do­res. El su­pe­r­co­mpu­tador “Roa­dru­n­ner”, de­sa­rro­lla­do por IBM, fue el primero en superar el umbral de PFLOPS en 2008.

El Intel Gaudi 3 dispone de dos compute dies (unidades de pro­ce­sa­mie­n­to es­pe­cia­li­za­das) que incluyen 64 núcleos de pro­ce­sa­dor Tensor y 8 MMEs (Matrix Mu­l­ti­pli­ca­tion Engines para pro­ce­sa­mie­n­to paralelo). Los 24 puertos RDMA-NIC, cada uno con 200 gigabits por segundo, permiten una co­mu­ni­ca­ción rápida a través de redes Ethernet es­ta­n­da­ri­za­das.

Ventajas y de­s­ve­n­ta­jas del Intel Gaudi 3

El uso de un ace­le­ra­dor de IA de la ge­ne­ra­ción Gaudi 3 ofrece diversas ventajas. Entre los pri­n­ci­pa­les be­ne­fi­cios se en­cue­n­tran:

  • Alto re­n­di­mie­n­to: con 1,835 PFLOPS de re­n­di­mie­n­to en FP8 y BF16, el Intel Gaudi 3 ofrece una enorme capacidad de pro­ce­sa­mie­n­to, similar al nivel de re­n­di­mie­n­to de la NVIDIA H100, que es co­n­si­de­ra­ble­me­n­te más cara. Según un co­mu­ni­ca­do de prensa de Intel, el ace­le­ra­dor de IA de la empresa supera al buque insignia de NVIDIA en algunas áreas de re­n­di­mie­n­to.
  • Alta efi­cie­n­cia ene­r­gé­ti­ca: la fa­bri­ca­ción de los ace­le­ra­do­res de IA Gaudi 3 se realiza mediante un proceso de 5 na­nó­me­tros (por TSMC), lo que permite una mayor densidad de re­n­di­mie­n­to. Esto reduce el consumo de energía y disminuye los costos ope­ra­ti­vos en los centros de datos.
  • Es­ca­la­bi­li­dad rentable de IA: con el Intel Gaudi 3, los sistemas pueden escalarse vertical y ho­ri­zo­n­ta­l­me­n­te de manera flexible, lo que resulta es­pe­cia­l­me­n­te ventajoso en im­ple­me­n­ta­cio­nes complejas.
  • Soporte para es­tá­n­da­res abiertos: dado que el Gaudi 3 es co­m­pa­ti­ble con es­tá­n­da­res abiertos, los ace­le­ra­do­res de IA se pueden integrar de manera flexible en las in­frae­s­tru­c­tu­ras de TI exi­s­te­n­tes. Esto hace que las empresas sean más in­de­pe­n­die­n­tes al elegir sus pla­ta­fo­r­mas de IA.

Sin embargo, los ace­le­ra­do­res de IA también presentan algunas de­s­ve­n­ta­jas si­g­ni­fi­ca­ti­vas. Aunque el Intel Gaudi 3 ofrece un re­n­di­mie­n­to de primera clase, los chips de gama alta de NVIDIA en general pro­po­r­cio­nan un re­n­di­mie­n­to aún mayor. ¿Y esto por qué es relevante? Porque las empresas activas en el campo de la IA hasta ahora han tendido a optar por la solución más potente y no la más rentable. Como resultado, el Intel Gaudi 3 es menos común que los ace­le­ra­do­res de IA de NVIDIA, cuyo eco­si­s­te­ma se beneficia del amplio apoyo de los equipos de de­sa­rro­llo de IA.

Cloud GPU VM
Máximo re­n­di­mie­n­to de la IA con Cloud GPU VM
  • GPUs NVIDIA H200 para máxima potencia de cálculo
  • Re­n­di­mie­n­to ga­ra­n­ti­za­do gracias a núcleos de CPU to­ta­l­me­n­te dedicados
  • Alo­ja­mie­n­to 100% en Europa para la máxima seguridad de los datos y cu­m­pli­mie­n­to de la RGPD
  • Modelo de precios sencillo y ca­l­cu­la­ble con precio fijo por hora

Áreas de apli­ca­ción: ¿para qué es más adecuado el Intel Gaudi 3?

El Intel Gaudi 3 ha sido diseñado es­pe­cí­fi­ca­me­n­te para cargas de trabajo de IA que requieren un alto re­n­di­mie­n­to de pro­ce­sa­mie­n­to y es es­pe­cia­l­me­n­te adecuado para tareas de in­fe­re­n­cia que requieren una alta pa­ra­le­li­za­ción y un amplio ancho de banda de memoria. Entre las cargas de trabajo típicas se incluyen, por ejemplo, la ge­ne­ra­ción de texto con grandes modelos de lenguaje (LLM), la ge­ne­ra­ción de imágenes y la síntesis de voz. Gracias a su alta velocidad de in­fe­re­n­cia y a la ar­qui­te­c­tu­ra op­ti­mi­za­da para FP8, el Gaudi 3 permite un pro­ce­sa­mie­n­to potente y eficiente en términos de energía de modelos de IA ge­ne­ra­ti­va. Sin embargo, también existen otros campos de apli­ca­ción. Estos incluyen, pri­n­ci­pa­l­me­n­te:

  • En­tre­na­mie­n­to básico de grandes modelos de IA: el Gaudi 3 permite procesar grandes conjuntos de datos de manera eficiente. Por lo tanto, los ace­le­ra­do­res de IA son ideales para entrenar modelos de IA, como redes neu­ro­na­les para apre­n­di­za­je au­to­má­ti­co o modelos basados en la ar­qui­te­c­tu­ra Tra­n­s­fo­r­mer, como GPT y LLaMA, desde cero.
  • Pro­ce­sa­mie­n­to de imágenes y visión ar­ti­fi­cial: gracias a su alto re­n­di­mie­n­to de cálculo, el Intel Gaudi 3 puede procesar datos complejos de imágenes en tiempo real. Por ello, este ace­le­ra­dor de IA también es adecuado para apli­ca­cio­nes como la vi­gi­la­n­cia de seguridad o la au­to­ma­ti­za­ción in­du­s­trial.
  • Se­r­vi­do­res GPU y clústeres de IA en centros de datos: el Intel Gaudi 3 puede ser utilizado en se­r­vi­do­res GPU para pro­po­r­cio­nar el poder de pro­ce­sa­mie­n­to necesario para tareas de en­tre­na­mie­n­to e in­fe­re­n­cia en IA.

¿Cuáles son las posibles al­te­r­na­ti­vas al Intel Gaudi 3?

Existen varios ace­le­ra­do­res de IA que pueden co­n­si­de­rar­se al­te­r­na­ti­vas al Intel Gaudi 3. Entre las opciones más conocidas y productos co­m­pe­ti­do­res se encuentra la NVIDIA H100. Mientras que el ace­le­ra­dor de Intel es ideal para apli­ca­cio­nes de in­fe­re­n­cia, la H100 ofrece un re­n­di­mie­n­to de gama alta para casos de uso en IA y ciencia de datos. Otra al­te­r­na­ti­va frecuente al Gaudi 3 es la NVIDIA A30, que combina un alto nivel de re­n­di­mie­n­to con un precio más asequible.

Nota

En nuestro artículo “Co­m­pa­ra­ti­va de GPU para se­r­vi­do­res”, en­co­n­tra­rás las mejores tarjetas gráficas para su uso en centros de datos y se­r­vi­do­res de alto re­n­di­mie­n­to.

Ir al menú principal