La IA generativa y los centros de datos
30/04/2025CATEGORíA: General MARCA: Rittal
Las empresas deben establecer objetivos claros y tener una comprensión real de los problemas que la IA puede resolver antes de comprometer fondos de desarrollo.
Los modelos de IA se entrenan mediante conjuntos de datos y algoritmos. Aprenden a hacer predicciones estadísticas encontrando patrones en los datos y, en el caso de los grandes modelos de lenguaje (LLM), se les entrena para predecir la probabilidad de una palabra o frase dentro de un contexto determinado. Su comprensión del lenguaje es matemática. Si por ejemplo, los datos están incompletos o el modelo hace suposiciones incorrectas, puede ofrecer predicciones falsas conocidas como alucinaciones. Así pues, la mayoría de los analistas estarían de acuerdo en que la supervisión humana sigue siendo crucial, especialmente cuando se trata de automatizar funciones empresariales críticas.
Por lo tanto, el éxito de esta tecnología transformadora depende de la capacidad de los centros de datos para entrenar los modelos. Y esto está dando lugar a nuevos avances en la infraestructura de los centros de datos.
Cómo los centros de datos están gestionando las demandas de formación en IA
El entrenamiento de modelos de IA requiere grandes cantidades de datos, así como una inmensa potencia de procesamiento. Los modelos de IA generativa (Gen AI), por ejemplo, utilizan grandes redes neuronales que constan de cientos de miles de millones de parámetros y dependen en gran medida de las unidades de procesamiento gráfico (GPU) para el entrenamiento.
Las GPU son conocidas por sus altas demandas de energía, por lo que las proyecciones de la industria sugieren que el consumo de energía de los centros de datos está a punto de dispararse en los próximos años, impulsado principalmente por el crecimiento y el entrenamiento de la IA.
Los operadores de centros de datos también tienen que gestionar el fuerte aumento de la carga térmica dentro de los racks, causada por toda esta potencia de procesamiento. Es un problema que se ve agravado por el hecho de que los componentes eléctricos están disminuyendo de tamaño y las densidades de los racks están aumentando, atrapando más calor en su interior. Este calor debe eliminarse o de lo contrario, puede dañar los componentes electrónicos internos del equipo.
Para instalaciones de mayor densidad donde las cargas de los racks superan los 40-50 kW, se pueden instalar paquetes de refrigeración líquida dentro del conjunto de racks para proporcionar refrigeración directamente donde se necesita. Son muy eficientes desde el punto de vista energético y, por lo tanto, pueden ayudar a reducir la huella de carbono del centro de datos. Además, son fácilmente escalables, por lo que no suponen ningún problema a la hora de expandir la instalación en el futuro.
Sin embargo, una vez que las densidades de calor aumentan y superan los 200 kW, la refrigeración del aire ya no es una opción viable. Por ello, los métodos de refrigeración líquida están experimentando un gran interés en instalaciones más avanzadas tecnológicamente.
Uno de ellos es el refrigeración por inmersión, una técnica en la que los servidores se sumergen en tanques que contienen un fluido dieléctrico. Esta es una solución eficiente, pero preocupa el hecho de si invalida o no las garantías de los equipos, así como la necesidad de pisos estructurales robustos para soportar el peso adicional de los tanques utilizados.
El segundo método es el refrigeración directa al chip, donde el líquido refrigerante se bombea directamente a los disipadores de calor de los chips a través de tuberías. Allí, absorbe y elimina el exceso de calor. Entre los beneficios de este método para los centros de datos incluyen:
- La reducción del consumo de energía
- El aumento de las capacidades de procesamiento
- La mejora del tiempo de actividad
- Menor espacio en comparación con la refrigeración por inmersión
Para los centros de datos con racks que requieren de menos energía, la refrigeración de pasillo puede ser suficiente. Pero, en su mayor parte, la refrigeración líquida ofrece los mayores beneficios.
IA en tiempo real: desafíos y soluciones para las empresas modernas
Una vez se entrenan los modelos de IA, las empresas pueden utilizarlos en sus aplicaciones diarias para mejorar sus operaciones. En este contexto, es crucial que la tecnología pueda procesar datos en tiempo real (baja latencia). Para ello, es necesario que el equipo informático esté ubicado cerca de donde se generan los datos para minimizar el tiempo de transmisión y procesamiento.
Esta proximidad a la fuente de datos, aunque minimizará la latencia, puede traer nuevos problemas, entre ellos los causados por la colocación de componentes electrónicos delicados en entornos operativos poco óptimos (por ejemplo, en entornos industriales con altas temperaturas, polvorientos o húmedos). Estas demandas operativas, junto con las posibles tensiones en los equipos, han llevado a un gran aumento de los Edge Data Center, también conocidos como Centros de Datos perimetrales, en las empresas.
Estos centros de datos suelen utilizar módulos preconfigurados que incluyen refrigeración integrada, fuente de alimentación y bastidores de TI. Son rápidos y fáciles de instalar y ofrecen a las empresas grandes oportunidades para una mayor escalabilidad.
Si bien esperamos que la IA ayude a las empresas a desbloquear una nueva era de innovación y eficiencia, la implementación exitosa de modelos de IA depende de un enfoque equilibrado que reconozca sus limitaciones y garantice la supervisión humana continua. Pero no debemos perder de vista las exigencias que el entrenamiento de modelos de IA está imponiendo a los centros de datos, especialmente en términos de energía y refrigeración.
Más información en https://www.rittal.com
