DeepSeek presenta mHC: la técnica que abarata y acelera la próxima generación de LLMs

DeepSeek irrumpe en el panorama de la IA con Manifold-Constrained Hyper-Connections (mHC), una técnica que promete reducir drásticamente los costos de entrenamiento de modelos grandes.








