
El nuevo método de Google hace que los LLM sean más rápidos y potentes, y también más económicos
Google Research presenta cascadas especulativas, un método híbrido que combina modelos pequeños y grandes para optimizar la velocidad y eficiencia de los LLM, reduciendo costos sin sacrificar calidad.