DeepSeek lanza un modelo más liviano y eficiente para textos largos
Una nueva técnica llamada “atención dispersa” permite procesar más texto, más rápido, sin perder calidad.
Una nueva técnica llamada “atención dispersa” permite procesar más texto, más rápido, sin perder calidad.