Modelos de lenguaje natural evolucionan

GPT3
Si bien la API para GPT-4 puede tardar algún tiempo en estar disponible públicamente, es probable que los investigadores ya estén tratando de replicar los pesos del modelo en una forma de código abierto.

Es probable que el modelo GPT-4 ya esté en desarrollo y capacitación, y hará que GPT-3 parezca primitivo, al igual que GPT-3 fue un gran avance sobre GPT-2. 

Si bien la API para GPT-4 puede tardar algún tiempo en estar disponible públicamente, es probable que los investigadores ya estén tratando de replicar los pesos del modelo en una forma de código abierto. 

Los pesos son el resultado de entrenar un modelo de aprendizaje automático de este tipo en lo que probablemente sean exabytes de datos, una tarea que requiere mucho tiempo y es muy costosa. Una vez que se completa el entrenamiento, los pesos son los que permiten que el modelo se ejecute y produzca resultados.

En palabras de Andy Patel, investigador de WithSecure Intelligence, a CSO: “Para ejecutar realmente el modelo, si tuviera esos pesos, necesitaría un conjunto decente de instancias en la nube, y es por eso que esas cosas están detrás de una API. Lo que predecimos es que en algún momento podrá ejecutarlo en su computadora portátil. No en el futuro cercano, obviamente. No en el próximo año o dos, pero se trabajará para hacer esos modelos más pequeños. Y creo que, obviamente, hay un gran negocio impulsor para que podamos ejecutar esos modelos en el teléfono”.

Salir de la versión móvil