Anthropic ha lanzado una versión mejorada de Claude 3.5 Sonnet, su modelo de inteligencia artificial más potente, y llega acompañado de una interesante novedad: computer use. Se trata de una función, disponible a través de la API, que le permite a la IA tomar el control de un ordenador para concretar varias tareas.

Dicho de esta forma puede que no suene demasiado relevante o sorprendente, pero realmente lo es. Básicamente, computer use permite que Claude 3.5 Sonnet pueda interactuar directamente con el ordenador y sus aplicaciones, imitando acciones que habitualmente realizan las personas.

Esto significa que la inteligencia artificial de Anthropic puede identificar la información en pantalla e identificarla para luego mover el cursor del ratón, escribir texto, navegar por un documento o una página web o pulsar botones, entre otras actividades.

Lo nuevo de Claude 3.5 Sonnet es una función experimental y está disponible a modo de beta pública. De acuerdo con Anthropic, su modelo de lenguaje es el primero en el mercado en ofrecer esta función. Y si bien la compañía advierte que todavía queda mucho trabajo por hacer y que en su estado actual computer use todavía es bastante propenso a los errores, es un punto de partida prometedor.

¿Cómo funciona computer use en Claude 3.5 Sonnet?

La API de computer use le permite a Claude 3.5 Sonnet interactuar con interfaces de ordenadores y completar acciones a partir de un prompt de texto. En un vídeo mostrando esta nueva función, Anthropic mostró que la herramienta puede extraer información de un documento o la web para rellenar los distintos campos de un formulario en línea.

YouTube videoYouTube video

Lo que hace la inteligencia artificial es tomar capturas de pantalla de lo que ven los usuarios y analizarlas para comprender el entorno. En la demo en cuestión, le piden a Claude 3.5 Sonnet que encuentre los datos necesarios en una hoja de cálculo de Google, o que los busque en una base de datos en la web.

Ver fuente

Por