OpenAI apresentou uma nova série de modelos avançados de raciocínio, conhecida como OpenAI o1-preview. Esses modelos são projetados para resolver problemas complexos em ciência, programação e matemática, mostrando uma capacidade de resolução de problemas significativamente aprimorada em comparação com modelos anteriores.
Funcionamento
Os modelos foram treinados para dedicar mais tempo ao raciocínio sobre as tarefas, de maneira semelhante a um ser humano. Eles refinam seu processo de pensamento, testam diferentes estratégias e identificam erros. A próxima atualização alcançou, nos testes, resultados comparáveis aos de estudantes de doutorado em física, química e biologia. Especialmente em matemática e programação, o modelo demonstrou habilidades excepcionais.
Disponibilidade e uso
Os primeiros modelos da série o1 já estão disponíveis no ChatGPT e na API. Atualizações e melhorias regulares são esperadas. Os modelos podem ser selecionados manualmente na escolha de modelo do ChatGPT, com o o1-preview e o o1-mini disponíveis agora. Usuários do ChatGPT Plus e Team têm acesso a partir de hoje, enquanto usuários do ChatGPT Enterprise e Edu terão acesso na próxima semana.
Medidas de segurança
Um aspecto importante no desenvolvimento desses modelos é a segurança. Uma nova abordagem para o treinamento de segurança utiliza as habilidades de raciocínio dos modelos para garantir a conformidade com as diretrizes de segurança e alinhamento. Um ponto de referência para a segurança é o quão bem o modelo segue suas diretrizes de segurança, mesmo em tentativas de contorná-las (“Jailbreaking”). Em um dos testes de Jailbreaking mais rigorosos, o modelo o1-preview alcançou 84 pontos de 100, enquanto o GPT-4o alcançou apenas 22 pontos.
Para os novos modelos, as medidas de segurança, a governança interna e a colaboração com o governo federal foram intensificadas. Isso inclui testes rigorosos, avaliações pelo Preparedness Framework, medidas de Red Teaming e processos de revisão ao nível do conselho, incluindo o Comitê de Segurança e Governança.
Aplicações e público-alvo
As habilidades de raciocínio avançadas dos modelos o1 são particularmente úteis para usuários que precisam resolver problemas complexos em ciência, programação, matemática e áreas correlatas. Os modelos o1 podem ser utilizados por pesquisadores de saúde para a anotação de dados de sequenciamento celular, por físicos para a criação de fórmulas matemáticas complexas para a óptica quântica e por desenvolvedores para a criação e execução de fluxos de trabalho em várias etapas.
OpenAI o1-mini
Além do o1-preview, também é oferecido o OpenAI o1-mini, um modelo mais rápido e econômico, que é especialmente eficaz para programação. O o1-mini é 80% mais barato que o o1-preview e oferece uma solução poderosa e econômica para aplicações que exigem raciocínio, mas não dependem de um amplo conhecimento do mundo.
Desenvolvimentos futuros
Este lançamento é uma prévia inicial dos novos modelos de raciocínio no ChatGPT e na API. Além das atualizações de modelos, estão planejadas funcionalidades adicionais, como navegação na web, upload de arquivos e imagens, para tornar os modelos mais úteis. Desenvolvimentos adicionais na série GPT e na série OpenAI o1 estão em andamento.
Com esses novos modelos, a OpenAI dá um passo significativo em direção a um novo nível de capacidades de IA, especialmente no campo do raciocínio e resolução de problemas em áreas complexas.
No site chatgptx.com, o modelo o1-preview pode ser testado gratuitamente com 3000 tokens.