Novo Modelo de Raciocínio Chinês Rivaliza com OpenAI o1 e é Grátis
- Gustavo Santos
- 8 horas atrás
- 2 Comentários
A nova família de modelos de IA DeepSeek-R1, lançada pelo laboratório chinês DeepSeek, inclui um modelo avançado com 671 bilhões de parâmetros, oferecendo desempenho semelhante ao modelo o1 da OpenAI em matemática e programação. Além disso, seis versões menores, DeepSeek-R1-Distill, variam de 1,5 bilhões a 70 bilhões de parâmetros, permitindo que o menor modelo funcione em laptops, enquanto o maior requer recursos computacionais robustos, potencialmente transformando o acesso a modelos de raciocínio avançados na comunidade de IA.
O modelo de raciocínio desenvolvido pelo laboratório de IA chinês DeepSeek foi lançado sob uma licença MIT, permitindo que qualquer pessoa o estude e utilize.
Lançamento do DeepSeek-R1 e suas versões
No início da semana, o laboratório de inteligência artificial DeepSeek fez um anúncio que agitou a comunidade de IA: eles lançaram a nova família de modelos DeepSeek-R1 sob uma licença MIT. Isso significa que qualquer pessoa pode baixar, estudar e até modificar o modelo para seus próprios projetos.
O modelo mais robusto da família, com impressionantes 671 bilhões de parâmetros, promete resultados comparáveis aos do modelo de raciocínio simulado o1 da OpenAI em diversos testes de matemática e programação. Essa capacidade de raciocínio é um divisor de águas, especialmente considerando que muitos modelos de código aberto têm enfrentado dificuldades para acompanhar os benchmarks de raciocínio dos modelos proprietários.
Além do modelo principal DeepSeek-R1-Zero, a empresa também lançou seis versões menores, chamadas DeepSeek-R1-Distill, com parâmetros que variam de 1,5 bilhões a 70 bilhões. Essas versões destiladas são baseadas em arquiteturas de código aberto existentes, como Qwen e Llama, e foram treinadas usando dados gerados pelo modelo completo R1. O menor desses modelos pode ser executado em um laptop, enquanto o modelo completo requer recursos computacionais mais robustos.
A disponibilidade de modelos com essa capacidade de raciocínio, agora sob uma licença aberta, pode representar uma mudança significativa no que é possível com modelos de IA acessíveis ao público. Para desenvolvedores e pesquisadores, essa é uma oportunidade empolgante de explorar e expandir as fronteiras da inteligência artificial sem as limitações impostas por licenças restritivas.