O novo modelo de IA pequeno da AI2 supera modelos de tamanho semelhante do Google, Meta

Parece que é a semana para pequenos modelos de IA.

Na quinta-feira, ai2, o Instituto de Pesquisa de IA sem fins lucrativos, lançou o OLMO 2 1B, um modelo de 1 bilhão de parâmetros que a AI2 afirma que vence modelos de tamanho semelhante do Google, Meta e Alibaba em vários benchmarks. Os parâmetros, às vezes chamados de pesos, são os componentes internos de um modelo que orienta seu comportamento.

O OLMO 2 1B está disponível sob uma licença permissiva do Apache 2.0 na plataforma AI, abraçando o rosto. Ao contrário da maioria dos modelos, o OLMO 2 1B pode ser replicado do zero; A AI2 forneceu os conjuntos de código e dados (OLMO-MIX-1124, Dolmino-Mix-1124) usados ​​para desenvolvê-lo.

Modelos pequenos podem não ser tão capazes quanto seus colegas gigantes, mas, o que é mais importante, eles não precisam de hardware robusto para executar. Isso os torna muito mais acessíveis para desenvolvedores e entusiastas que disputam as limitações de máquinas de consumo e consumo.

Houve uma série de pequenos lançamentos de modelos nos últimos dias, desde a família Phi 4 Rainocing da Microsoft até a 2,5 Omni 3B de Qwen. A maioria destes – e OLMO 2 1B – pode ser executada facilmente em um laptop moderno ou mesmo em um dispositivo móvel.

A AI2 diz que o OLMO 2 1B foi treinado em um conjunto de dados de 4 trilhões de tokens de fontes publicamente disponíveis, geradas por IA e criadas manualmente. Os tokens são os bits brutos de modelos de dados ingerem e geram – 1 milhão de tokens é equivalente a cerca de 750.000 palavras.

Em um raciocínio aritmético de medição de benchmark, GSM8K, OLMO 2 1B pontuações melhores que o Gemma 3 1B do Google, a Llama 3,2 1B do Google e o QWEN 2.5 1,5B do Alibaba. O OLMO 2 1B também eclipsa o desempenho desses três modelos no VerdadentyQA, um teste para avaliar a precisão factual.

Evento do TechCrunch

Berkeley, CA.
|
5 de junho

Reserve agora

Ai2 adverte que o OLMO 2 1B traz riscos, no entanto. Como todos os modelos de IA, ele pode produzir “saídas problemáticas”, incluindo conteúdo prejudicial e “sensível”, diz a organização, além de declarações factualmente imprecisas. Por esses motivos, a AI2 recomenda a implantação do OLMO 2 1B em ambientes comerciais.

Veja também