Fastino treina modelos de IA em GPUs de jogos baratos e apenas levantou US $ 17,5 milhões liderados por Khosla

Os gigantes da tecnologia gostam de se gabar de modelos de IA de trilhões de parâmetros que exigem aglomerados de GPU maciços e caros. Mas Fastino está adotando uma abordagem diferente.

A startup de Palo Alto diz que inventou um novo tipo de arquitetura de modelo de IA que é intencionalmente pequena e específica para tarefas. Os modelos são tão pequenos que são treinados com GPUs de jogos baixos no valor de menos de US $ 100.000 no total, diz Fastino.

O método está atraindo a atenção. A Fastino garantiu US $ 17,5 milhões em financiamento de sementes liderado pela Khosla Ventures, o primeiro investidor de risco da Openai, Fettino, disse exclusivamente ao TechCrunch.

Isso eleva o financiamento total da startup para quase US $ 25 milhões. Ele levantou US $ 7 milhões em novembro passado em uma rodada pré-semente liderada pelo VC Arm M12 da Microsoft e pela Insight Partners.

“Nossos modelos são mais rápidos, mais precisos e custam uma fração para treinar enquanto supera os modelos de principais tarefas específicas”, diz Ash Lewis, CEO e co-fundador da Fastino.

A Fastino construiu um conjunto de pequenos modelos que vende para clientes corporativos. Cada modelo se concentra em uma tarefa específica que uma empresa pode precisar, como redigir dados confidenciais ou resumir documentos corporativos.

O Fastino ainda não está divulgando métricas ou usuários iniciais, mas diz que seu desempenho está impressionando os primeiros usuários. Por exemplo, como eles são muito pequenos, seus modelos podem oferecer uma resposta inteira em um único token, disse Lewis ao TechCrunch, mostrando a tecnologia dando uma resposta detalhada de uma só vez em milissegundos.

Evento do TechCrunch

Berkeley, CA.
|
5 de junho

Reserve agora

Ainda é um pouco cedo para saber se a abordagem de Fastino vai pegar. O espaço da IA ​​da empresa está lotado, com empresas como Cohere e Databricks também divulgando a IA que se destaca em determinadas tarefas. E os fabricantes de modelos SATA focados na empresa, incluindo antropia e Mistral, também oferecem modelos pequenos. Também não é segredo que o futuro da IA ​​generativa para a empresa é provavelmente em modelos de idiomas menores e mais focados.

O tempo pode dizer, mas um voto antecipado de confiança de Khosla certamente não dói. Por enquanto, Fastino diz que está focado na construção de uma equipe de IA de ponta. Ele está visando pesquisadores nos principais laboratórios de IA que não são obcecados em construir o maior modelo ou derrotar os benchmarks.

“Nossa estratégia de contratação está muito focada em pesquisadores que talvez tenham um processo de pensamento contrário de como os modelos de idiomas estão sendo construídos agora”, diz Lewis.

Veja também