IA Tucano, nativa em português, vence prêmio na Alemanha

O Tucano, série de modelos de linguagem de grande porte (LLMs) treinados nativamente em português, conquistou o primeiro lugar no concurso “Most Interesting Results Competition” durante o primeiro aniversário do Marvin, supercomputador de alto desempenho da Universidade de Bonn, na Alemanha. A premiação foi revelada pelo pesquisador Nicholas Kluge.

O evento reuniu cientistas que utilizam o cluster Marvin — infraestrutura de computação avançada inaugurada há um ano — para apresentar pesquisas impulsionadas por sua capacidade técnica. O trabalho vencedor, liderado por Kluge e equipe formada por Aniket Sen, Sophia Falk e Shiza Fatimah, demonstrou o potencial do Tucano, modelo de código aberto desenvolvido na universidade alemã com foco na língua portuguesa.

A Tucano é a primeira família de LLMs nativamente pré-treinados em português, disponível publicamente para uso e aprimoramento pela comunidade. Diferente de modelos como o GPT-4, que são adaptados para o idioma a partir de bases em inglês, o Tucano foi construído “do zero” com dados em português, com a promessa de maior precisão em tarefas específicas, como interpretação de nuances culturais e regionais.

O projeto foi viabilizado pelo poder de processamento do Marvin, que permitiu treinar modelos complexos com menores custos. Inaugurado em 2023, o Marvin é um cluster de computação de Tier 3, classificação que o coloca entre as infraestruturas de alto desempenho mais robustas da Europa. Capaz de realizar trilhões de operações por segundo, ele tem sido usado em projetos que vão de simulações climáticas a estudos genômicos.

Adicionar aos favoritos o Link permanente.