Sabiá-2: O Novo Modelo LLM de Inteligência Artificial da Maritaca.ai que Rivaliza com ChatGPT-4o

abr 03, 2024

A Maritaca AI, uma empresa brasileira dedicada à pesquisa e desenvolvimento de IA, publicou o Sabiá-2, um LLM especializado em português que está revolucionando o campo da IA no Brasil.

A Inteligência Artificial (IA) tem avançado a passos largos nos últimos anos, especialmente no campo do Processamento de Linguagem Natural (PLN). Os modelos de linguagem grandes (LLMs) têm se tornado cada vez mais poderosos e versáteis, capazes de realizar uma ampla gama de tarefas, desde a geração de textos criativos até a resposta a perguntas complexas. Nesse cenário, a Maritaca AI, uma empresa brasileira dedicada à pesquisa e desenvolvimento de IA, publicou no dia 26/03/2024 o Sabiá-2, um LLM especializado em português que está revolucionando o campo.

O Sabiá-2 foi desenvolvido por um time de pesquisadores da Maritaca AI, composto por Thales Sales Almeida, Hugo Abonizio, Rodrigo Nogueira e Ramon Pires. Esses especialistas uniram seus conhecimentos e habilidades para criar um modelo de linguagem que não apenas compreende profundamente o idioma português, mas também é capaz de gerar textos coerentes, criativos e informativos nessa língua, como primeira língua, sem qualquer tipo de tradução no front ou backend.

Uma das características mais impressionantes do Sabiá-2 é seu desempenho excepcional em exames brasileiros. Em diversos testes, o modelo demonstrou uma performance que rivaliza e, em alguns casos, até supera a do renomado GPT-4, desenvolvido pela OpenAI.

Os testes realizados utilizando todos os modelos abaixo incluem:

Admissão em universidades (USP, UNICAMP e Enem)
Ensino superior (Enade 2022 e 2023),
Direito (OAB),
Contabilidade (CFCES)
Medicina: (Revalida e provas de residência da USP e UNICAMP)
Pós graduação em engenharia da computação (Poscomp)

Mais abaixo apresento os resultados.

Funcionalidades Técnicas

Por trás do desempenho excepcional do Sabiá-2, há uma arquitetura robusta e bem projetada. O modelo é baseado em Transformers, uma arquitetura de rede neural que se tornou o padrão ouro para tarefas de PLN. Essa escolha permite que o Sabiá-2 processe e gere linguagem de maneira eficiente e precisa.

O treinamento do Sabiá-2 envolveu a exposição a uma vasta quantidade de textos em português, provenientes de diversas fontes, como a internet, livros, artigos e muito mais. Esse processo de aprendizado abrangente permite que o modelo adquira um conhecimento profundo sobre a língua portuguesa, seus nuances e peculiaridades.

O Sabiá-2 está disponível em duas versões: Small e Medium. Essas opções oferecem flexibilidade aos usuários, permitindo que escolham o modelo mais adequado às suas necessidades e recursos computacionais disponíveis.

Um aspecto crucial do treinamento do Sabiá-2 é o uso de instruções específicas para garantir que o modelo gere respostas seguras, éticas e alinhadas com os "valores humanos". Isso é fundamental para evitar que o modelo produza conteúdo ofensivo, inadequado ou potencialmente prejudicial.

Além disso, o Sabiá-2 é capaz de realizar uma ampla gama de tarefas, graças à sua arquitetura versátil. Ele pode responder perguntas, gerar textos criativos, traduzir idiomas e muito mais. Essa versatilidade o torna uma ferramenta poderosa para diversas aplicações, desde chatbots até a criação de conteúdo.

Aplicações Práticas - exemplos

Uma das grandes vantagens do Sabiá-2 é sua integração com a API MariTalk. Essa API permite que desenvolvedores e empresas incorporem facilmente o poder do Sabiá-2 em suas aplicações e serviços.

Com a MariTalk, é possível:

Criar chatbots avançados, capazes de interagir de maneira natural e eficiente com usuários em português. Esses chatbots podem ser aplicados em diversos setores, como atendimento ao cliente, suporte técnico, vendas e muito mais. A capacidade do Sabiá-2 de compreender o contexto e gerar respostas coerentes e relevantes torna-o uma ferramenta ideal para aprimorar a experiência do usuário e aumentar a eficiência dos serviços.
Geração automática de conteúdo. Com sua habilidade de produzir textos criativos e informativos, o modelo pode ser utilizado para criar artigos, posts de blog, descrições de produtos e outros tipos de conteúdo em português. Isso pode ser especialmente útil para empresas e profissionais de marketing que buscam otimizar sua produção de conteúdo e se destacar em um mercado cada vez mais competitivo.
No âmbito jurídico, por exemplo, o Sabiá-2 pode ser utilizado para auxiliar na geração de petições, contratos e outros documentos legais. Sua capacidade de compreender o contexto jurídico e gerar textos precisos e bem estruturados pode agilizar significativamente o trabalho dos profissionais do direito, permitindo que se concentrem em tarefas mais estratégicas.
Na área educacional, o Sabiá-2 pode ser uma ferramenta valiosa para auxiliar estudantes e professores. Com sua habilidade de responder perguntas e fornecer explicações detalhadas sobre uma ampla gama de tópicos, o modelo pode ser utilizado como um tutor virtual, ajudando os estudantes a aprofundar seu conhecimento e esclarecer dúvidas. Além disso, os professores podem usar o Sabiá-2 para gerar materiais didáticos, como exercícios e exemplos, de maneira rápida e eficiente.

Privacidade e Segurança dos dados

Para organizações que lidam com dados sensíveis e têm preocupações com privacidade e segurança, a Maritaca AI oferece a opção de hospedagem local com a MariTalk Local. Essa solução permite que o Sabiá-2 seja executado diretamente nos servidores da empresa, garantindo que os dados permaneçam dentro da infraestrutura da organização. Isso é particularmente relevante para setores como o jurídico, financeiro e de saúde, onde a confidencialidade é primordial.

Performance comparada com outros LLMs

Em diversos exames brasileiros, o Sabiá-2 demonstrou uma performance superior ao GPT-3.5 e comparável ao GPT-4, dois dos modelos mais avançados desenvolvidos pela OpenAI. Essa conquista é especialmente impressionante considerando que o GPT-4 é um modelo de linguagem de ponta, treinado em uma quantidade massiva de dados e com capacidades que vão além do processamento de linguagem natural.

Como resultado, o desempenho do Sabiá-2 em relação a outros LLMs, a tabela abaixo apresenta a média de acurácia nos principais testes realizados, em ordem decrescente:

Testes realizados:

Admissão em universidades (USP, UNICAMP e Enem)
Ensino superior (Enade 2022 e 2023),
Direito (OAB),
Contabilidade (CFCES)
Medicina: (Revalida e provas de residência da USP e UNICAMP)
Pós graduação em engenharia da computação (Poscomp)

Como pode ser observado, o Sabiá-2 Medium se posiciona como o terceiro modelo mais performático, atrás apenas do GPT-4 Turbo e do Claude 3 Opus. Esse resultado é um testemunho da eficácia da especialização em idiomas e contextos culturais específicos. Ao focar no português e em conteúdos relevantes para o Brasil, o Sabiá-2 é capaz de superar modelos maiores e mais genéricos em tarefas que envolvem essa língua e contexto.

É importante ressaltar que o Sabiá-2 Small, apesar de ser uma versão mais compacta do modelo, ainda assim apresenta um desempenho superior a diversos outros LLMs, como o GPT-3.5 Turbo e o Llama 70B. Isso demonstra que a arquitetura e o treinamento especializado do Sabiá-2 são fatores determinantes para seu sucesso, independentemente do tamanho do modelo.

Outro fator importante que vale a menção é seu custo. O gráfico abaixo ilustra a performance e o preço por milhões de tokens. Uma vez que é precificado em Reais, ao contrário do GPT-4 Turbo e o Claude 3 Opus, os dois melhores modelos da atualidade.

Conclusão

O Sabiá-2 representa um marco no desenvolvimento de LLMs especializados em português. Seu desempenho excepcional em exames brasileiros, rivalizando e até superando modelos de ponta como o GPT-4, é uma prova contundente do poder da especialização em idiomas e contextos culturais específicos.

Com sua arquitetura robusta, treinamento abrangente e capacidade de realizar uma ampla gama de tarefas, o Sabiá-2 tem o potencial de revolucionar a forma como interagimos com a tecnologia e acessamos informações em português. Seja na criação de chatbots avançados, na geração de conteúdo, no auxílio a profissionais do direito ou na educação, o modelo oferece possibilidades ilimitadas de aplicação.

Além disso, o Sabiá-2 se destaca pelo seu excelente custo-benefício. Ao oferecer um desempenho comparável a modelos mais caros e genéricos, ele se torna uma opção atraente para empresas e organizações que buscam incorporar a IA em seus processos de maneira eficiente e econômica.

Olhando para o futuro, é emocionante imaginar as possibilidades de evolução e aprimoramento do Sabiá-2. Com o avanço contínuo da pesquisa em IA e o comprometimento da Maritaca AI em impulsionar a inovação, podemos esperar ver o modelo se tornar ainda mais poderoso e versátil com o tempo.

O Sabiá-2 não é apenas um modelo de linguagem; é um símbolo do potencial da IA para transformar a maneira como nos comunicamos, aprendemos e trabalhamos. Ao abraçar essa tecnologia e explorar suas possibilidades, estamos dando um passo em direção a um futuro mais inteligente, eficiente e conectado. O Sabiá-2 é, sem dúvida, um protagonista nessa jornada emocionante rumo à revolução da IA no mundo lusófono.

Me baseei nas infos abaixo para a elaboração deste texto:

Relatório Técnico publicado no dia 26/03/2024
Utilização do chat Maritalk, da Maritaca.AI
Documentação da API
Langchain Maritalk

Abraço,

Guilherme

Discussão sobre este post

Pronto para mais?