No primeiro post a gente viu os termos básicos: IA, Machine Learning, Deep Learning e Redes Neurais. Mas como essa mágica acontece de verdade? Como a IA aprende a gerar código, sugerir soluções ou detectar fraudes?
Hoje vamos falar de quatro conceitos que são a base desse aprendizado: modelo, dados de treinamento, tokens e tipos de aprendizado.
A ideia dessa série de artigos é trazer alguns termos por vez para facilitar no fixação do aprendizado. Eu até podia trazer tudo de uma vez, mas o artigo ia ficar grande e meio confuso, então decidi separar por partes.
Bora? 🚀
Modelo
Pensa no modelo como o cérebro da IA.
Ele é o “produto final” de todo o treinamento, quem realmente vai executar a tarefa. Mas ele não é criado sabendo, precisa aprender com exemplos.
💡 Exemplo: o GitHub Copilot é um modelo treinado para completar e sugerir código, então ele é treinado especificamente com dados de código.
Dados de Treinamento
Se o modelo é o cérebro, os dados de treinamento são a escola.
Quanto melhores e mais diversos os dados, mais inteligente e preciso o modelo fica.
🐈⬛ Exemplo: se você treinar um modelo só com fotos de gatos brancos, ele pode falhar na hora de reconhecer um gato preto. (Provavelmente por isso a gente ainda vê tanto bias em IA quando vamos criar imagens).
Tokens
Quando a IA trabalha com texto, ela não lê palavra por palavra. O texto é quebrado em tokens, que são pedaços menores (podem ser sílabas, partes de palavras ou palavras inteiras).
Assim, o modelo aprende a prever qual token vem a seguir.
Exemplo: a frase “Eu amo programar” pode virar Eu | amo | pro | gramar.
O ponto principal é: o modelo não pensa em palavras, mas em tokens. E tokens podem ser palavras inteiras ou pedaços delas.
Tipos de Aprendizado
Nem todo aprendizado de máquina funciona igual. Os dois principais são:
Supervisionado
Quando damos os exemplos já com as respostas corretas. Ex: ensinar um modelo a identificar spam mostrando e-mails já classificados como “spam” ou “não spam”.
Não supervisionado
Quando entregamos os dados sem respostas e o modelo precisa achar padrões sozinho. Ex: agrupar músicas por estilo sem dizer previamente o gênero de cada uma.
Agora você já sabe o que é um modelo, como ele aprende com dados, como tokens funcionam e os principais tipos de aprendizado.
Na Parte 3, vamos mergulhar em como as máquinas entendem a linguagem: LLMs, NLP e contexto.
Obrigada por ler,
Pachi 🥑
Top comments (0)