Episódios de IA Sob Controle - Inteligência Artificial

234: Entendendo modelos de mundo e JEPA, com Randall Balestriero, da Meta FAIR

18 de março de 20261h13min

0:00 / 1:13:02

Nesta semana, tivemos um papo fascinante com Randall Balestriero, pesquisador da Meta FAIR. Mergulhamos no universo dos famosos world models e da arquitetura JEPA, tecnologias que ele vem desenvolvendo ao lado de Yann LeCun e que muitos especialistas apontam como a próxima grande revolução na inteligência artificial.

Vem ver quem participou desse papo:

⁠⁠Marcus Mendes⁠⁠, host sob controle⁠⁠Fabrício Carraro⁠⁠, co-host sob controle, Program Manager da Alura, ⁠⁠autor de IA⁠⁠ e host do podcast Carreira Sem FronteirasRandall Balestriero, Visiting Researcher na Meta AI/FAIR

Links:

Conversa original em inglês com Randall BalestrieroMeta FAIRE...

Assuntos15

Inteligência Artificial embeddingsDefinição e conceitos fundamentais · Diferenças entre JEPA e modelos autorregressivos (GPT) · Predição em espaço latente versus espaço de entrada · Problema do colapso de representações · Termos de diversidade e anti-colapso
World Models e Modelos de MundoConceito de modelos de mundo para IA · Aprendizado de dinâmica de sistemas · Diferenças fundamentais com modelos generativos · Eficiência computacional em relação a LLMs · Aplicações em robótica, medicina e astrofísica
Comparação com modelos de linguagemEficiência amostral de JEPA versus LLMs · Predição de próximo token versus predição latente · Ruído em dados de texto versus imagem · Escalabilidade e limites técnicos · Futuro dos dois paradigmas
Desafios de Pesquisa em JEPADiferenciação entre sinal e ruído · Estabilidade de treinamento e escalabilidade · Leis de escala para JEPA versus GPT · Avaliação de modelos de mundo · Interpretabilidade de embeddings abstratos
Planejamento EstratégicoControle preditivo baseado em modelo · Planejamento em robótica · Raciocínio de longo prazo · Objetivo versus predição autorregressiva · Integração com especificação de objetivos
Integração de JEPA com Modelos de LinguagemSistema 1 e Sistema 2 · Interação entre JEPA e LLMs · Decodificador baseado em LLM para interpretabilidade · Alinhamento em pós-treinamento · Interpretação de representações latentes
Inteligência ArtificialVisão por computador e imagens · Pretrenamento em modelos de visão · Convergência mais rápida que modelos tradicionais · Comparação com Vision Transformers (ViT) · Estabilidade de treinamento
Energia ElétricaLei de escala em JEPA · Redução de dados necessários · Convergência rápida · Aprendizado contínuo e educação · Adaptação a distribuições novas
Pressões e Dinâmica da Pesquisa em IACorrida tecnológica entre laboratórios · Visibilidade pública da competição · Impacto em estudantes de doutorado · Diversidade de agendas de pesquisa · Direcionamento de pesquisa pelo mercado
Reconstrução versus Predição LatenteDesperdício computacional em modelos generativos · Variância e ruído em espaço de entrada · Ignorar informação irrelevante · Erro quadrático médio como métrica · Foco em características de alta variância
Tecnologia Seguranca PublicaRestrições físicas durante planejamento · Controle explícito versus implícito · Diferenças com segurança em LLMs · Imposição de limites de velocidade e movimento · Robustez contra objetivos maliciosos
Tecnologia espacialModelagem de dinâmica de galáxias · Descoberta de física nova · Sistemas dinâmicos complexos · Parametrizações de equações diferenciais · Interpretabilidade para física
Cookbook de Aprendizado SupervisionadoCompilação de conhecimento tácito · Estudos de ablação em deep learning · Receitas de treinamento · Coupling de hiperparâmetros · Register tokens e artefatos de método
Modelos de IAAssistência em programação · Revisão de código adversarial · Detecção de bugs e testes · Geração e edição de imagens · Melhoria de escrita acadêmica
Impacto de decisões empresariaisCapacidades em imagem e vídeo · Produtividade e gestão de tempo · Ajuda em pesquisa e programação · Criação de conteúdo · Escalabilidade de modelos

Transcrição145 segmentoswhisper-cpp/large-v3-turbo