Equipe de Superinteligência da Microsoft Lança Gerador MAI-Image-2

O Primeiro Movimento da Equipe de Superinteligência

A equipe de superinteligência recentemente estabelecida pela Microsoft — um grupo interno encarregado de desenvolver capacidades de AI além do desempenho atual dos grandes modelos de linguagem — entregou seu primeiro produto: MAI-Image-2, um modelo de geração de texto para imagem que Microsoft está integrando em toda sua suíte de produtos e disponibilizando aos desenvolvedores através de sua plataforma Azure AI via API.

O anúncio marca o debut de um resultado concreto do que tem sido uma divisão um tanto misteriosa dentro da Microsoft — uma que atraiu talento e recursos significativos conforme a empresa se posiciona para o que descreve como o próximo estágio do desenvolvimento de AI. MAI-Image-2 entra em um mercado competitivo de geração de imagens que já inclui DALL-E 3 (que Microsoft licencia da OpenAI), Midjourney, Stable Diffusion e a série Imagen do Google.

O Que É MAI-Image-2

MAI-Image-2 é um modelo generativo de texto para imagem — usuários inserem uma descrição em texto e o modelo produz uma imagem correspondente. A qualidade, coerência e flexibilidade estilística de tais saídas melhoraram dramaticamente nos últimos três anos, e o estado da arte agora abrange imagens fotorrealistas, estilos artísticos que variam de pintura a óleo a pixel art, e cenas compositivas complexas que eram impossíveis de gerar automaticamente há apenas alguns anos.

Microsoft não divulgou especificações técnicas detalhadas para MAI-Image-2, mas o lançamento do modelo em produtos Microsoft sugere que será integrado em ferramentas como Microsoft Designer, Image Creator no Bing e potencialmente assistentes Copilot incorporados em aplicações Office. A disponibilidade de API indica que Microsoft também pretende competir pela adoção de desenvolvedores — construindo um pipeline de aplicações de terceiros que usam MAI-Image-2 como seu backend de geração.

front and side images of a researcher equipped with AI training devices, part of the XRZero-G0 system.

XRZero-G0 abre um conjunto de dados de robótica de 2.000 horas

A X Square Robot lançou o XRZero-G0 e um conjunto de dados multimodal de 2.000 horas para reduzir a quantidade de dados de robôs reais necessária para sistemas de IA incorporada.

Read article

Por Que Microsoft Precisa de Seu Próprio Modelo

A capacidade de geração de imagens primária atual da Microsoft vem através de sua parceria com OpenAI, via DALL-E 3. Construir capacidades de geração proprietárias oferece à Microsoft várias vantagens: independência de um parceiro cujas prioridades podem nem sempre se alinhar, custos por inferência mais baixos em escala, a capacidade de ajustar modelos para casos de uso específicos da Microsoft e o poder de negociação que vem com ter alternativas viáveis.

O mandato da equipe de superinteligência é mais amplo que geração de imagens — abrange pesquisa em futuras arquiteturas de AI que poderiam eventualmente superar modelos atuais baseados em transformer. Mas lançar um produto sinaliza que a equipe está operando em cronogramas de produto práticos em vez de horizontes puramente de pesquisa, o que muda como o resto da indústria de AI deve pensar sobre as capacidades internas da Microsoft.

O Cenário Competitivo

A vantagem da Microsoft é distribuição: o ecossistema Office alcança centenas de milhões de usuários, e integrar geração de imagens diretamente em Word, PowerPoint e Teams cria um ponto de entrada acessível que não exige que usuários procurem um serviço de geração de imagens independente. Se MAI-Image-2 executar competitivamente com o estado atual da arte, a vantagem de distribuição pode importar mais que qualquer diferenciação técnica.

O significado mais amplo de MAI-Image-2 pode ser menos sobre a capacidade específica e mais sobre o que sinaliza: que Microsoft está investindo em desenvolvimento de capacidades de AI que não passam pela OpenAI, e que o trabalho da equipe de superinteligência agora está produzindo resultados visíveis para o mundo exterior.

Este artigo é baseado em reportagem de The Decoder. Leia o artigo original.

Anthropic pede auditorias vinculantes ao reposicionar a IA como infraestrutura estratégica

O CEO da Anthropic, Dario Amodei, diz que as regras de transparência já não bastam e pede auditorias obrigatórias de terceiros para sistemas de IA de fronteira.

Read article

Originally published on the-decoder.com

Equipe de Superinteligência da Microsoft Lança Seu Primeiro Produto: MAI-Image-2