Os Bots humanoides estão rapidamente passando da ficção científica para aplicações reais. A diminuição dos custos de hardware, o aumento do investimento de capital e as inovações nas tecnologias de movimento e operação estão juntos impulsionando uma nova onda de mudanças significativas no campo da computação. Embora a capacidade de computação e os dispositivos de hardware estejam se tornando cada vez mais comuns, a falta de dados de treinamento continua a ser um gargalo que limita o desenvolvimento da indústria.
Neste contexto, alguns projetos começaram a utilizar Inteligência Artificial Física Descentralizada (DePAI) para crowdsourcing de dados de movimento de alta qualidade e dados sintéticos, e construir modelos base de Bots. Isso cria condições favoráveis para acelerar a implementação prática de robôs humanoides.
Bots: de funções únicas a multi-talentos
A comercialização da tecnologia de Bots não é uma novidade. Desde o iRobot Roomba, um aspirador robô lançado em 2002, até as populares câmaras inteligentes para animais de estimação nos últimos anos, esses dispositivos de funcionalidade única já estão presentes em muitas casas. Com os avanços da inteligência artificial, os Bots estão evoluindo de funcionalidades únicas para formas multifuncionais, a fim de se adaptarem a ambientes abertos mais complexos.
Prevê-se que, nos próximos 5 a 15 anos, os robôs humanoides serão gradualmente atualizados, passando de tarefas básicas de limpeza e cozinha para serem capazes de realizar trabalhos complexos como atendimento ao cliente, combate a incêndios e até cirurgias.
Recentemente, o desenvolvimento está a transformar os robôs humanoides de ficção científica em uma realidade ao alcance das mãos:
Tendências de mercado: mais de 100 empresas estão investindo no campo dos Bots.
Avanços tecnológicos: A nova geração de Bots apresenta movimentos fluidos e naturais, permitindo a interação humanizada em ambientes reais. A velocidade de caminhada de certos Bots já alcançou 3,3 metros por segundo, muito acima da média humana de 1,4 metros por segundo.
Expectativa de custo: até 2032, o custo dos Bots deverá ser inferior ao nível salarial humano nos Estados Unidos.
Gargalos de desenvolvimento: dados de treinamento do mundo real
Apesar de o campo dos robôs humanoides ter um futuro promissor, a falta de qualidade e quantidade de dados ainda impede a sua implementação em larga escala.
Em comparação, outras tecnologias de entidades de inteligência artificial, como a condução autónoma, já resolveram basicamente o problema dos dados. Por exemplo, certos sistemas de condução autónoma coletaram bilhões de milhas de dados reais de condução em estradas através de frotas. Nos primeiros estágios de desenvolvimento, esses sistemas também contavam com monitorizadores humanos no banco do passageiro para treinamento em tempo real.
No entanto, os consumidores são pouco propensos a aceitar a existência de "Bots babás". Isso significa que os Bots devem ter um alto desempenho pronto a usar, o que requer que todo o treinamento seja concluído antes da produção comercial. A escala e a qualidade dos dados tornam-se um problema persistente.
Diferentes tipos de modelos de IA têm suas próprias unidades de dados de treino, como modelos de linguagem grandes usam Tokens, geradores de imagem usam pares de vídeo-texto, e Bots usam clipes de movimento. Comparando a escala de dados em diferentes áreas, pode-se ver claramente a disparidade na disponibilidade de dados enfrentada pela tecnologia dos Bots:
O tamanho dos dados de treinamento de um grande modelo de linguagem ultrapassa 15 trilhões de marcadores de texto.
Algumas IAs de geração de imagens utilizam bilhões de pares de texto de vídeo etiquetados.
Em comparação, o maior conjunto de dados de Bots contém apenas cerca de 2,4 milhões de registros de interação.
Esta discrepância explica por que a tecnologia de Bots ainda não alcançou um verdadeiro modelo fundamental como os grandes modelos de linguagem, sendo que a chave está na base de dados que ainda não está completa.
Os métodos tradicionais de coleta de dados têm dificuldade em atender à demanda de escala de dados de treinamento para Bots humanoides:
Simulação: custo baixo, mas falta cenários de limite real (a diferença entre simulação e realidade)
Vídeo na internet: incapaz de fornecer a experiência de corpo e ambiente de feedback de força necessários para o aprendizado dos Bots.
Dados do mundo real: embora sejam precisos, requerem controle remoto e operações de ciclo fechado humano, resultando em altos custos e falta de escalabilidade.
Modelos treinados em ambientes virtuais muitas vezes têm dificuldade em se adaptar às complexas situações do mundo real. Por exemplo, um robô treinado virtualmente pode facilmente pegar objetos em condições ideais, mas muitas vezes fica sem saber o que fazer quando enfrenta ambientes desordenados, superfícies irregulares ou situações inesperadas.
Visão de stack completo para AI descentralizada
Alguns projetos inovadores estão a construir plataformas de software e dados de integração vertical voltadas para aplicações de robôs inteligentes corporais. Essas plataformas não se dedicam apenas a resolver os problemas de gargalo de dados no campo dos robôs humanoides, mas também se tornam impulsionadores de pilha completa para a realização da inteligência corporal, através da combinação de hardware desenvolvido internamente, infraestrutura de simulação multimodal e modelos básicos.
Essas plataformas geralmente começam com dispositivos de captura de movimento de consumo proprietários, construindo um ecossistema de jogos de realidade aumentada e virtual de rápida expansão. Os usuários trocam dados de movimento de alta fidelidade por recompensas de incentivo na rede, impulsionando o desenvolvimento contínuo da plataforma. Algumas plataformas já venderam milhares de dispositivos, com usuários ativos mensais chegando a dezenas de milhares, e estabeleceram um caminho claro para o crescimento de usuários.
Esse crescimento é principalmente fruto do desenvolvimento natural: os usuários são atraídos pela diversão do próprio jogo, enquanto os streamers utilizam dispositivos de captura de movimento para realizar a animação em tempo real de avatares digitais. Esse ciclo virtuoso que se forma espontaneamente permite uma produção de dados escalável, de baixo custo e de alta fidelidade, fazendo com que os conjuntos de dados se tornem recursos de treinamento disputados pelas principais empresas de Bots.
Algumas plataformas ainda estão a desenvolver plataformas de dados multimodais para um ambiente de simulação fragmentado e unificado. Atualmente, o campo da simulação está altamente fragmentado, com diferentes ferramentas a operarem de forma independente; embora cada uma tenha as suas vantagens, não conseguem comunicar entre si. Esta situação de divisão atrasou o progresso da investigação e aumentou a discrepância entre a simulação e a realidade. Ao implementar a padronização de múltiplos simuladores, estas plataformas criaram uma infraestrutura virtual partilhada para o desenvolvimento e avaliação de modelos de Bots, suportando testes de referência consistentes e melhorando significativamente a escalabilidade e a capacidade de generalização do sistema.
Bots基础模型
Entre essas pilhas tecnológicas, o componente mais crucial talvez seja o modelo base de Bots. Como um dos primeiros modelos base de Bots, esses modelos estão sendo desenvolvidos como sistemas centrais da nova infraestrutura de inteligência artificial física emergente. Sua posição é semelhante à dos tradicionais modelos de linguagem de grande escala, mas voltados para o campo dos Bots.
Ao combinar dados de movimento de crowdsourcing com um potente sistema de simulação e um sistema de autorização de modelos, estas plataformas conseguem treinar modelos base com capacidade de generalização em múltiplos cenários. Este modelo pode suportar aplicações diversificadas de robôs nas áreas industrial, de consumo e de pesquisa, permitindo uma implementação generalizada sob uma grande variedade de dados.
Alguns projetos já começaram a avançar ativamente no processo de comercialização da tecnologia, iniciando projetos piloto pagos com várias empresas de Bots e estabelecendo parcerias estratégicas. O mercado de robôs humanoides na China está a passar por um crescimento rápido, representando cerca de um terço do mercado global. É digno de nota que fabricantes chineses detêm mais de 60% do mercado global de robôs quadrúpedes e planejam produzir mais de 1000 robôs humanoides até 2025.
O papel da tecnologia de criptomoeda na pilha de tecnologia de inteligência artificial física
A tecnologia de criptografia está a construir uma pilha vertical completa de inteligência artificial física. Embora diferentes projetos pertençam a diferentes camadas da pilha de inteligência artificial física, eles têm um ponto em comum: todos são projetos de inteligência artificial física descentralizada (DePAI). O DePAI atravessa toda a pilha tecnológica por meio de incentivos em tokens, criando um mecanismo de expansão aberto, combinável e sem licença, tornando a evolução descentralizada da inteligência artificial física uma realidade.
Alguns projetos ainda não emitiram tokens, e o crescimento orgânico de seus negócios é ainda mais notável. Quando o mecanismo de incentivo de tokens for oficialmente iniciado, a participação na rede será um elemento chave para acelerar o efeito flywheel do DePAI: os usuários que adquirirem equipamentos de hardware poderão receber incentivos por parte do projeto, enquanto as empresas de desenvolvimento de Bots pagarão recompensas de contribuição aos detentores dos equipamentos. Este duplo incentivo irá promover que mais pessoas adquiram e utilizem os equipamentos de coleta. Ao mesmo tempo, o projeto irá incentivar dinamicamente a coleta de dados de comportamento personalizados que tenham alto valor, de modo a fechar mais efetivamente a lacuna técnica entre simulação e aplicações reais.
Conclusão
A revolução da plataforma Bots é imparável, mas como todas as plataformas, o seu desenvolvimento em escala depende do suporte de dados. A Inteligência Artificial Física Descentralizada (DePAI) está a preencher a lacuna mais crítica na pilha de tecnologia de Bots: a sua solução de dados para Bots é economicamente viável, altamente escalável e modular.
Quando a tecnologia de Bots se torna a próxima fronteira da IA, esses projetos inovadores estão transformando usuários comuns em "mineiros" de dados de movimento. Assim como os grandes modelos de linguagem precisam do suporte de marcação de texto, os Bots precisam de enormes sequências de movimento para treinamento. Através desses esforços, temos a esperança de superar o último gargalo e realizar a transição dos Bots da ficção científica para a realidade.
Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.
DePAI: A chave para a implementação de robôs humanoides
Bots: um salto da imaginação para a realidade
Os Bots humanoides estão rapidamente passando da ficção científica para aplicações reais. A diminuição dos custos de hardware, o aumento do investimento de capital e as inovações nas tecnologias de movimento e operação estão juntos impulsionando uma nova onda de mudanças significativas no campo da computação. Embora a capacidade de computação e os dispositivos de hardware estejam se tornando cada vez mais comuns, a falta de dados de treinamento continua a ser um gargalo que limita o desenvolvimento da indústria.
Neste contexto, alguns projetos começaram a utilizar Inteligência Artificial Física Descentralizada (DePAI) para crowdsourcing de dados de movimento de alta qualidade e dados sintéticos, e construir modelos base de Bots. Isso cria condições favoráveis para acelerar a implementação prática de robôs humanoides.
Bots: de funções únicas a multi-talentos
A comercialização da tecnologia de Bots não é uma novidade. Desde o iRobot Roomba, um aspirador robô lançado em 2002, até as populares câmaras inteligentes para animais de estimação nos últimos anos, esses dispositivos de funcionalidade única já estão presentes em muitas casas. Com os avanços da inteligência artificial, os Bots estão evoluindo de funcionalidades únicas para formas multifuncionais, a fim de se adaptarem a ambientes abertos mais complexos.
Prevê-se que, nos próximos 5 a 15 anos, os robôs humanoides serão gradualmente atualizados, passando de tarefas básicas de limpeza e cozinha para serem capazes de realizar trabalhos complexos como atendimento ao cliente, combate a incêndios e até cirurgias.
Recentemente, o desenvolvimento está a transformar os robôs humanoides de ficção científica em uma realidade ao alcance das mãos:
Gargalos de desenvolvimento: dados de treinamento do mundo real
Apesar de o campo dos robôs humanoides ter um futuro promissor, a falta de qualidade e quantidade de dados ainda impede a sua implementação em larga escala.
Em comparação, outras tecnologias de entidades de inteligência artificial, como a condução autónoma, já resolveram basicamente o problema dos dados. Por exemplo, certos sistemas de condução autónoma coletaram bilhões de milhas de dados reais de condução em estradas através de frotas. Nos primeiros estágios de desenvolvimento, esses sistemas também contavam com monitorizadores humanos no banco do passageiro para treinamento em tempo real.
No entanto, os consumidores são pouco propensos a aceitar a existência de "Bots babás". Isso significa que os Bots devem ter um alto desempenho pronto a usar, o que requer que todo o treinamento seja concluído antes da produção comercial. A escala e a qualidade dos dados tornam-se um problema persistente.
Diferentes tipos de modelos de IA têm suas próprias unidades de dados de treino, como modelos de linguagem grandes usam Tokens, geradores de imagem usam pares de vídeo-texto, e Bots usam clipes de movimento. Comparando a escala de dados em diferentes áreas, pode-se ver claramente a disparidade na disponibilidade de dados enfrentada pela tecnologia dos Bots:
Esta discrepância explica por que a tecnologia de Bots ainda não alcançou um verdadeiro modelo fundamental como os grandes modelos de linguagem, sendo que a chave está na base de dados que ainda não está completa.
Os métodos tradicionais de coleta de dados têm dificuldade em atender à demanda de escala de dados de treinamento para Bots humanoides:
Modelos treinados em ambientes virtuais muitas vezes têm dificuldade em se adaptar às complexas situações do mundo real. Por exemplo, um robô treinado virtualmente pode facilmente pegar objetos em condições ideais, mas muitas vezes fica sem saber o que fazer quando enfrenta ambientes desordenados, superfícies irregulares ou situações inesperadas.
Visão de stack completo para AI descentralizada
Alguns projetos inovadores estão a construir plataformas de software e dados de integração vertical voltadas para aplicações de robôs inteligentes corporais. Essas plataformas não se dedicam apenas a resolver os problemas de gargalo de dados no campo dos robôs humanoides, mas também se tornam impulsionadores de pilha completa para a realização da inteligência corporal, através da combinação de hardware desenvolvido internamente, infraestrutura de simulação multimodal e modelos básicos.
Essas plataformas geralmente começam com dispositivos de captura de movimento de consumo proprietários, construindo um ecossistema de jogos de realidade aumentada e virtual de rápida expansão. Os usuários trocam dados de movimento de alta fidelidade por recompensas de incentivo na rede, impulsionando o desenvolvimento contínuo da plataforma. Algumas plataformas já venderam milhares de dispositivos, com usuários ativos mensais chegando a dezenas de milhares, e estabeleceram um caminho claro para o crescimento de usuários.
Esse crescimento é principalmente fruto do desenvolvimento natural: os usuários são atraídos pela diversão do próprio jogo, enquanto os streamers utilizam dispositivos de captura de movimento para realizar a animação em tempo real de avatares digitais. Esse ciclo virtuoso que se forma espontaneamente permite uma produção de dados escalável, de baixo custo e de alta fidelidade, fazendo com que os conjuntos de dados se tornem recursos de treinamento disputados pelas principais empresas de Bots.
Algumas plataformas ainda estão a desenvolver plataformas de dados multimodais para um ambiente de simulação fragmentado e unificado. Atualmente, o campo da simulação está altamente fragmentado, com diferentes ferramentas a operarem de forma independente; embora cada uma tenha as suas vantagens, não conseguem comunicar entre si. Esta situação de divisão atrasou o progresso da investigação e aumentou a discrepância entre a simulação e a realidade. Ao implementar a padronização de múltiplos simuladores, estas plataformas criaram uma infraestrutura virtual partilhada para o desenvolvimento e avaliação de modelos de Bots, suportando testes de referência consistentes e melhorando significativamente a escalabilidade e a capacidade de generalização do sistema.
Bots基础模型
Entre essas pilhas tecnológicas, o componente mais crucial talvez seja o modelo base de Bots. Como um dos primeiros modelos base de Bots, esses modelos estão sendo desenvolvidos como sistemas centrais da nova infraestrutura de inteligência artificial física emergente. Sua posição é semelhante à dos tradicionais modelos de linguagem de grande escala, mas voltados para o campo dos Bots.
Ao combinar dados de movimento de crowdsourcing com um potente sistema de simulação e um sistema de autorização de modelos, estas plataformas conseguem treinar modelos base com capacidade de generalização em múltiplos cenários. Este modelo pode suportar aplicações diversificadas de robôs nas áreas industrial, de consumo e de pesquisa, permitindo uma implementação generalizada sob uma grande variedade de dados.
Alguns projetos já começaram a avançar ativamente no processo de comercialização da tecnologia, iniciando projetos piloto pagos com várias empresas de Bots e estabelecendo parcerias estratégicas. O mercado de robôs humanoides na China está a passar por um crescimento rápido, representando cerca de um terço do mercado global. É digno de nota que fabricantes chineses detêm mais de 60% do mercado global de robôs quadrúpedes e planejam produzir mais de 1000 robôs humanoides até 2025.
O papel da tecnologia de criptomoeda na pilha de tecnologia de inteligência artificial física
A tecnologia de criptografia está a construir uma pilha vertical completa de inteligência artificial física. Embora diferentes projetos pertençam a diferentes camadas da pilha de inteligência artificial física, eles têm um ponto em comum: todos são projetos de inteligência artificial física descentralizada (DePAI). O DePAI atravessa toda a pilha tecnológica por meio de incentivos em tokens, criando um mecanismo de expansão aberto, combinável e sem licença, tornando a evolução descentralizada da inteligência artificial física uma realidade.
Alguns projetos ainda não emitiram tokens, e o crescimento orgânico de seus negócios é ainda mais notável. Quando o mecanismo de incentivo de tokens for oficialmente iniciado, a participação na rede será um elemento chave para acelerar o efeito flywheel do DePAI: os usuários que adquirirem equipamentos de hardware poderão receber incentivos por parte do projeto, enquanto as empresas de desenvolvimento de Bots pagarão recompensas de contribuição aos detentores dos equipamentos. Este duplo incentivo irá promover que mais pessoas adquiram e utilizem os equipamentos de coleta. Ao mesmo tempo, o projeto irá incentivar dinamicamente a coleta de dados de comportamento personalizados que tenham alto valor, de modo a fechar mais efetivamente a lacuna técnica entre simulação e aplicações reais.
Conclusão
A revolução da plataforma Bots é imparável, mas como todas as plataformas, o seu desenvolvimento em escala depende do suporte de dados. A Inteligência Artificial Física Descentralizada (DePAI) está a preencher a lacuna mais crítica na pilha de tecnologia de Bots: a sua solução de dados para Bots é economicamente viável, altamente escalável e modular.
Quando a tecnologia de Bots se torna a próxima fronteira da IA, esses projetos inovadores estão transformando usuários comuns em "mineiros" de dados de movimento. Assim como os grandes modelos de linguagem precisam do suporte de marcação de texto, os Bots precisam de enormes sequências de movimento para treinamento. Através desses esforços, temos a esperança de superar o último gargalo e realizar a transição dos Bots da ficção científica para a realidade.