Человекообразные Боты: Прыжок от воображения к реальности
Человеческие роботы быстро переходят от научной фантастики к реальным приложениям. Снижение затрат на оборудование, увеличение капитальных вложений и прорывы в технологиях движения и манипуляции способствуют новой значительной трансформации в области вычислений. Несмотря на то, что вычислительная мощность и аппаратное обеспечение становятся все более доступными, нехватка данных для обучения по-прежнему является узким местом, сдерживающим развитие отрасли.
На этом фоне некоторые проекты начали использовать децентрализованный физический искусственный интеллект (DePAI) для краудсорсинга высококачественных данных о движении и синтетических данных, а также для создания базовых моделей Ботов. Это создает благоприятные условия для ускорения практического развертывания гуманоидных роботов.
Человекообразные Боты: от однофункциональных до многофункциональных
Коммерциализация робототехники не является чем-то новым. С 2002 года, когда появился робот-пылесос iRobot Roomba, и до популярных в последние годы умных камер для домашних животных, эти однопurpose устройства давно вошли в дома тысяч людей. С развитием искусственного интеллекта роботы эволюционируют от однопurpose к многофункциональным формам, чтобы адаптироваться к более сложной открытой среде.
Ожидается, что в течение следующих 5-15 лет человекоподобные Боты постепенно усовершенствуются, начиная с базовых задач по уборке и приготовлению пищи, и развиваясь до выполнения сложных работ, таких как обслуживание клиентов, пожаротушение и даже хирургические операции.
Недавние разработки превращают гуманоидных Боты из научной фантастики в осязаемую реальность:
Рыночные тренды: более 100 компаний занимаются разработкой гуманоидных Ботов.
Технический прорыв: новое поколение человекоподобных роботов демонстрирует плавные и естественные движения, что позволяет им осуществлять гуманизированное взаимодействие в реальной среде. Некоторые роботы могут двигаться со скоростью до 3,3 метра в секунду, что значительно превышает среднюю скорость человека в 1,4 метра в секунду.
Ожидаемые затраты: к 2032 году стоимость человекоподобных Ботов, как ожидается, будет ниже уровня зарплат в США.
Упущение в развитии: обучающие данные из реального мира
Несмотря на блестящие перспективы в области гуманоидных роботов, недостаток качества и количества данных по-прежнему препятствует их широкомасштабному развертыванию.
В отличие от этого, другие технологии искусственного интеллекта, такие как автономное вождение, в основном решили проблему данных. Например, некоторые системы автономного вождения собрали миллиарды миль реальных данных о вождении на дорогах с помощью автопарков. На начальных этапах разработки эти системы также имели человека-наставника на пассажирском сиденье для проведения обучения в реальном времени.
Однако потребители вряд ли примут существование "Боты-няни". Это означает, что роботы должны обладать высокой производительностью сразу после распаковки, что требует завершения всего обучения до коммерческого производства. Масштаб и качество данных остаются постоянной проблемой.
Разные типы моделей ИИ имеют свои единицы тренировочных данных, например, большие языковые модели используют токены, генераторы изображений - видео-текстовые пары, а робототехника - фрагменты движений. Сравнивая масштабы данных в различных областях, можно четко увидеть разрыв в доступности данных, с которым сталкивается робототехника:
Объем обучающих данных некоторой крупной языковой модели превышает 15 триллионов текстовых токенов.
Некоторые генераторы изображений на основе ИИ используют миллиарды пар видео и текстов с метками.
В то же время, самый большой набор данных о Ботах содержит всего около 2,4 миллиона записей взаимодействий.
Этот разрыв объясняет, почему технологии Боты еще не достигли уровня настоящих базовых моделей, как это сделали крупные языковые модели - ключевым моментом является то, что база данных еще не завершена.
Традиционные методы сбора данных не могут удовлетворить потребности в масштабировании данных для обучения человекоподобных Ботов:
Симуляция: низкая стоимость, но отсутствуют реальные границы сцены (разрыв между симуляцией и реальностью)
Интернет-видео: не может предоставить необходимую для обучения Боты чувственную и силовую обратную связь.
Реальные данные: хотя они точные, но требуют дистанционного управления и ручного замыкания цикла, что приводит к высоким затратам и отсутствию масштабируемости.
Модели, обученные в виртуальной среде, часто трудно адаптируются к сложным условиям реального мира. Например, виртуально обученные Боты могут легко захватывать объекты в идеальных условиях, но часто оказываются в затруднительном положении при столкновении с беспорядочной средой, неровными поверхностями или непредвиденными ситуациями.
Некоторые инновационные проекты строят вертикально интегрированные программные и дата-платформы для приложений, связанных с телесным интеллектуальным Боты. Эти платформы не только направлены на решение проблем с данными в области гуманоидных роботов, но и становятся полнофункциональными драйверами для достижения телесного интеллекта благодаря собственной разработке аппаратного обеспечения, мульти-модальной симуляционной инфраструктуры и сочетанию базовых моделей.
Эти платформы обычно начинают с собственных потребительских устройств захвата движений, создавая быстро развивающуюся экосистему игр в дополненной и виртуальной реальности. Пользователи предоставляют высокоточные данные о движениях в обмен на сетевые вознаграждения, способствуя устойчивому развитию платформы. Некоторые платформы продали тысячи устройств, а количество активных пользователей в месяц достигло десятков тысяч и установили четкий путь роста пользователей.
Этот рост в основном обусловлен естественным развитием: пользователи привлекаются развлекательной составляющей игр, в то время как стримеры используют устройства захвата движения для реализации реалистичного управления цифровыми образами в реальном времени. Этот спонтанно сформированный положительный цикл обеспечивает масштабируемое, низкозатратное и высококачественное производство данных, что делает наборы данных востребованным ресурсом для обучения ведущими Боты.
Некоторые платформы продолжают разработку многомодальных данных, объединяющих фрагментированные симуляционные среды. В настоящее время область симуляции сильно фрагментирована, различные инструменты действуют независимо друг от друга, и хотя у каждого есть свои преимущества, они не могут взаимодействовать. Эта ситуация задерживает процесс разработки и усугубляет разрыв между симуляцией и реальностью. Реализуя стандартизацию многосимуляторов, эти платформы создали общую виртуальную инфраструктуру для разработки и оценки Ботов, поддерживающую согласованные эталонные испытания, что значительно повышает масштабируемость и обобщающую способность систем.
Боты базовая модель
В этих технологических стэках наиболее критическим компонентом, возможно, является базовая модель ботов. Будучи одной из первых базовых моделей ботов, такие модели создаются как ключевые системы для новой физической инфраструктуры искусственного интеллекта. Их позиционирование схоже с традиционными большими языковыми базовыми моделями, но ориентировано на область роботов.
Объединив краудсорсинговые данные о движении с мощной системой моделирования и системой авторизации моделей, эти платформы могут обучать базовые модели, обладающие способностью к обобщению в различных сценариях. Эта модель может поддерживать разнообразные приложения роботов в промышленности, потребительском секторе и исследовательской области, обеспечивая универсальное развертывание на основе большого объема разнообразных данных.
Некоторые проекты уже активно продвигают коммерциализацию технологий, запустив платные пилотные проекты с несколькими компаниями-ботами и установив стратегические партнерские отношения. Рынок гуманоидных роботов в Китае переживает быстрый рост, составляя около трети мирового рынка. Примечательно, что китайские производители занимают более 60% мирового рынка четвероногих роботов и планируют произвести более 1000 гуманоидных роботов к 2025 году.
Роль технологий криптовалют в стеке физических технологий искусственного интеллекта
Криптографические технологии строят полный вертикальный стек для искусственного интеллекта в физическом мире. Хотя разные проекты принадлежат к различным уровням физического искусственного интеллекта, у них есть одна общая черта: все они являются проектами децентрализованного физического искусственного интеллекта (DePAI). DePAI создает открытую, совместимую, безразрешительную механизм расширения через токенизированные стимулы на протяжении всего технологического стека, что делает возможным децентрализованное развитие физического искусственного интеллекта.
Некоторые проекты еще не выпустили токены, и органический рост их бизнеса особенно ценен. Когда механизмы стимулов токенов официально запустятся, участие в сети станет ключевым элементом для ускорения эффекта маховика DePAI: пользователи, покупающие оборудование, смогут получать стимулы от проекта, в то время как компании по разработке Ботов будут выплачивать вознаграждения за вклад владельцам оборудования. Эта двойная система стимулов будет способствовать тому, чтобы больше людей приобретали и использовали устройства для сбора данных. В то же время проект будет динамически поощрять сбор данных о кастомизированном поведении, что позволит более эффективно преодолевать технологический разрыв между симуляцией и реальным применением.
Заключение
Революция платформ Ботов неостановима, но, как и все платформы, ее масштабируемое развитие невозможно без поддержки данных. Децентрализованный физический искусственный интеллект (DePAI) заполняет самый критичный пробел в технологии стека ИИ-роботов: его решения по данным для роботов обладают экономической эффективностью, высокой масштабируемостью и модульными характеристиками.
Когда технологии Боты станут передовым фронтом AI, эти инновационные проекты превращают обычных пользователей в "шахтеров" данных о действиях. Как большие языковые модели нуждаются в поддержке текстовых меток, так и человекоподобным Ботам требуется огромное количество последовательностей действий для обучения. Благодаря этим усилиям мы надеемся преодолеть последний барьер и осуществить переход человекоподобных Ботов из научной фантастики в реальность.
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
DePAI: Ключевой фактор в реализации гуманоидных Ботов
Человекообразные Боты: Прыжок от воображения к реальности
Человеческие роботы быстро переходят от научной фантастики к реальным приложениям. Снижение затрат на оборудование, увеличение капитальных вложений и прорывы в технологиях движения и манипуляции способствуют новой значительной трансформации в области вычислений. Несмотря на то, что вычислительная мощность и аппаратное обеспечение становятся все более доступными, нехватка данных для обучения по-прежнему является узким местом, сдерживающим развитие отрасли.
На этом фоне некоторые проекты начали использовать децентрализованный физический искусственный интеллект (DePAI) для краудсорсинга высококачественных данных о движении и синтетических данных, а также для создания базовых моделей Ботов. Это создает благоприятные условия для ускорения практического развертывания гуманоидных роботов.
Человекообразные Боты: от однофункциональных до многофункциональных
Коммерциализация робототехники не является чем-то новым. С 2002 года, когда появился робот-пылесос iRobot Roomba, и до популярных в последние годы умных камер для домашних животных, эти однопurpose устройства давно вошли в дома тысяч людей. С развитием искусственного интеллекта роботы эволюционируют от однопurpose к многофункциональным формам, чтобы адаптироваться к более сложной открытой среде.
Ожидается, что в течение следующих 5-15 лет человекоподобные Боты постепенно усовершенствуются, начиная с базовых задач по уборке и приготовлению пищи, и развиваясь до выполнения сложных работ, таких как обслуживание клиентов, пожаротушение и даже хирургические операции.
Недавние разработки превращают гуманоидных Боты из научной фантастики в осязаемую реальность:
Упущение в развитии: обучающие данные из реального мира
Несмотря на блестящие перспективы в области гуманоидных роботов, недостаток качества и количества данных по-прежнему препятствует их широкомасштабному развертыванию.
В отличие от этого, другие технологии искусственного интеллекта, такие как автономное вождение, в основном решили проблему данных. Например, некоторые системы автономного вождения собрали миллиарды миль реальных данных о вождении на дорогах с помощью автопарков. На начальных этапах разработки эти системы также имели человека-наставника на пассажирском сиденье для проведения обучения в реальном времени.
Однако потребители вряд ли примут существование "Боты-няни". Это означает, что роботы должны обладать высокой производительностью сразу после распаковки, что требует завершения всего обучения до коммерческого производства. Масштаб и качество данных остаются постоянной проблемой.
Разные типы моделей ИИ имеют свои единицы тренировочных данных, например, большие языковые модели используют токены, генераторы изображений - видео-текстовые пары, а робототехника - фрагменты движений. Сравнивая масштабы данных в различных областях, можно четко увидеть разрыв в доступности данных, с которым сталкивается робототехника:
Этот разрыв объясняет, почему технологии Боты еще не достигли уровня настоящих базовых моделей, как это сделали крупные языковые модели - ключевым моментом является то, что база данных еще не завершена.
Традиционные методы сбора данных не могут удовлетворить потребности в масштабировании данных для обучения человекоподобных Ботов:
Модели, обученные в виртуальной среде, часто трудно адаптируются к сложным условиям реального мира. Например, виртуально обученные Боты могут легко захватывать объекты в идеальных условиях, но часто оказываются в затруднительном положении при столкновении с беспорядочной средой, неровными поверхностями или непредвиденными ситуациями.
Полностековое видение децентрализованного искусственного интеллекта
Некоторые инновационные проекты строят вертикально интегрированные программные и дата-платформы для приложений, связанных с телесным интеллектуальным Боты. Эти платформы не только направлены на решение проблем с данными в области гуманоидных роботов, но и становятся полнофункциональными драйверами для достижения телесного интеллекта благодаря собственной разработке аппаратного обеспечения, мульти-модальной симуляционной инфраструктуры и сочетанию базовых моделей.
Эти платформы обычно начинают с собственных потребительских устройств захвата движений, создавая быстро развивающуюся экосистему игр в дополненной и виртуальной реальности. Пользователи предоставляют высокоточные данные о движениях в обмен на сетевые вознаграждения, способствуя устойчивому развитию платформы. Некоторые платформы продали тысячи устройств, а количество активных пользователей в месяц достигло десятков тысяч и установили четкий путь роста пользователей.
Этот рост в основном обусловлен естественным развитием: пользователи привлекаются развлекательной составляющей игр, в то время как стримеры используют устройства захвата движения для реализации реалистичного управления цифровыми образами в реальном времени. Этот спонтанно сформированный положительный цикл обеспечивает масштабируемое, низкозатратное и высококачественное производство данных, что делает наборы данных востребованным ресурсом для обучения ведущими Боты.
Некоторые платформы продолжают разработку многомодальных данных, объединяющих фрагментированные симуляционные среды. В настоящее время область симуляции сильно фрагментирована, различные инструменты действуют независимо друг от друга, и хотя у каждого есть свои преимущества, они не могут взаимодействовать. Эта ситуация задерживает процесс разработки и усугубляет разрыв между симуляцией и реальностью. Реализуя стандартизацию многосимуляторов, эти платформы создали общую виртуальную инфраструктуру для разработки и оценки Ботов, поддерживающую согласованные эталонные испытания, что значительно повышает масштабируемость и обобщающую способность систем.
Боты базовая модель
В этих технологических стэках наиболее критическим компонентом, возможно, является базовая модель ботов. Будучи одной из первых базовых моделей ботов, такие модели создаются как ключевые системы для новой физической инфраструктуры искусственного интеллекта. Их позиционирование схоже с традиционными большими языковыми базовыми моделями, но ориентировано на область роботов.
Объединив краудсорсинговые данные о движении с мощной системой моделирования и системой авторизации моделей, эти платформы могут обучать базовые модели, обладающие способностью к обобщению в различных сценариях. Эта модель может поддерживать разнообразные приложения роботов в промышленности, потребительском секторе и исследовательской области, обеспечивая универсальное развертывание на основе большого объема разнообразных данных.
Некоторые проекты уже активно продвигают коммерциализацию технологий, запустив платные пилотные проекты с несколькими компаниями-ботами и установив стратегические партнерские отношения. Рынок гуманоидных роботов в Китае переживает быстрый рост, составляя около трети мирового рынка. Примечательно, что китайские производители занимают более 60% мирового рынка четвероногих роботов и планируют произвести более 1000 гуманоидных роботов к 2025 году.
Роль технологий криптовалют в стеке физических технологий искусственного интеллекта
Криптографические технологии строят полный вертикальный стек для искусственного интеллекта в физическом мире. Хотя разные проекты принадлежат к различным уровням физического искусственного интеллекта, у них есть одна общая черта: все они являются проектами децентрализованного физического искусственного интеллекта (DePAI). DePAI создает открытую, совместимую, безразрешительную механизм расширения через токенизированные стимулы на протяжении всего технологического стека, что делает возможным децентрализованное развитие физического искусственного интеллекта.
Некоторые проекты еще не выпустили токены, и органический рост их бизнеса особенно ценен. Когда механизмы стимулов токенов официально запустятся, участие в сети станет ключевым элементом для ускорения эффекта маховика DePAI: пользователи, покупающие оборудование, смогут получать стимулы от проекта, в то время как компании по разработке Ботов будут выплачивать вознаграждения за вклад владельцам оборудования. Эта двойная система стимулов будет способствовать тому, чтобы больше людей приобретали и использовали устройства для сбора данных. В то же время проект будет динамически поощрять сбор данных о кастомизированном поведении, что позволит более эффективно преодолевать технологический разрыв между симуляцией и реальным применением.
Заключение
Революция платформ Ботов неостановима, но, как и все платформы, ее масштабируемое развитие невозможно без поддержки данных. Децентрализованный физический искусственный интеллект (DePAI) заполняет самый критичный пробел в технологии стека ИИ-роботов: его решения по данным для роботов обладают экономической эффективностью, высокой масштабируемостью и модульными характеристиками.
Когда технологии Боты станут передовым фронтом AI, эти инновационные проекты превращают обычных пользователей в "шахтеров" данных о действиях. Как большие языковые модели нуждаются в поддержке текстовых меток, так и человекоподобным Ботам требуется огромное количество последовательностей действий для обучения. Благодаря этим усилиям мы надеемся преодолеть последний барьер и осуществить переход человекоподобных Ботов из научной фантастики в реальность.