前卡内基梅隆大学教授迪帕克·帕塔克(左)和阿比纳夫·古普塔(右)于2023年创立了Skild AI,旨在为人工智能打造一个”通用大脑”。
目前,Skild AI已经筹集了3亿美元,用于继续构建即插即用的机器人智能,希望能让企业将其集成到各种机器人中。
机器人,无论是处理基本工厂任务的双足人形机器人,还是用于城市作战的四足军用“机器狗”,它们都需要“大脑”。从历史上看,这些机器人都是高度专业化的专用机器人,但一家位于匹兹堡的机器人初创公司声称,他们已经创造出了一种现成的单一智能系统,可以插入不同的机器人中,从而实现一些基本功能。
Skild AI公司由两位前卡内基梅隆大学(Carnegie Mellon University)教授阿比纳夫·古普塔(Abhinav Gupta)和迪帕克·帕塔克(Deepak Pathak)于2023年5月创立,它创建了一个被称为”通用大脑”的基础模型,可以安装到各种机器人上,使它们能够完成攀爬陡坡、越过障碍物以及识别和拾取物品等功能。
该公司7月2日宣布,已在A轮融资中融资3亿美元,估值为15亿美元。本轮融资由光速创投(Lightspeed Ventures)、软银(Softbank)、Coatue和亚马逊创始人杰夫·贝索斯(Jeff Bezos)领投,参与融资机构包括CRV、Felicis Ventures、Menlo Ventures、亚马逊、红杉、General Catalyst、SV Angel和CMU。
光速创投的合伙人拉瓦拉·贾恩(Raviraj Jain)也是该公司2023年7月种子轮融资的领投人,他告诉《福布斯》,去年4月第一次看到Skild AI的模型进行压力测试时,他就对这些模型印象深刻。使用它们的机器人能够在它们从未见过的环境中执行任务,而这些环境并不是为演示而设计的。他说:“那时我看到的机器人还能爬楼梯,我认为它们能爬得这么好真的很不可思议,因为这牵涉到一个非常复杂的稳定性问题。”
更令人印象深刻的是:使用Skild AI模型的机器人还展示出了“应急能力”——也就是人类此前没有教过它们的全新能力。这些能力通常都很简单,比如收回从手中滑落的物体或旋转物体。但它们证明了该模型能够执行意料之外的任务,这种趋势在大型语言模型等高级人工智能系统中时有发生。
Skild AI能够实现这一点是因为,它的大模型是在一个包含文本、图像和视频的海量数据库上训练的,该公司声称这个数据库比其竞争对手使用的数据库大1000倍。为了创建这个庞大的数据库,两位联合创始人(他们都曾是Meta公司的人工智能研究人员)混合使用了他们多年来开发和测试的数据收集技术。
一种方法是雇佣人工承包商远程操作机器人,并收集有关这些操作的数据。另一种方法是让机器人执行随机任务,记录结果,并通过试错来学习。此外,其人工智能模型还接受了数百万个公开视频的训练。
在加州大学伯克利分校攻读博士学位时,帕塔克就开发出了一种向机器人灌输“人工好奇心”的方法,即在机器人无法预测其行动结果时,对其产生了结果的行动进行奖励。他解释说:“机器人对其行为效果的预测越不确定,它就越有好奇心去探索。”该技术激励AI浏览更多场景并收集更多数据。
他说,他关于好奇心驱动学习的那项研究发表于2017年,迄今已被引用了4000多次。帕塔克还设计了一种方法,让机器人使用来自大型语言模型(如GPT)的书面信息(例如如何打开一罐牛奶),然后将其转化为行动。
“在2022年,我们找到了一种方法,可以将这些东西整合到一个连贯的系统中。”帕塔克说。“从视频中学习,从好奇心中学习,从真实数据中学习,但要与模拟场景中的知识相结合。”
Skild AI的基础模型接受了比竞争对手多1000倍的数据训练,可以安装在各种机器人上,使它们能够完成攀爬陡坡、越过障碍物以及识别和拾取物品等任务。图片来源:SKILD AI
与此同时,Skild AI也面临着来自一系列机器人公司的激烈竞争,这些公司凭借人工智能热潮获得了数十亿美元的风险投资。据《福布斯》最先报道,行业巨头OpenAI最近重启了其机器人团队,为机器人公司提供大模型。此外,这个赛道里还有由亿万富豪首席执行官布雷特·阿德考克(Brett Adcock)掌舵的仿人形机器人公司Figure AI和OpenAI的子公司Covariant等竞争对手,后者正在为机器人开发ChatGPT,并已筹集了超过2亿美元的资金。
联合创始人古普塔声称,Skild AI 能获取大量数据,这使它有别于该领域的其他公司,但他拒绝透露其模型训练的具体数量。
加州大学伯克利分校(UC Berkeley)机器人与自动化教授肯·戈德堡(Ken Goldberg)也认为,数据是扩展机器人技术的关键,但机器人需要一种特定类型的数据,而这种数据在互联网上并不普遍。此外,使用从模拟情景中收集的数据并不总是能转化为现实世界的数据。
他说:“目前机器人技术令人兴奋的整个想法是,我们可以做一些类似于大型语言模型和大型视觉语言模型的事情,它们都有互联网规模的数据,你有数十亿的例子。”对于机器人来说,这不是一个简单的任务,但Skild AI希望通过将所有数据收集技术与更多模拟信息相结合来解决这个问题。
帕塔克和古普塔为他们的公司设想了一个类似于OpenAI的未来,即通过微调,可以在Skild AI的基础模型上构建不同的用例和产品。古普塔说:“这正是我们颠覆机器人行业的目的。”他补充说,他们最终希望实现机器人的通用人工智能(一种假想的人工智能系统,可以与人类的能力相媲美或超越人类的能力),但人们可以在现实世界中与之互动。
红杉资本合伙人、Skild AI现有投资者斯坦芬妮·詹(Stephanie Zhan)则表示:“机器人世界即将迎来GPT-3时刻,它将引发一场巨大的变革,将我们在数字智能领域看到的进步带到现实世界。”