ChatGPT 横空出世,在全球科技圈掀起一场巨浪,随之而来的是无数蜂拥而至的“掘金者”。

而在全球为 ChatGPT“狂飙”的背后,是单样本学习 NLP 技术在质疑声中,超过 7 年的技术深耕。

一条饱受争议的创新之路

早在 2015 年,机器和语言的关系还相当陌生,相比于数字、声音、图片等其他数据类型,语言是计算机最不擅长理解的数据,它们的关系完全没有今天这般火热。计算机对语言的理解极度局限于非常狭窄的问题空间(如情感分析,语法分解等)。每一个具体的问题都需要大量的数据标注(俗称监督学习),以谷歌,Facebook 为代表的大量科技公司投身于大数据解决方案的行列。也造就了一批类似于Scale.ai的数据标注平台成为独角兽。

然而硅谷有一家公司,选择了完全相反的技术方向,他们相信计算机对语言理解的终极算法,应该是建立更高维度的语义代表(semantic representation),通过训练拥有高维度语义理解的神经网络模型,再通过零样本或单样本数据向低维空间投影以解决人类理解内的各类问题,达到触类旁通的效果。这家公司,就是Brain.ai。

2016 年,Brain 推出了美国工业界首个单样本学习的自然语言处理模型和世界上第一个可以执行多 App、多步任务的人工智能应用。并在业界和学术会议大量推广 SRL 技术和以它为代表的单样本学习方向。同年,Brain得到了乔布斯家族的投资,成为了乔布斯家族唯一投资的科技公司。

“简单地讲,监督学习类似于婴儿的学习方法(没有先验经验)而单样本学习类似于成人学习的过程(拥有先验经验)。”Jerry 给我们解释道 “婴儿在学习的过程中需要大量的标注数据,比如妈妈需要给孩子重复非常多遍‘这是一个门’,婴儿才可以学会这个词和它所对应的含义。而当一个成年人听到‘门没关’时,‘门’这个字则是对应到一个抽象的对应着之前见过的每一扇门的概念。这也就是为什么成人可以通过几句话和极少的数据得到快速的学习,甚至认知提升。我们在业界推出的拥有触类旁通能力的单样本学习 NLP,就是通过阅读几乎全人类数据并建立语义代表的方式让大模型获得先验经验的。”

早在 2016 年,Jerry 就在用同样他认为最简单的方式解释他们的技术方向,但在和很多机构投资人沟通的过程中,Jerry 在技术方向上得到了非常多的质疑声,VC 们问过最多的问题就是:“如果单样本学习是自然语言处理 NLP 正确的方向,为什么谷歌每年将数十亿美金投入在完全相反的科研方向?”直到2017-19 年的几个重大技术突破,Brain在业界率先在产品中先后使用 BERT 和 Transformer 作为语义代表,以及以单样本学习为基础的 GPT 模型在 2020 年的问世,行业和学界才逐渐转变态度,开始正视这项技术。截止 2022年 3 月,Brain 单样本学习 NLP 模型月访问量破千万,创造的单日收入首次突破 30万美金大关。

简化AI成为通用语言---通用AI赋能每个行业

然而作为 Jerry 在 23 岁创立的第三家公司,Brain 的目标不再是简单地成为 Jerry 创立的又一家独角兽。他相信简单易用的通用 AI 界面是一种每个人都应该享有的权利。它是未来的教育,是人和人类文明的连接,是一种全新的思考语言,也是加速人类进化的最有效的方式。

这个世界很不公平。在未来在以日为单位极速变革时代,未来世界的大部分价值将只被极少数人创造。目前世界上只有 0.33% 的人会写代码,其中不足 5% 的人是机器学习工程师(美国平均年薪 18 万美金)。而这万分之一的机器学习工程师中又只有极少数人深入理解自然语言模型或者单样本学习模型的前沿架构。

在 2019 年 Brain 推出第一代 Multimodal Interface Transformer-1 (多模态界面Transformer-1)之后,Jerry 意识到这个通用模型不仅仅会颠覆每一个行业,而且也许可以彻底改变这种不公平的局面。

因为代码是对机器友好的语言,而界面是对人类友好的语言。而多模态界面 Transformer包含了对二者的深度理解,在该模型通过使用自己的自我迭代和强化学习中,找到了人机交互的终极答案:使用即创造----MIT-2 诞生了。

2022 年,Brain.ai 推出了基于第二代多模态模型 Multimodal Interface Transformer-2 的 AI 交互界面及开发平台 Imagica。在该平台上使用即创造,不需要学习代码,不需要理解如何重训练或fine-tune模型,在你表达想法的同时,相应的界面就会被创造出来,如果界面中存在智慧功能,模型也会通过简单的应用描述自我 fine-tune 到特定的低维空间以支撑界面的智慧部分渲染。创造应用不再受限于结构化的数据和大量的 API 规则,想象即创造。

从此,每个人都可以通过极其简单的交互界面使用和创造任何 AI 为自己所用,甚至在无代码的情况下导出成可供他人使用的应用。至今为止,在内测用户中,已经有大量成功的案例,比如,有大律所的律师将公司法应用场景和专业流程快速导出成一个自我训练的高准确度“过去案例分析 AI”和“案件文档整理 AI”供客户和律所内部使用;也有金融行业基金经理创建的AI 通过分析新闻及股票走势创建仓位建议并自动生成投资界面供散户投资者直接使用;更有老师将课程内容和知识点上传后自动导出成“通用课程讲解 AI”以及“学习文档、学习视频生成 AI”供其学生使用等等。

目前开发者最小年龄为 14 岁,其花费 1 小时建立的游戏人物生成 AI SaaS 应用在两个月内日营业额过万;也有 16 岁的中学生在通过 Imagica 无缝使用 Alphafold 模型生成蛋白质折叠结构预测,使用和最前沿科学家同样的工具进行癌症研究。当 AI 的使用和学习成本降低至几乎为零,每个人都可以最大化发挥他们的潜力。

“我们儿时都会有很多天马行空的想象,希望通过这些想法可以产生对世界的价值,但大多数时候我们会被告知需要做好准备,才可以按部就班地影响世界。Imagica 就是对这个status quo(现状)以及成人世界的反抗,我最感动的事,是发布内测的第二周看到一个从小热爱物理的初中生通过 Imagica 一步步对人类最深层认知和自然科学的简化与剖析,他开始用 Imagica 的为他生成的模型计算多体量子基态波函数。”

“人类的所有财富都来自于从无到有的想象。当AI可以大量降低从一个想法到它产生真实世界价值的成本和阻力,我们也许会逐渐停止用陈旧的教育系统继续扼杀下一代的想象力;当每个人、甚至孩子都能站在人类最前沿的对自然科学、经济和社会的理解之上思考,想象力可以直接影响世界。”当谈到 Imagica 的价值时,Jerry 这样回答。

“我们可能已经忘记,人类也经历过 90% 都是农业生产者的时代,但当机器的出现可以不再需要每个人留在农田里也可以解决全人类温饱的时候,我们就不应该继续教育所有下一代如何种田;以 AI 今天的发展速度,5 年后很非常多行业和甚至最前沿的岗位和研究都会被 AI 取代,创建 Imagica,简化 AI 的使用,是我们对这种趋势的回答。”

在教育方向上,Imagica 已进入硅谷的十余所中小学开始试点,通过简化通用AI的界面,想象即创造会成为下一代人思考的语言。“未来的教育,应该是培养孩子提问的能力;最好的人机共存发展模式,AI根据人类提出的问题和假想,通过模拟实验超越时间的维度,在 10 分钟做 100 年的实验,验证想法的可行与否并用自然语言解释给人类原因。这样我们才可以克服自己的时间瓶颈,让每个人都可以创造正和价值。说起来有点难以想象,但一分钟一个诺贝尔的时代不远了。”

2023 年,Brain.ai 将在全球正式上线 Imagica,可以确认的是,Brain 已计划在中国寻找合作伙伴,开放其开发平台,并招募 100 位希望颠覆行业的高影响力人群,通过 AI 的力量赋能千行百业。

通过 Imagica 创建的测试版应用“Imagine OS”也已于 2 月登陆中国 iOS 商店并开放下载。

「两分钟快到了」

关于自己正在做的事情,Jerry 曾有一个浪漫的描述:

我们就像一群站在很高的楼上亲眼目睹日出的人。因为地球倾角的原因,我们会比地面上的人提前几分钟看到日出。如果你有幸成为那第一批看到日出的人,你可以尝试快速下楼,去告诉地面上的人太阳长什么样子。虽然他们还没有看到,但你给他们证明的最好方式,就是再等两分钟。


环球时讯 »

发表评论