从「生成式AI」转化为「生产力」,亚马逊云科技划出重点
十年来,人工智能一直是科技领域的热门主题。我们看到了高准确率的人脸识别系统、战胜人类顶级棋手的围棋 AI、预测蛋白质结构的 AI…… 这些技术进步都曾引起大众的震撼,也曾在各自的领域内被赋予「颠覆格局」的期待,但在通用能力上还不够理想。直到这两年,预训练大模型技术使得 AI 的通用能力往前迈了一大步。几十亿、上百亿参数的模型不仅能够迅速处理海量信息,还能理解人类自然语言的输入、进行复杂的逻辑推理,并掌握了优秀的内容生成能力。AI 正在从特定任务的解决方案转向具有更广泛应用性的解决方案,或者说,有望大规模地创造价值。
比如,Stable Diffusion 背后的公司 Stability AI 推出了一项新的生成工具「Stable Doodle」。在这一工具的辅助下,从寥寥几笔的草图到生成品质不输专业画师的原创插画,不过几秒钟的时间:
一场关于生产力的革命已在酝酿之中。全球管理咨询公司麦肯锡在最近的报告《生成式人工智能的经济潜力:下一波生产力浪潮》中指出,生成式 AI 每年可能为全球经济增加 2.6 万亿到 4.4 万亿美元的价值。
在几天前的亚马逊云科技纽约峰会中,「生成式 AI」同样是全场提及频率最高的关键词。「如今,大模型可以在大量无标注数据中进行预训练,实现开箱即用,以处理各种通用性问题。此外,只需相对少量的标注数据进行微调,它们就能用于特定领域的应用。」亚马逊云科技数据库、数据分析和机器学习全球副总裁 Swami Sivasubramanian 表示,「通过微调轻松定制预训练模型的能力,绝对是游戏规则的改变。」
Swami Sivasubramanian 在亚马逊云科技纽约峰会上发表主旨演讲
那么,对于广阔的各行各业,这种 AI 带来的生产力变革究竟是如何一步步发生的?凭借过去数年的客户需求洞察和技术积累,亚马逊云科技将大量的 AI 能力集成到了简单易用的产品之中,希望以最简洁的方式将技术进步输送到各行各业。在这场技术盛会上,亚马逊云科技一口气推出了七项生成式 AI 新功能。
最强的生成式 AI 大模型,在这里轻松调用
半年来,大模型之战如火如荼。当 OpenAI 和谷歌你追我赶,迅速崛起的「开源」力量也不容小觑。可以预见的是,在未来的大模型竞争格局中,「没有一个模型可以统治一切」。在 ChatGPT 发布两个月后,Anthropic 公司就迅速开发出了「最强竞品」 Claude,又在 7 月初完成了 Claude 2 的升级。被称为是「AI 社区内最强大的开源大模型」的 LLaMa,在不久前也升级为 LLaMa 2,不断抬高开源大模型的能力上限。正像一些业内人士所说,任何一家闭源的大模型提供商都没有护城河。不管是 LLaMa 还是 Claude,开源大模型都显示出了迭代速度更快、可定制性更强、更具私密性的优势。而这些开源大模型的力量,正在越来越多地汇聚于亚马逊云科技的服务之中。
今年 4 月,亚马逊云科技发布了全托管基础模型服务「Amazon Bedrock」,以「关键基础设施提供商」的角色加入了大模型之战。
从希望应用大模型的企业角度来说,自研大模型需要数十亿美元和多年的训练,更优的解决方案是对一些已经非常强大的开源基础模型进行定制化的微调,以满足自身的多样化业务需求。Amazon Bedrock 的重要价值就在于此。这项服务可以让所有人都可以基于已有的大模型、专用的 AI 算力和工具,再结合自己的数据开始构建生成式 AI 应用。在最新扩展后的 Amazon Bedrock 中,汇聚了来自一批顶级大模型供应商的最新成果:
目前,Amazon Bedrock 提供了 Anthropic 最新语言模型 Claude 2、AI21 的 JURASSIC-2、亚马逊自研的 Amazon Titan 系列模型的访问。Stability AI 也在 Amazon Bedrock 中首发了最新版的文生图模型套件 Stable Diffusion XL 1.0。此外,Cohere 成为了最新加入 Amazon Bedrock 的基础模型供应商,并带来了文本生成模型 Command 和文本理解模型 EMBED。相比于其他的一站式的大模型服务平台,Amazon Bedrock 的优势在于,用户可将其与亚马逊云科技平台的其余部分集成在一起,更轻松地访问存储在 Amazon S3 对象存储服务中的数据,并能够从 亚马逊云科技访问控制和治理策略中受益。生成式 AI 让云计算服务的竞争格局发生了改变,除了原有的存储、计算、网络等基础设施,模型、框架和应用层面的能力提供变得更为重要。在过去一段时间,我们见到了「模型即服务」这种全新商业的诞生。如同 Amazon Bedrock 这样的一系列平台,正在将大模型变为直接可用的服务,帮助各行各业的用户接入生成式 AI,撬动了一个全新的蓝海市场。
推动生成式 AI 走完落地的「最后一公里」
在今天,即使生成式 AI 模型的功能已经如此强大,它们仍然无法代替人类「执行」一部分关键的、个性化的任务。比如一位顾客想咨询换货,电商平台的 AI 客服当然可以迅速地告知顾客想要的款式、尺码、颜色是否还有库存,但无法完成接下来的订单更新或交易管理的操作。这恰恰是「生成式 AI」转化为「生产力」过程中非常关键的一步。问题并非不能解决:模型通常可以附加 API、插件、数据库以扩展功能,为用户自动完成某些特定的任务。比如 ChatGPT 此前就推出了插件机制,还为开发者提供了开放平台,允许更多用户根据自己的需求、想法和专业能力进行扩展。为了简化这一环节所需的工作,亚马逊云科技正式推出了 Amazon Bedrock Agents。
Amazon Bedrock Agents 可以扩展基础模型以理解用户请求,将复杂任务分解为多个步骤,开展对话以收集更多信息,并采取行动来满足用户请求。开发者只需点击几下,就能创建完全托管的 Agents:
该功能创建的对话式智能体可根据专有数据提供个性化的最新答案并执行操作,帮助企业加速交付生成式 AI 应用程序,推动解决生成式 AI 落地的「最后一公里」问题。比如,企业可以使用 Amazon Bedrock Agents 创建一个可以处理订单的客户服务聊天机器人,利用其内部信息(包括客户资料和退货政策)来定制化服务于每个订单。如果做个比喻的话,Amazon Bedrock Agents 就像是一个得力的助手。或许在不久的将来,我们就能享受这一功能所提供的用户端服务:不只是显示有哪些合适的航班、推荐口碑好的餐厅,还能直接帮忙预订、跟进。
生成式 AI 时代的搜索技术变革
在解决大模型落地挑战的火热讨论中,「向量搜索」和「向量数据库」的概念开始被越来越多的人熟知。这是检索技术层面在生成式 AI 时代正在发生的变革。首先,伴随数据规模的增长,关键词检索已经不能满足需求,向量检索可作对传统搜索技术的补充。通过将数据表示为向量,模型可以快速分析和理解大量信息,准确地识别和匹配相似的项目。其次,经过预训练的大模型固然能力出众,但也存在一些不足,比如缺乏领域知识、缺乏长期记忆、缺乏事实一致性的问题。而在数据规模不断增长、算力日益珍贵的现状下,向量数据库可作为大模型的「超级大脑」,打一份小抄,相对较低的成本补充动态知识,满足用户不断增长的需求。
与向量数据库的结合,让大模型的综合实力增色不少。此外,向量数据库为任何希望接入大模型的企业用户提供了一种规避核心数据泄露问题的方法。可以说,向量数据库会成为未来大模型研发、落地必不可少的基础设施之一。对于这一方向,亚马逊云科技早早发力,此前已上线多项支持向量的数据存储服务,包括 Amazon Aurora PostgreSQL 兼容版关系型数据库,兼容 PostgreSQL 的 Amazon RDS(Amazon Relational Database Service)关系型数据库等。在这一次的峰会上,亚马逊云科技又推出了适用于 Amazon OpenSearch Serverless 的向量引擎。该向量引擎支持简单的 API 调用,可用于存储和查询数十亿个 Embeddings。
该引擎由 Amazon OpenSearch 项目中的 k 最近邻 (kNN) 搜索功能提供支持,为客户提供无服务器环境下的语义搜索服务。即使向量从原型设计期间的几千个增长到数亿甚至更多,引擎也能无缝扩展,无需重新索引或重新加载数据来扩展基础设施。顺应大模型时代的广泛需求,亚马逊云科技还正式宣布,平台上所有的数据库未来都将具有向量功能,帮助客户简化运营,方便集成数据。
让生成式 AI 落地多重加速
在这些重磅发布之外,为了加速生成式 AI 的训练和应用,亚马逊云科技已推出了一系列服务和工具。最新动态是,两项关键服务已正式可用:其中一项服务是关于计算基础设施,基于英伟达 H100 Tensor Core GPU 的 Amazon EC2 P5 实例已正式可用,满足客户在运行工作负载时对高性能和高扩展性的需求。
很多业界知名的生成式 AI 模型同时涵盖问题回复、代码生成、视频和图像生成、语音识别等功能,规模通常有千亿或万亿参数,训练时间甚至长达数月。这势必会成为普遍影响生成式 AI 落地速度的因素之一。与上一代基于 GPU 的实例相比,Amazon EC2 P5 实例使得训练最高提速 6 倍,曾经的几天训练时间可缩短到几小时,帮助客户降低高达 40% 的训练成本。
另外一项服务是有关于开发工具。去年,亚马逊云科技推出了 AI 编程助手 Amazon CodeWhisperer 预览版,获得了开发者的高度关注。数据表明,与未使用该编程助手的开发者相比,使用者完成任务的速度平均快 57%。现在,Amazon CodeWhisperer 已经正式可用,并且实现了与 Amazon Glue 的集成。从此以后,开发者可以用自然语言编写特定任务,Amazon CodeWhisperer 会直接在 Amazon Glue Notebooks 中推荐一个或多个可完成此任务的代码片段,用户可以选择「接受最推荐的建议」、「查看更多建议」或「继续自己编写代码」。也就是说,即使完全不会写代码,你也可以尝试用「说人话」的方法构建出完整的应用程序。
写在最后
技术的发展往往超乎人们的预设。曾几何时,研究者们还需要花费数月的时间进行数据准备、数据处理和模型训练,不得不投入极其高昂的成本,只为了完成某一项特定的任务。今天,生成式 AI 已经能够给出与人类创作无法区分的内容,处理此前 AI 并不擅长的知识性工作和创造性工作。行业的壁垒在某种程度上被打破、重构,一场由生成式 AI 引发的生产力革命正在发生。通用人工智能(AGI)是否真能实现?想必现在,已经不会有人再站出来表示质疑。
在这场浪潮中,亚马逊云科技选择的路线是做好「关键基础设施提供商」的工作。它的优势在于过去 20 年在人工智能技术上的深厚积累,在于对于超过 10 万家客户的深刻理解,在于打磨多年的高可用、强大的基础设施。这些都会有力地推动亚马逊云科技加快生成式 AI 落地的征程,帮助到每一位开发者或创业团队。我们能看到的是,在一系列面向生成式 AI 的基础设施和开发工具源源不断投入应用之后,大模型落地的门槛被打了下来,开始走向各行各业的深处。这场生产力革命,显然已经在加速了。