Google Cloud 将搜索和 YouTube 背后的技术引入企业级 AI 应用程序 - VentureBeat
加入我们的每日和每周时事通讯,了解有关行业领先人工智能报道的最新更新和独家内容。了解更多
随着生成式人工智能的不断进步,对于许多企业来说,拥有一个简单的聊天机器人可能已经不够了。
云超大规模企业正在竞相构建数据库和工具来帮助企业可以快速高效地部署运营数据,从而构建智能且具有上下文感知能力的应用程序。
恰当的例子:Google Cloud 最近对多个数据库产品进行了一系列更新,从 AlloyDB 开始。
根据该公司的博客文章,完全托管的 PostgreSQL 兼容数据库现在普遍支持 ScaNN(可扩展最近邻)向量索引。该技术为其搜索和 YouTube 服务提供支持,并为更快的索引创建和矢量查询铺平道路,同时消耗更少的内存。
此外,该公司还宣布与 Aiven 建立合作伙伴关系,以托管 AlloyDB 的部署。以及 Memorystore for Valkey 和 Firebase 的更新。
了解 ScaNN for AlloyDB 的价值
矢量数据库对于支持高级人工智能工作负载(从 RAG 聊天机器人到推荐系统)至关重要。
这些系统的核心是关键功能,例如存储和管理矢量嵌入(数据的数字表示)以及执行目标应用程序所需的相似性搜索。
正如世界上大多数开发人员一样人们更喜欢 PostgreSQL 作为首选操作数据库,它的矢量搜索扩展 pgvector 已经变得非常流行。Google Cloud 已在 AlloyDB for PostgreSQL 上支持它,并使用一种名为"分层可导航小世界 (HNSW)"的最先进的基于图形的算法来处理矢量作业。
但是,在矢量工作负载的情况下太大,算法性能可能会下降,导致应用程序延迟和内存使用率过高。
为了解决这个问题,Google Cloud 正在全面推出 AlloyDB 中的 ScaNN 向量索引。这个新索引使用与 Google 搜索和 YouTube 相同的技术,可提供比标准 PostgreSQL 中的 HNSW 索引快四倍的向量查询和快八倍的索引构建时间,并且内存占用量小 3-4 倍。/p>
ScaNN 索引是第一个与 PostgreSQL 兼容的索引,可以扩展以支持超过 10 亿个向量,同时保持最先进的查询性能,为每个企业提供高性能工作负载,Andi Gutmans,Google Cloud 数据库工程总经理兼副总裁在一篇博文中写道。
Gutmans 还宣布与 Aiven 合作,将 AlloyDB Omni(AlloyDB 的可下载版本)作为可在任何地方运行的托管服务提供,包括本地或云端。
您现在可以在单一平台上跨云运行事务、分析和矢量工作负载,并轻松开始构建新一代 AI 应用程序(也可以在任何云上)。他补充道,这是首次为 AlloyDB Omni 添加管理和管理层的合作伙伴关系。
Memorystore for Valkey 和 Firebase 有哪些新功能?
除了 AlloyDB,Google Cloud 还宣布了Memorystore for Valkey 的增强功能、Valkey 内存数据库的完全托管集群以及 Firebase 应用程序开发平台。
对于 Valkey 产品,该公司表示正在添加矢量搜索功能。Gutmans 指出,单个 Memorystore for Valkey 实例现在可以以个位数毫秒的延迟对超过 10 亿个向量执行相似性搜索,召回率超过 99%。
他还补充说,下一版本的 Memorystore forValkey 8.0 现已推出公共预览版,与 Memorystore for Redist Cluster 相比,查询速度提高了 2 倍、新的复制方案、网络增强功能以及对性能和资源使用情况的详细可见性。
至于 Firebase,GoogleCloud 正在添加 Data Connect,这是一种新的后端即服务,将与由 Cloud SQL 提供支持的完全托管的 PostgreSQL 数据库集成。它将在今年晚些时候推出公共预览版。
通过这些发展,Google Cloud 希望开发者能够拥有更广泛的基础设施和数据库功能选择以及强大的语言模型,为他们的组织构建智能应用程序。这些新的进步如何部署到实际用例中还有待观察,但总体趋势表明生成人工智能应用程序的数量预计将大幅飙升。
Omdia 估计生成人工智能应用程序的市场将大幅增长。从 2023 年的 62 亿美元增长到 2028 年的 585 亿美元,复合年增长率为 56%。