AIGC如何影响加速计算?英伟达首提向量数据库 | 企服国际观察

2023-03-31
关注
摘要 向量数据库正明显得到业内关注,并非浮于表面的概念一词。

 图片来源@视觉中国

ChatGPT的火爆让AIGC(AI Generated Content,人工智能自动生成内容)更广为人知,如果问2023年生成式AIGC的最大确定性受益者有谁?

答案是英伟达。

因为,对于英伟达而言,哪里有人工智能,它就会去哪里创新。

近日,英伟达公布了其新一代GPU推理平台,包括L4 Tensor Core GPU、L40 GPU、H100 NVL GPU、Grace Hopper超级芯片。例如,H100 NVL将两个英伟达H100 GPU拼接在一起,用于专门处理大语言模型ChatGPT;Grace-Hopper超级芯片(Grace CPU和Hopper GPU的结合),用于处理图推荐模型、向量数据库和图神经网络的超大规模AI训练任务。

但这就结束了吗?No。

还有许多额外值得关注的事情,例如老黄一直在提及的GPU加速。他指出,“加速计算并非易事,需要从芯片、系统、网络、加速库到重构应用的全栈发明,每个经过优化的堆栈都会加速对应应用领域。”“加速计算是减少功耗、实现可持续发展和净零排放的最好方式。”

而在加速库部分,黄仁勋首次提到了一个新名词——向量数据库(Vector Database)。

“向量数据库的一个新型重要用例是大型语言模型,在文本生成过程中可用于检索领域特定事实或专有事实。我们将推出一个新的库,即RAFT,用于加速索引、数据加载和近邻检索。

我们正在将RAFT的加速引入到Meta的AI向量相似性搜索FAISS,超过1000家组织使用的Milvus开源向量数据库,以及Docker镜像下载次数超过40亿次的Redis。”他表示。

这段话非常简短,除了为自家新品夹藏私货外,黄仁勋实际上也指出了一个重要的技术热点:AIGC热潮影响下的AI基础设施产业——加速计算成为新核心市场,而加速计算所需的框架、库、操作系统等软件栈中,库是核心中的核心。

事实上,早在深度学习浪潮来临时,英伟达就已经在依靠GPU+CUDA(软件生态)的方式进行布局,这曾让同时期的AMD望尘莫及。而CUDA也使得开发人员能充分利用GPU性能,实现显著加速计算。此次,除了发布CV加速库CV-CUDA,英伟达还将加速计算引入到量子计算、计算光刻系统中,推出了cuQuantum、cuLitho。

而上述提及的“RAFT+FAISS/Milvus/Redis”组合中,方兴未艾的向量数据库/向量搜索技术也被圈出。

什么是向量数据库?

想要理解何为向量数据库,就得从向量数据的定义上找答案。向量数据(Embedding Data),是一种词向量,可用于表达包括文本、图片、视频、语音等非结构化数据转化而来的语义信息。也就是说,一般的语义信息转化为可被计算机识别、使用的向量数据。

以检索一张图片为例,通常一张图像会有数百万个像素,每个像素包括许多数据点。这些彼此关联的数据点即为“高维”数据,传统的搜索和索引高维数据,最简单的技术是通过蛮力进行对比,需要巨大的算力进行分析处理。

而使用向量检索后,可信息主要以向量的方式存储在数据库中,相当于在非结构化数据和结构化数据层之上又加了一个新的数据层,但在信息处理的速度,以及数据量级处理的难度上都有极大的改善。

在此之前,业内已经有诸多团队或研究人员在关注向量数据在检索场景中的实际应用。

2017年,FAIR研究人员开源了(FAISS,Facebook AI Similarity Search)AI向量相似性检索库,在十亿级数据集上创建了邻近搜索、且运行于GPU的k-selection算法。

2020年7月,谷歌研究院开源了向量相似性搜索库ScaNN,提出新的数据集向量压缩技术,以提高向量检索的准确性。

2021年1月,Pinecone发布了闭源的云向量数据库产品。Pinecone由AWS SageMaker的创建者Edo Liberty成立,他在自家的博客中这样写道:

“机器学习将一切都表示为向量,包括文档、视频、用户行为等等。这些表示使得不同事物可根据相似性或相关性,就能够准确检索、搜索、排名和分类。在很多场景中,如产品推荐、语义搜索、图像搜索、异常检测、欺诈检测、人脸识别等都有应用。

2022年,国内创企Zilliz正式发布了全托管的Zilliz Cloud,其主要运营的开源向量数据库社区Milvus(于2019年开源),一直在探索基于异构硬件的向量检索的方案。据Zilliz合伙人兼技术总监栾小凡的观察,“目前社区里已经有大量用户和开发者在关注GPU加速。”

过去几年,AI的发展更注重场景的应用,定制化程度高,大模型的出现也极大加速了AI应用云化和服务化的进程。对于向量数据库而言,弹性、池化、异构硬件加速等能力都变得愈发重要。栾小凡告诉钛媒体APP。

以上述提及的RAFT与Milvus社区的合作为例,

“英伟达开源了RAPIDS项目,旨在通过GPU加速数据科学和机器学习领域。RAFT作为RAPIDS项目的一部分,通过CUDA进行加速,可以帮助用户快速构建基于GPU的机器学习应用。此外,RAFT对于向量最近邻计算、近邻图构建、k-means聚类等向量数据库中常见的机器学习算法,都有着显著的加速效果。”栾小凡表示。

展开来讲,RAFT社区支持了IVF_FLAT、IVF_PQ等一系列向量检索算法,并提供业内最佳的索引和检索性能;英伟达向Milvus的开源向量引擎Knowhere贡献代码,使得Milvus支持了RAFT库,并协助完成性能优化工作;同时,Milvus内核团队实现GPU资源调度、查询调度、元信息管理适配,以及性能和稳定性测试。

接下来,据栾小凡所述,两个团队还将共同持续优化基于GPU的向量检索性能和稳定性,同时也将持续扩展标量过滤、RangeSearch、多向量检索等更多功能,以及基于异构硬件的向量召回新的可能性,继续拓展向量检索的性能和功能边界。

向量数据库很新,但AIGC在加速市场认知

向量数据库,仍然是一个比较新的数据库领域,市场的认知与供给侧的实践均不够深入与多维。

向量数据的定义仍常见于各家产品或论文的阐述中。据栾小凡此前的观察,从开源的Milvus、Vald、Weaviate、Qdrant、Vaspa、Vearch、AquilaDB、Marqo,到商业化服务产品Pinecone,再到大厂谷歌推出的Vertex AI匹配引擎,数据库厂商Elastic和Redis基于自身提供的向量检索功能等等。

对于厂商而言,跟过去十年出现的各类新兴数据库遇到的挑战一样,要在一个完整的数据库系统组件里,综合向量数据、AI数据处理的特点,做全新的设计研发和探索。例如,在一些公开的benchmark性能测试平台上,不同向量检索算法对比的维度不同,在不同的GPU/CPU上所能发挥的效果也会有所差异。

但有一点值得确定的是,去年年底以来AIGC的火热,正加速从底层GPU到数据库、模型训练框架的AI技术栈整体性能的优化。

为了支撑非结构化数据量激增带来的对于系统成本和扩展性的更高要求,Milvus支持了基于NVMe磁盘混合存储的ANN方案,相比于传统的内存方案降低了10倍的内存使用。

栾小凡认为,以大模型为算力,以Prompt为控制程序,以向量数据库为存储的范式逐渐成为共识。在技术趋势上,向量数据库也会有新的变化:

与LLM技术相结合,诞生更多新的生态和应用场景;使用场景将会进一步分叉;性能成本将会呈指数级改进;诞生第一代Serverless向量数据库;AI4DB技术将会更快在向量数据库中落地;围绕向量数据库,还会有一系列开源和第三方SaaS服务的工具出现。

而这一系列的技术演进需要市场的验证。

(本文首发钛媒体APP 作者 | 杨丽,编辑 | 盖虹达,欢迎添加作者微信leeyangamber交流)

您觉得本篇内容如何
评分

相关产品

CSMS 中科微感 人工智能+嗅觉传感器(AI-Nose) 气体传感器

中科微感逐步攻克了制约人工嗅觉传感发展的核心材料、硬件、算法等技术,开发出了以新型纳米敏感材料为基础,以微纳加工技术为支撑,以人工智能算法为核心的第一代 MEMS 基金属氧化物半导体原理的人工嗅觉传感器产这一产品将解决当前制约人工智能嗅觉技术与市场应用发展的关键问题:提供量产化的高一致、低成本、微型化的嗅觉传感器阵列硬件,以及提供标准化的人工智能+嗅觉气味感知软件平台,使客户能够快速构建和应用气味数据模型

XKCON 祥控 弹药库环境温湿度异常报警与智能监控系统 温湿度变送器

济南祥控自动化设备有限公司自主研发的XKCON祥控弹药库环境温湿度异常报警与智能监控系统采用物联网、传感器、大数据、人工智能等先进技术,能够对弹药库环境温湿度信息实现数字化、可视化管理。

山东美安 矿山电机车防追尾道岔口报警器 控制器及系统

煤矿用机车防追尾保护装置 机车防追尾保护装置是一种矿用人工智能保护装置、具有防追尾保护、无线触发沿途弯道语言保护、输出控制并记录等功能可广泛的使用在矿山井下、井上的运输机车上。

KEYENCE 基恩士 AI-1000C 图像匹配传感器

因此,人工智能系列能够在模式匹配的基础上对物体进行稳定的检测和识别,而这是基于强度或距离的传感器难以实现的。 基于强度或距离的传感器难以实现。

云传物联 水质生态浮标浮台在线测系统 多参数监测系统

电子水质监测解决方案利用信息控制与处理、人工智能、自动化、物联网及多媒体等技术,集水质参数在线采集、无线传输、智能处理、超限报警、远程管理等功能于一体的水质监测解决方案。

DINSEE 鼎信智慧科技 DX-WPS100-SP2... CMOS图像传感器

针对传统配电线路人工巡检效率低、周期长等问题,鼎信智慧结合物联网、红外热成像、人工智能等技术,研发了配电线路图像视频双光球机在线监测装置。

大立科技 DM60-W3 红外体温快速筛检

红外热成像体温快速筛检系统DM60-W3系列为384*288/640*480像素,人工智能算法,远距离、大场景测温更精准。

Maike 迈科光电 MK-PB4023PS&ALS&VC-A01E 接近传感器

EM30918、STK3311-X、STK3321、APDS-9900 ,9901、TMD2772WA、RPR0521RS、VCNL4035X01 WH4530A),广泛应用于平板电脑、工控显示类产品、智能家居、AI人工智能等场景,联想笔记本电脑,九安医疗的测温仪,微步数码的平板等都应用了我们这颗传感器,已量产批量出货。

Handsome 翰德圣 HDSELM V1.1 安全传感器和系统

设备全生命周期管理平台融合的物联网、云计算、大数据、人工智能、优化制造、再制造六项主流技术,通过云端模块化的架构可为企业灵活管理设备,不仅可以随时随地了解设备运行状态、发现故障隐患,还能够通过大数据分析指导企业维修

评论

您需要登录才可以回复|注册

提交评论

提取码
复制提取码
点击跳转至百度网盘