产品介绍

cVector向量计算一体机是一种面向亿级以上向量计算场景的高性能向量存储、计算一体化平台,采用并行计算架构,融合高密度混合服务硬件,实现对大规模向量数据的计算和比对,相较于通过GPU、向量数据库进行向量计算,cVector向量计算一体机在入库效率、计算性能方面优势突出,可广泛应用于人工智能大模型、机器学习、计算机视觉、自然语言处理等领域。

产品架构

cVector向量计算一体机基于大数据分布式实时计算框架,结合定制化高密度计算硬件,实现大规模AI任务的分发与计算结果汇聚,保证计算任务执行的高效和稳定。其采用全量计算的方式,基于特征向量计算算法以及分布式集群处理资源调度技术,实现了海量特征库条件下1:N对比任务的高效分解与并行处理,可将单个任务响应效率提升到0.1秒级。对于通过向量数据库软件需要几千个时钟周期的向量计算,该一体机只需很少的时钟周期即可完成。

产品特性

高性能向量计算
cVector向量计算一体机通过硬件加速和优化算法,实现了对大规模向量数据的高性能计算,能够并行处理多个向量操作,在1000万条256维向量中检索指定向量时,cVector向量计算一体机仅耗时0.0661s(单节点)。
超高速入库
cVector向量计算一体机具备超高速入库特点,入库1000万条256维向量数据,cVector向量计算一体机仅花费303.59s(单节点)。即使面对亿级以上规模的向量数据,cVector向量计算一体机也能轻松应对。
支持多种向量相似度计算方法
cVector向量计算一体机支持多种向量相似度计算方法,例如余弦相似度、欧式距离、曼哈顿距离等。
支持多维向量
cVector向量计算一体机能够支持多维度的向量数据,可以存储和查询1024维度的向量数据,可广泛用于图像识别、语音识别等应用场景。
并行处理
cVector向量计算一体机具备强大的并行处理能力,能够同时处理多个向量操作任务。这使得它在大规模向量数据集上能够快速执行复杂的向量计算任务,如相似度搜索、聚类分析等。
简单易用
cVector向量计算一体机支持灵活的编程接口和工具,向量入库和检索非常便捷,同时也方便用户对向量数据进行处理和分析。

测试证明

以下是中国软件评测中心对cVector向量计算一体机与3款主流向量数据库在入库速度、查询速度、准确性等维度进行的性能测试对比。

准确性

在“cVector 向量计算一体机 V1.0”、向量数据库A、向量数据库B和向量数据库C中存储相同的 1000 万条的 256 维向量数据,分别查询与目标向量的欧氏距离最短的 10 条向量,对比结果显示各自返回的 10 条向量与目标向量的距离值均相同。

测试结论

“向量计算数据库验证平台 V1.0”性能效率符合《向量计算数据库验证平台测试需求V1.0》的相关要求,在现场测试过程中,系统运行稳定,通过了中国软件评测中心(工业和信息化部软件与集成电路促进中心)的单项性能测试。”

根据测试报告结果,cVector向量计算一体机在千万级特别是亿级以上规模的入库和查询等方面具有显著的性能优势,可帮助提高大模型推理的服务性能和服务质量,并能明显降低其基础设施建设成本,帮助类ChatGPT等人工智能企业以更优的性价比解决算力不足的问题。

技术规格

应用场景

基于硬件的cVector向量计算一体机,实现了高效的向量数据存储、索引和比对,与向量数据库相比,cVector向量计算一体机入库速度和查询速度更快,处理规模更大,检索结果更为精准,可广泛用于大语言模型、自然语言理解、大规模人脸识别等多种场景。
大语言模型支撑
cVector向量计算一体机将数据转化为向量进行保存与搜索,为大语言模型的训练和推理提供高效的相似性搜索能力,具备短时记忆和定向等功能,在不进行推理的情况下直接返回结果,帮助大模型减轻访问压力、提升实时理解数据能力、提高输出准确性、提升服务质量、过滤敏感内容等,有助于解决当前同等投入规模情况下,仅依靠GPU不足以支撑大模型推理所需算力的难题。
文本相似度计算
cVector向量计算一体机根据向量的相似度排序返回与检索对象相近的结果,支持基于文本的快速比对。针对千万级甚至上亿量级的文本数据库,结果返回速率达到0.1秒级,可广泛应用于资料查询、专利搜索、电子病历检索、法律文献检索、学术文献检索、论文查重等多种场景。
图像视频检索
cVector向量计算一体机能够支持多种深度学习模型,具备对海量图片和视频的高性能分析检索能力,通过训练可以精准地提取图片、视频中的特征并进行分类、打标签等应用,从而轻松实现图片检索、图片去重、视频去重、以图搜图等功能。
音频数据处理
cVector向量计算一体机支持对相关音频切片进行向量化处理并通过向量距离的计算,判断其表达的含义,实现对语音、音乐等音频数据的处理,可广泛应用于语音识别、语音验证、智能翻译、会议转录等多个场景。
智能问答
cVector向量计算一体机支持快速入库和存储自然语言处理语义分析模型的语义特征向量数据,支持快速比对问题库的向量和提问问题的语义特征向量,通过向量特征的匹配实现智能问答,支持智能客服、智能语音助手、医疗辅助问答等应用场景。
个性化推荐
cVector向量计算一体机能够为购物网站、视频网站、新闻网站的推荐系统进行赋能,将购物网站、视频网站和新闻网站的海量数据转化为向量后进行快速比对,实时分析用户的偏好和行为模式,精准地为用户推荐个性化的商品、视频和新闻内容,提供更加智能和准确的推荐服务。