首页 数据库管理 爱可生云树® ActionDB 【DTCC 2023】爱可生带你了解向量数据库TensorDB®如何构建交互新范式

【DTCC 2023】爱可生带你了解向量数据库TensorDB®如何构建交互新范式

2023-10-18 17:01 浏览量 浏览量:345

8月16日,由IT168联合旗下ITPUB、ChinaUnix两大技术社区主办的第14届中国数据库技术大会(DTCC2023)在北京国际会议中心隆重开幕。大会以“数智赋能 共筑未来”为主题,数据库厂家齐聚盛会共同探讨新时代下各类型数据库的最新动态和应用实践。爱可生研发工程师李剑楠受邀在时序数据库与向量数据库专场发表主题演讲,向参会嘉宾分享了向量数据库TensorDB®在DB领域的应用和交互方式。

李剑楠提到,大模型具备强大的语言理解和生成能力,向量数据库能高效存储和索引大规模向量数据。将两者结合,可实现高速数据访问、智能决策和快速问题解决。通过大规模数据分析与大模型预测,我们能快速发现关键问题、优化系统、提升可靠性和效率。

爱可生TensorDB®是基于Milvus开发的向量数据库企业版软件,在检索内核部分做了适配各种高性能硬件的优化,并在上层接入多库管理平台DMP,可以更方便的进行运维管理。

TensorDB在近似最近邻检索算法的优化包含三部分。第一部分:针对不同的高性能计算硬件例如英伟达GPU、昇腾NPU、国产GPU等优化检索算法的实现。第二部分:沉淀自动化索引调参工具。第三部分:引入学习型的模型优化索引的结构和检索路径。

基于公司内部大量的数据库运维文档知识库,结合大模型的语义理解和总结文本的能力。形成了这样的解决方案,当DBA提出一个问题时,向量数据库会首先检索和问题相关的数据片段,并将这些数据片段作为提示词和问题一起输入到大模型中,由大模型来进行总结。同时,为了保证结果的准确性和可解释性,我们可以在每条语句后关联回原始文档,这些原始文档就是我们在向量检索阶段召回的相关文本片段。

第二个应用是基于大模型+向量数据库的SQL开发管控解决方案,在这个方案中,用户会用自然语句来作为输入,向量检索会根据自然语言中的关键词检索数据库中可能相关的库表,并将这些表结构化的输入到大模型中作为提示词,由大模型来生成SQL语句,在审核阶段我们会把SQL语句和相应的规则列表输入到大模型中,来判断是否满足规则。

爱可生向量数据库软件(简称“ TensorDB® ”)的目标是在以图搜图、视频推荐、文本检索与大模型私域应用等 AI 场景中,对海量非结构化数据嵌入后的高维向量数据提供存储、管理、计算的综合能力,以满足金融、交通、互联网等行业对核心业务系统高可用性、高扩展性的要求。

产品优势

\ | /具有灵活的索引结构,能够以毫秒级延时返回亿级别的数据中的相似匹配结果;;

\ | /可支持 10万+ QPS 的超高并发,并针对图像检索、语音识别、文本分析等 AI 应用场景进行深度优化,提供多模态数据的高效检索能力;

\ | /提供金融级高可用方案,通过动态水平扩缩容实现应用无感知的服务负载能力拓展。

\ | /积极参与认证适配,目前完成了国产 ARM 架构与操作系统的兼容性认证适配,助力用户实现国产化需求。

\ | /利用 CPU/GPU 等异构计算平台资源优势,不仅实现了 NVIDIA GPU 与国产 GPU 的计算加速,还实现了单机多卡,多机多卡的分布式任务调度,最大程度地满足用户的低延时、高并发的需求,进一步提高服务能力。

应用案例

项目背景

系统和技术的复杂性使智能制造的流程复杂性越来越大。目前,在智能制造这样大规模制造行业的产品研发过程中, 会产生大量的产品试验数据,这些数据是由对产品的可靠性、精确性、质量安全等多方面性能进行测试所产生的。原有的数据管理分析方式已经不能满足日益发展的制造工业的业务需求。

产品应用

爱可生 AI+TensorDB® 解决方案为用户带来以下增益:

1.无需人工梳理,自动对纸质文档进行 OCR 解析,并从 pdf、word 等文件中单独解析出图片和表格;

2.支持对文本、图片、表格的混合检索或单独检索;

3.支持用户查找相似图片;

4.支持用户查找相似表头的表格。

本届大会,爱可生还在会议中心2楼设置了展台(展位号17),如果您对向量数据库感兴趣,欢迎来展台和技术工程师深入交流~

Title
x
咨询留言
请填写以下信息,方便与您取得联系,已开启隐私保护

提交
x
企业认领

姓名:

电话:

验证码:

职务:

邮箱:

提交
x
图形验证码
填写图形验证码发送短信

发送短信