工业和信息化部主管 中国电子报社主办
收藏本站 投稿

人工智能

柏睿数据推出面向行业大模型构建和应用的产品方案

生成式AI大模型在智能对话、内容创作、编程等人机交互场景中大放异彩,各行业企业也在积极构建自己的AI模型,以支撑垂直专业领域的智能化应用,提升企业洞察力,创造业务新价值。

但AI大模型不具备长期记忆能力,在服务垂直专业领域时会存在知识深度和记忆时效性不足的问题,企业构建属于自己的大模型面临挑战。

基于此现状,柏睿数据推出LLMOps平台、向量存储查询引擎两种产品方案,助力企业高效、简单地构建和应用完美适配业务场景的AI大模型。企业不仅能够通过柏睿LLMOps平台在大模型上做垂直领域的模型微调,还可通过向量存储查询引擎,基于企业的自有知识资产构建本地知识问答服务,使得服务更加专业、实时且智慧。

微信图片_20230605182841.jpg

柏睿LLMOps: 高效微调大模型

LLMOps本质是人工智能研发运营体系(MLOps)的子类别。柏睿数据智能平台Rapids AI 是一个以数据为中心、以MLOps为方法论的机器学习平台,致力于解决 AI 生产过程中团队协作难、管理乱、交付周期长等问题,最终实现高质量、高效率、可持续的 AI 生产过程。

在大模型时代,柏睿数据在基于Rapids AI的已有MLOps生态链中补充LLMOps的能力,更加关注大语言模型的构建和运行,其能力特点包括:一是训练微调模型能力。通过柏睿LLMOps平台,通过柏睿LLMOps提供的优化的基础架构、资源管理能力和精简的开发流程,企业能够在本地训练和微调大模型,确保在模型训练、迭代和部署过程中提高效率和控制能力,从而充分利用大模型实现人工智能赋能业务场景的变革能力。

二是可视化编排能力。三是资产管理能力。四是应用运维能力。

通过柏睿LLMOps平台,企业可以简化LLM支持应用程序的开发、部署和维护过程,更高效地部署好用、可靠、精准地AI大模型,加速释放大语言模型(LLM)在垂直应用场景中的全部潜力。

柏睿向量存储查询引擎:强化LLM记忆的“海马体”

但 LLM 更像是容易失忆的大脑,需要海马体来强化记忆,向量数据库就是支撑LLM长期记忆的“海马体”:基于向量数据库,一方面,LLM 通过浏览专用数据与知识使回答更精准;另一方面,LLM 能回忆自己过往的知识和经验,通过“反思”为用户提供更个性化的服务。

向量数据库作为一种能够存储和处理图片、文字、语音等多种数据类型的系统,通过embedding加工使LLM接触和学习的数据向量化,能够有效地支持多模态数据的存储、索引和查询。向量搜索通过与向量数据库中存储的海量向量进行相似度匹配,找到最符合要求的k个记录,此过程可以助力LLM实现相似文本搜索、文本推荐系统、问题回答和知识检索等功能。

柏睿数据作为一家深耕“Data + AI”技术的公司,一直致力于将AI的能力与数据库结合,面向AI大模型时代推出向量存储查询引擎,支持数据的向量化存储和向量索引。柏睿数据RapidsDB的数据联邦机制能够支持结构化数据和向量数据的存储与查询,且采用全内存分布式架构和大规模并行计算引擎,具备高性能、高可用、弹性扩展等特点,切实解决企业对向量的快速检索需求。

基于柏睿数据的大模型训练运维管理生产线 LLMOps及向量存储查询引擎,结合特定行业或应用的场景,企业可获得匹配自身垂直领域的智能化能力。

LLM+RapidsDB:人人都是数据分析师

通过在具有完全知识产权的全内存分布式数据库RapidsDB中引入LLM,柏睿数据推出了具有自然语言接口的分析型数据库。用户通过自然语言提问,可以从RapidsDB的多张数据表中快速查询结果并返回相应分析报告,进一步降低数据库的使用门槛,真正实现“人人都是数据分析师”。

通常,自然语言转SQL是将数据库中所有表的schema传递给大模型,大模型会根据提问和schema信息生成相应的SQL。但是,如果数据库中存在大量的数据表,则会导致传递给数据的schema信息超出token的限制,从而无法完成自然语言转SQL的任务。

针对该问题,柏睿数据首先将数据库中的schema通过embedding转为向量,并存放于向量数据库;再计算问题和schema 向量的相似度,选择与问题匹配的表信息,将筛选后的schema传递给大模型,从而大大减少了单次prompt的token消耗。这样一方面解决了数据表过多无法生成SQL的问题,一方面减少了token数,降低大模型的使用成本。

同时,为让大模型生成更准确的SQL,柏睿数据也在本地利用LLMOps对大模型进行微调,强化大模型对中文的理解和输出,并通过SQL语料的微调,提高SQL生成的准确率。

行业大模型应用:物联网下的智慧工厂

在工厂设备全生命周期管理中,各个环节都会采集、汇聚海量结构化和非结构化的数据、实时流数据和历史数据等多种类型的数据,并需要从这些海量数据中高效、实时地获取能够为业务人员所用的有效信息。

柏睿数据智慧工厂解决方案通过将大语言模型与物联网技术相结合,赋能工厂智能运维场景,重塑数据追踪和分析流程,助力工业企业获得更深入的洞察和智能决策,提高生产质效、降低成本。

首先,采集工厂设备大数据,包括建立设备静态、动态统一的数据库以及设备管理全业务环节的日常业务数据库。

其次,建立“引发工况的可能问题”的样例库。分析不同类型设备出现的不同故障表现及原因并采取适当行为解决该故障,由此形成故障体系。

再次,通过建立专家知识库配置平台,将行业专家的知识整理后录入知识库,作为工厂故障诊断分析、优化运行的指导依据。

最后,一方面将知识库的内容向量化存储到向量数据库中,与LLM结合,输出应对故障和优化问题的、基于经验的回答;另一方面,使用积累的数据对LLM进行微调,使得系统在每次处理和分析数据的过程中都能够通过持续的数据库运算进行“学习”。

由此,大数据平台从工厂运营的经验中收集新的故障检修信息,通过自动学习架构捕捉获得的经验进行编译后,再提供给所有使用者。

未来,柏睿数据将持续发力“Data + AI”的前沿技术与应用,与客户、伙伴携手同行,助力AI大模型深入关键行业的垂直场景,共同构筑数字化全域能力。

责任编辑:徐恒


声明

1、本站遵循行业规范,任何转载的稿件都会明确标注作者和来源;2、本站的原创文章,请转载时务必注明文章作者和来源,不尊重原创的行为我们将追究责任;3、作者投稿可能会经我们编辑修改或补充;4、如本站的文章或图片存在版权,请拨打电话010-88558835进行联系,我们将第一时间处理。

相关链接

视频

专题

2022年中国家电市场报告

3月29日,中国电子信息产业发展研究院(又称赛迪研究院)发布了《2022年中国家电市场报告》(以下简称《报告》)。《报告》显示,2022年,我国家电市场零售总额为8352亿元,同比下降5.2%,但线上渠道和下沉市场家电零售额增长明显,稳住了市场总盘,体现了我国家电市场的韧性。

聚焦2023年全国两会

北京3月5日电 第十四届全国人民代表大会第一次会议5日上午在北京人民大会堂开幕。近3000名新一届全国人大代表肩负人民重托出席盛会,认真履行宪法和法律赋予的神圣职责。

2023年全国工业和信息化工作会议

1月11日,全国工业和信息化工作会议在北京召开。会议以习近平新时代中国特色社会主义思想为指导,全面贯彻党的二十大精神,认真贯彻落实中央经济工作会议精神和党中央、国务院决策部署,总结2022年工作,部署2023年重点任务。

第5届中国—东盟信息港论坛

2022年9月16日,由国家互联网信息办公室、国家发展和改革委员会、工业和信息化部、广西壮族自治区人民政府联合主办的第五届中国—东盟信息港论坛将在广西南宁开幕。该论坛主要围绕数字经济发展和智能互联、数据互通、合作互利等开展交流研讨、建言献策,进一步推进互联网经贸服务、人文交流和技术合作。

2022“三品”全国行

为贯彻落实《国务院关于印发扎实稳住经济一揽子政策措施的通知》要求,加快推进数字化助力消费品工业“三品”战略实施,进一步提振消费信心、挖掘消费潜力,巩固增强消费对经济发展的基础性作用,工业和信息化部近期组织开展2022“三品”全国行活动。中国电子报特开辟2022“三品”全国行专栏,报道活动进展、专家观点、政策解读,敬请关注。

世界超高清视频(4K/8K)产业发展大会

会议

2023世界超高清视频产业发展大会

5月8日-10日,由工业和信息化部、国家广播电视总局、中央广播电视总台、广东省人民政府共同主办的2023世界超高清视频产业发展大会在广州召开。5月9日,广州市委副书记、市长郭永航,中央广播电视总台副台长胡劲军,国家广播电视总局副局长朱咏雷,工业和信息化部总工程师赵志国,广东省委副书记、省长王伟中出席开幕式并先后致辞。

2022世界显示产业大会

11月30日,由四川省人民政府、工业和信息化部主办的2022世界显示产业大会在四川省成都市开幕。全国政协副主席、民革中央常务副主席郑建邦以视频方式出席开幕式并致辞。四川省委书记王晓晖出席开幕式并宣布大会开幕。

2022世界集成电路大会

11月17日,由工业和信息化部、安徽省人民政府共同主办的2022世界集成电路大会在安徽省合肥市召开。安徽省委书记、省人大常委会主任郑栅洁出席会议。安徽省委副书记、省长王清宪,工业和信息化部党组成员、副部长王江平出席开幕式并致辞。

2022世界VR产业大会

11月12日,由工业和信息化部、江西省人民政府共同主办的2022世界VR产业大会在江西南昌召开。国务委员王勇出席大会开幕式并发表重要讲话。江西省委书记、省人大常委会主任易炼红,工业和信息化部党组成员、副部长王江平,江西省委常委、南昌市委书记李红军出席开幕式并致辞。

2022CITE第十届中国电子信息博览会开幕峰会

8月16日,第十届中国电子信息博览会(CITE 2022)在深圳举办。深圳市人民政府副市长张华,广东省工业和信息化厅党组成员、副厅长曲晓杰,工业和信息化部电子信息司副司长史惠康出席开幕式并先后致辞。

2021世界VR产业大会云峰会

10月19日—20日,由工业和信息化部和江西省人民政府共同主办的2021世界VR产业大会云峰会在南昌举办。国务委员王勇出席大会开幕式并发表讲话,江西省委书记易炼红,工业和信息化部副部长王志军,江西省委常委、南昌市委书记李红军出席开幕式并致辞。

世界显示产业大会

本周排行