联汇科技两项创新产品荣获2022中国广播电视科技创新奖
近日,中国广播电视科技创新奖公布2022年度获奖名单,联汇科技融合AI技术的Superlink智能广播播出系统荣获广播电视科技创新优秀奖、基于AI图像目标识别的广播电视安播辅助系统荣获广播电视科技创新奖。在广播电视网络行业,联汇科技始终保持着领先的技术与产品创新服务能力。 中国广播电视科技创新奖是由科学技术部批准,中国广播电视设备工业协会设立,旨在奖励在推动广播电视科学技术进步方面有较大贡献的产品、企业和个人,调动广播电视科技工作者的积极性和创造性,促进我国广播电视科学技术的发展,其设立和评选工作得到了科技部、工信部、广电总局等相关部门领导的大力支持与帮助。 人工智能是新一轮科技革命和产业变革的重要驱动力量,随着广电行业对人工智能技术应用的深入,人工智能在广播电视内容生产、制作播出、分发传输、终端消费、运行维护、监测监管、信息安全等领域的创新应用越发多样。联汇科技依托在音视图文及人工智能领域的技术优势与行业沉淀,围绕广播电视与人工智能技术的深度融合的发展,推出融合AI技术的Superlink智能广播播出系统与基于AI图像目标识别的广播电视安播辅助系统,进一步助力提升广播电视行业生产效率。 基于AI图像目标识别的广播电视安播辅助系统 当前在广电媒体行业,各级广播电视台已经构建了安全播出技术保障体系,在技术层面上对安全播出进行了保障,但是对由于人员违章行为造成的播出隐患尚缺少必要的监测监管手段,对节目播出、技术保障等人员的行为规范的合规性、只能采用传统的视频监控来进行人工监看和事后取证,无法开展全天24小时的持续监管工作,对人为因素引起的各类安全播出风险和事故,无法提前感知和实时预警。 针对这一问题,联汇科技自研国内首个基于预训练大模型的视频图像识别系统—汇目视觉认知平台作为AI技术中台,以AI视频理解与分析技术为核心,构建基于AI图像分析的广播电视安播辅助监管系统,实现基于图像理解的人员工作状态、动作行为、工作物品的实时监测和报警,提前发现安全播出隐患,加强播出区的安全管理,到“AI+”安全播出保障的业务理念和目标。基于AI图像目标识别的广播电视安播辅助系统依托预训练大模型、AI图像分析等人工智能技术,将AI服务于广播电视安全播出保障,实现智能化安全态势感知,风险预警,处置调度,实现精准式,靶向式监管,进一步筑牢并优化广电安全保障体系。 融合AI技术的Superlink智能广播播出系统 联汇科技基于多年技术沉淀,推出融合AI技术的Superlink智能广播播出系统,结合公司自主研发的向量数据库、多模态数据处理技术、语义理解、智能推荐等人工智能技术,不断精炼优化的一款真正适合专业广播频道使用的智能化制播系统。Superlink智能广播播出系统具备安全稳定的自动录放功能,结合个性化模块设计理念,拥有并支持扩展多种专业的功能模块,以满足不同的播出要求。系统具备良好的适应性、灵活性和智能性,采用更新颖的数据安全模式和网络化设计思想以保证更安全的播出保护。 Superlink智能广播播出系统同时引入了语音合成、语音转写、大数据分析等先进的AI技术,在节目制作、栏目制作、节目单编排等传统复杂人力的业务中使用AI引擎自动实现AI节目制作、AI栏目制作、自动化编排等一系列功能应用,大大减轻电台人力成本的同时提供多元化的内容形式,大大提升广播电视行业制播效率。 联汇科技始终坚持以技术赋能应用,通过人工智能加速广电媒体行业智能化升级,提供从智能化制播、融媒体内容制作和发布、媒体融合生态、智慧总控、媒体数字资产应用一体化解决方案,加速广播电视从数字化、网络化向智能化发展,推动行业转型升级。
2023-10-19 15:23:12306阅读
联汇科技荣获2023 AIGC应用场景创新TOP50
近日,由知名科技与产业创新服务平台亿欧TE主办的2023AIGC技术应用创新峰会在北京成功举办。峰会现场发布了2023AIGC应用场景创新TOP50,联汇科技凭借行业领先的AI技术创新能力与场景应用能力荣获该奖项。 据悉,本次峰会以多元场景为核心,汇集人工智能领域相关协会的领导以及垂直领域专家,与现场参会嘉宾一道分享AIGC领域的前沿趋势,深度探讨AIGC技术发展、应用落地方面的机遇与挑战。 当下,人类社会逐渐迈入强人工智能时代,AIGC作为新的生产力引擎,让内容生产从过去的PGC(专业生产内容)、UGC(用户生成内容)时代,迈入AIGC(人工智能生成内容)时代,越来越多地参与数字内容的生成工作,以大模型技术为核心的AIGC应用日趋成为未来内容生产的基础设施。相关数据预测,到2025年中国生成式Al技术应用规模预计上升至2070亿元,2020-2025年年均复合增长率高达84%。 联汇科技在大模型领域拥有领先的技术优势和丰富的项目案例,在工业视觉、智慧城市、数字安防、智慧能源、数字媒体等领域中,持续发力创新技术研发与应用平台探索,为不同行业客户提供多样化、定制化的AIGC解决方案,满足客户在不同场景中的AI技术使用需求,进一步降低AI技术应用门槛,实现技术与产品的深度赋能。 随着AIGC技术在不同行业落地加速,联汇科技将持续加速探索AIGC与垂直场景应用的深度融合,通过技术迭代与产品演进,加速大模型技术价值释放。
2023-10-19 15:22:09268阅读
联汇科技入选中国科技产业智库甲子光年AIGC产业图谱
4月,中国科技产业智库甲子光年发布《AIGC应用与实践研究展望报告》及AIGC产业图谱,面向AIGC技术创新者、产业参与者、资本机构和政府等各方展现AIGC产业的整体生态环境和行业发展,联汇科技凭借在AIGC领域的核心技术与市场应用优势入选AIGC产业图谱。 AIGC带动不同产业价值提升 随着AIGC技术的快速发展与迭代,AIGC技术的概念不再局限于数字内容的生产形式(Synthetic Media),例如文字、图片、视频等常规内容形式如何通过AI生产,而更多的是体现在广义上的概念,即生成式AI(Generative AI)——如何通过生成式AI的技术思路解决以往决策式AI难以完成的问题,尤其在数据或者内容生成上实现“质的突破”。生成式AI可以延展到流程、策略、代码、蛋白质结构等多种形式,即意味着凡是可以使用数字内容形式的产业,生成式AI均可以涉及,而非局限于传统意义下媒体环境的内容。 AIGC产业的发展来自算法、数据及算力的综合推动。主要包括:从现实生成数字,利用AI技术构建模拟现实世界的数字孪生模型;从数字生成数字,AI学习并创作更丰富的内容;从数字生成现实,基于物联网、多模态技术获取多维信息,实现更加智能的人与机器互动。 它的最终价值在于在流程上重构作业环节的劳动力(生产时间变化所致)与物质资料(能耗、技术等)分配,从而促使新的生产关系出现,通过文字生成、音频生成、图像生成、视频生成、虚拟生成、策略生成、代码生成等形式,辐射覆盖营销、传媒、医疗、工业等不同场景及行业。 从内容出发,AIGC实现了AI技术对各个行业的升级迭代,通过降低内容成本、提升交互效率、推动产业服务模式创新等方式,带动不同产业的价值提升。 联汇科技入选AIGC产业图谱 目前AIGC产业处于发展初级阶段,AIGC的IT技术栈包括资源层、框架层、模型层、中间层以及应用层等多个层。 在甲子光年发布的AIGC产业图谱中,将不同类型企业分为针对细分领域需求提供产品或服务的垂直类企业和侧重NLP/CV/音视频/多模态大模型能力的通用类企业,联汇科技作为行业主流多模态大模型技术供应商入选,通过标准化产品及定制化技术方案,为不同细分场景、行业、领域提供针对性的产品服务。 在大模型技术领域,联汇科技推出自主研发的多模态预训练大模型OmModel,是全国首个获得工信部信通院大规模预训练模型系统检验证书的项目。OmModel是基于大规模自监督学习的多模态人工智能算法,融合语言和视觉模态理解,实现下一代认知域人工智能应用场景落地。已完成基于行业的亿级图片、万级视频、十亿级图文大规模预训练,实现用更小的标注样本数量,融合更多的模态信息,获得更为准确的AI模型。 目前,联汇科技大模型技术与能力已在政务、运营商、安防、能源、军民融合、数字媒体等多个行业领域率先落地应用,通过大模型技术搭建垂直领域智能底座,降低企业AI技术成本,加速企业加速智能化升级,推动不同行业的创新生态重塑。
2023-10-19 15:21:25276阅读
联汇科技荣登「AI中国」机器之心2022年度评选两大重量榜单
近日,中国人工智能业内最具影响力的专业信息服务平台机器之心发布「AI中国」机器之心2022 年度榜单,联汇科技凭借领先的技术优势、强劲的综合实力入选最佳人工智能企业 TOP 30、OmVision 视觉认知平台入选最具商业价值解决方案 TOP 30。 最佳人工智能企业 TOP 30 关注人工智能企业的商业模式成熟度及其主营业务表现。企业需要具备成熟的商业模式,主营业务保持较高增长,并在其主要关注的细分市场领域有成熟的产品或服务,且已获得该领域主导型市场地。 联汇科技预训练大模型拥有国际领先的能力优势,自研多模态预训练大模型OmModel是全球最早一批基于大规模自监督学习的多模态人工智能算法之一,在ECCV 2022等多个顶会竞赛中领先谷歌、微软等技术团队取得多项冠军,大模型已完成基于行业的亿级图片、万级视频、十亿级图文大规模预训练,实现用更小的标注样本数量,融合更多的模态信息,获得更为准确的AI模型。面向智慧城市、数智安防、智慧交通、智慧医疗等不同行业、不同场景的海量的长尾使用需求,帮助企业快速构建AI算法与能力,让业务人员快速掌握AI算法生产及个性化场景落地,使懂业务的人更懂算法,加速降本增效,推动人工智能与产业发展的深度融合,为企业高质量发展注入强劲动力。 最具商业价值解决方案 TOP 30 关注解决方案在流程化部署,规模化展开销售等方面的商业价值。榜单从方案技术优势、市场认可度等维度出发,以市场验证实力。 依托多模态预训练大模型领域的核心能力,联汇科技加速布局核心业务,持续拓展应用边界,打造OmVision视觉认知平台,打破传统人工智能算法训练模式,重新定义视觉算法应用的生产流程。以OmHub为底座,集成OmVision Store算法商城、OmVision Studio算法工厂、OmVision OS操作系统等模块组件,实现算法销售、算法生产、算法训练、算法运行与算法调优等功能,提供“零代码、零样本、零基础”的AI算法生产SaaS服务,让企业快速拥有AI算法生产及个性化场景落地能力。 同时入围「AI 中国」两大重量榜单,充分展现了联汇科技在人工智能预训练领域的硬核实力,联汇科技始终凭借技术研发与科技创新,不断夯实人工智能技术底座,加速推进人工智能实用化、通用化和普惠化发展,推动AI应用普惠向实。
2023-10-19 15:20:12249阅读
联汇科技OmVision视觉认知平台荣获2022中国安防十大新锐产品奖
日前,由深圳市安全防范行业协会、CPSE安博会主办的2023第28届全国安防界迎春团拜会暨2022年度颁奖盛典在深圳举行。经过专家评审团的专业评选,联汇科技OmVision视觉认知平台凭借技术产品的创新性和在安防领域的实战应用,获得2022中国安防十大新锐产品奖项。 2022年,在AI、大数据、物联网等高新技术的不断加持下,整个智能安防行业向数字化、智能化稳步前进。深安协和CPS中安网的数据显示,去年全国安防行业的总产值达到9460亿元,增幅4.9%,面临增速放缓的挑战,传统安防企业对于数字化升级的需求进一步增长,特别是对人工智能等新一代信息技术的需求更加迫切,2023年行业将进入更加开放与活跃的发展新阶段。 为了帮助更多安防企业快速构建在AI领域的核心竞争力,联汇科技在2022年发布OmVision视觉认知平台,打造AI公共服务开放平台为数字安防产业相关企业提供零代码、零样本、零基础的AI算法生产SaaS服务,通过重塑视觉算法生产流程, 让更多安防企业参与算法开发,提升企业在AI技术和应用领域的落地能力,让懂业务的人参与AI算法生产,让AI算法服务离业务更近,进一步提升数字安防企业对海量长尾业务场景的响应能力 ,助力安防企业开启全新市场机遇。 在万物互联新机遇下,安防行业细分领域不断扩充,智慧社区、智慧城市等新赛道涌现,联汇科技将持续围绕行业革新需求,不断迭代产品、升级服务,提供多样化解决方案,与安防企业一道拥抱智慧安防时代的到来。
2023-10-19 15:18:39288阅读
联汇科技OmBot自主智能体横空出世
今年加入 OpenAI 的大牛、前特斯拉 AI 总监 Karpathy 在最近的一次开发者活动上表示:AI 智能体,代表了 AI 的一种未来! 不仅是他,全球 AI 领域的大佬和科技巨头对 AI 智能体的发展都表现出极大兴趣,并寄予厚望。 大语言模型的出现,无疑给 AI 智能体的发展带来了全新的想象力,因此尽管在众多 AI 智能体还未达到完全模拟人类智能的程度的情况下,仍然吸引了全球关注,因为它的出现意味着人类在未来实现通用人工智能的目标上迈出的重要一步。 这个在大模型技术与应用之上诞生的全新赛道,抢跑的人意味着能够拥有先发优势。 OmBot自主智能体的诞生 在今天的 2023 世界人工智能大会上,联汇科技发布了基于大模型能力的自主智能体(Auto AI Agent )——OmBot 欧姆智能体,并针对典型场景需求,推出了首批应用。 OmBot 欧姆智能体横空出世的背后,是联汇科技技术团队的一次 “蓄谋已久”。 公司核心团队来自全球计算机殿堂 —— 卡内基梅隆大学,实验室对于自主化智能体的探索从 90 年代就已经开始。2014 年,联汇科技首席科学家赵天成攻读博士时,已经成功研发了全球第一个多模态智能体平台 DialPort,让不同高校的智能体(机器人)在一个平台汇集,并让他们一同协作帮助人类完成各种任务。 这些智能体的专业领域各不相同。 例如有些是帮助订餐厅,有些是帮你分析电影,有些是帮你处理文案等等。随着智能程度的不断增加,DialPort 汇集了超过 100 个智能体能力,为超过 100 篇学术研究项目提供了智能体的基础平台,更是影响了包括 AmazonAlexa 在内的众多目前已经成熟的交互智能体的设计思路。 自主智能体的初步探索 那么,什么是自主智能体呢? 联汇科技给出了明确的回答 —— 智能体是能够感知环境、自主决策并且具备短期与长期记忆的计算机模型,它能够模仿人类大脑工作机制,根据任务目标,主动完成任务。 联汇自主智能体包含了认知、记忆、思考、行动四大核心能力,作为一种自动、自主的智能体,它以最简单的形式中在循环中运行,每次迭代时,它们都会生成自我导向的指令和操作。因此,它不依赖人类来指导命令,具备高度可扩展性。 自主智能体核心能力 认知是智能体获取环境信息的过程。将原始数据转化为计算机可以理解和处理的形式,而人类 80% 的信息输入来自于视觉。 记忆是智能体存储和提取信息的能力。包括短期记忆和长期记忆,前者用于存储临时的信息,后者用于存储更持久的知识和经验,并最终由记忆在决策和行动中发挥价值。 思考是智能体对感知和记忆进行分析、推理和决策的过程。使用各种算法和技术来处理感知数据和记忆信息,以生成合理的决策和行动计划。其中,语言是我们思考的核心逻辑。 行动是智能体基于感知、记忆和思考结果采取的具体行为。包括控制机制和执行器,用于将决策转化为实际的物理行动或其他形式的输出。 第一批自主智能体是什么 当自主智能体具备了以上 4 类核心能力后,自然而然面向不同行业、不同需求、不同场景的第一批智能体应运而生 —— 视频小欧、文档小欧和 AIGC 小欧。 是的,联汇首次推出的自主智能体并不止一个,而是一批。 他们能做什么呢? 视频小欧可以成为新零售场景中的智慧店长。通过与摄像头视觉信息结合,利用欧姆大模型智能识别店内发生的一切,形成机器人记忆,并自主决策提示交互信息。自主关注店内值得关注的事件,在必要时进行提示。通过与机器人对话交互,用户可以随时询问店内发生过的一切,协助店铺的管理运营。 视频小欧成为自主思考的智慧店长 文档小欧可以成为个人和企业的学习助理。面对电力、石油、医学等行业专业知识学习成本高、查询困难的痛点,文档问答机器人可以将专业知识有效集成到向量数据库,并存储记忆,形成专业机器人,通过多模态内容理解与内容生成,智能回复用户问题,并给出专业的回答。 文档小欧帮助行业小白解决专业问题 AIGC 小欧可以成为媒体、文化、游戏等行业的剪辑助手。通过 AIGC 实现媒体视频素材的一键成片,针对视频主题,语言模块完成视频内容文案生成,随后拆分为更加细节的视频镜头描述,依托语言理解能力,对素材库视频进行搜索、剪辑和生成,最终大幅降低视频制作门槛。 AIGC 小欧一键成片 现场,联汇科技行还发布了基于 OmBot 欧姆智能体与大模型技术的行业级智慧文旅底座,为文旅全行业提供包含元宇宙、AIGC、智慧助手等典型场景快速赋能。 面向行业、企业、个人等不同主体千变万化的需求,OmBot 欧姆智能体将通过高效调教,实现个性化智能体的快速生成与进化,未来的自主智能体,不是一个,也不是一批,而是 “人均” 单位下的应有尽有。 自主智能体会像孙悟空的分身猴毛,有需要就可以快速的实现。 欧姆大模型 3.0 来了! 仔细体验首批自主智能体,不难发现,在应用过程中,认知与思考是自主智能体核心能力的核心。 对于认知与思考的解决方案,联汇依赖的是背后的多模态大模型。 早在 2019 年,联汇科技就与 OpenAI CLIP 模型同期推出了欧姆模型 1.0,实现跨模态搜索,随后的欧姆大模型 2.0,聚焦开放目标识别,实现了从图文检索的到目标理解的跃迁。 目前,联汇科技正式推出欧姆大模型 3.0,直指行业性能最强、真正落地应用的大模型。 这次的欧姆大模型 3.0 实现了哪些飞跃呢? OmModel V3 正式发布 开放识别方面,欧姆大模型支持对视觉图像、视频进行标签全开放识别。预训练中已经包含了数十亿的高质量图文匹配数据,包含大量的环境背景,目标类型,目标属性与行为特征,叠加全图细粒度级别的理解,图文的语义匹配,图文问答等多任务的训练,使欧姆大模型 3.0 具备了能力涌现的保障。 欧姆大模型 3.0 不再局限于固定的目标类型清单,而是通过语义理解去理解视觉中的任意目标,甚至是描述的方式去定义目标。 开放识别 视觉问答方面,构建了私有的十亿级媒体数据和物联网数据,包括无人机视角,监控视角等,通过多任务训练,欧姆大模型 3.0 将包括自然语言解析、逻辑推理、图像理解以及自然语言生成等 AI 能力进行深度融合。将视觉模型和语言模型进行细粒度的对齐,让其可以理解人类指令,并合理作答。 另外,欧姆大模型可以在针对图片进行问答之后进行多轮对话推理,并扩充视觉之外的信息。 视觉问答 认知推理方面,通过不断提升欧模大模型的内容理解与多模态的语义对齐的能力,结合语言模型的能力,欧模大模型能够做到基于视觉认知的推理,并由此支撑智能体所需要的认知与推理能力。 例如,看到儿童摔倒,模型可以推理要立即检查儿童有没有受伤。看到有小孩在窗边,模型可以提醒要注意儿童的安全。看到瓶子破裂饮料打翻, 模型可以提醒马上清理防止有人滑倒。 在开放识别、视觉问答的基础上,认知推理的能力能够赋能智能体从被动的识别转为主动推理,进行思考与决策,并提出相应的智能解决方案。 推理认知 高效微调方面,针对传统全参数微调消耗大量 GPU 计算与存储资源的情况,联汇从模型训练和模型推理两方面入手,使得欧姆大模型能够好用、易用。 在模型训练上,联汇自主设计 PEFT 羽量微调技术,与标准全参数微调相比,仅微调模型参数的一小部分,训练参数量小于 1%,在大幅降低计算和存储成本的同时,实现媲美全参数微调的性能表现。这样的做法能够真实降低大模型的微调训练门槛,快速适配用户长尾场景的训练需求。 训练参数量小于 1% 在模型推理上,联汇推出针对多模态大模型的推理运行系统 ——Hydra 九头蛇部署架构,通过多卡集群部署蛇身,由多个公用的底座模型组成,而各个算法任务只需要部署羽量级的蛇头模型,实现 MaaS 架构。在推理时,蛇头模型可与任意公用蛇身模型结合产生识别结果,且新增算法任务只需增加羽量级蛇头模型。从而实现了 GPU 集群资源的高效利用,并突破算法任务部署显存资源的上限。 Hydra 九头蛇部署架构 作为成熟的大模型,欧姆大模型拥有良好性能的同时,依旧在不断自我进化。联汇研发团队构建了一套完善的人在环路指令学习进化体系。 人在环路指令学习进化体系 集进行能力验证,再配置并测试各种算法任务,确保模型的升级成功。在模型实际部署上线后,持续跟踪算法任务运行情况,记录并反馈模型潜在缺陷和优化点。 数据部据此对新算法任务、长尾场景和模型识别缺陷等关键点,使用完整的数据回流体系进行针对性的数据采集、数据清洗、和指令学习数据集生成等操作。 在指令学习数据集完成累积周期后,算法组将基于质量组的反馈以及数据组采集的数据对欧姆大模型进行新一版本的迭代优化训练,针对性提高模型在业务算法上的能力,增强泛化能力。 基于由效果评估、升级策略、数据回流、优化升级构成的人在环路指令学习进化体系,欧姆大模型可以对底座模型进行有效的指令学习、迭代升级,从而在现有的算法任务上有更好的表现。 这也意味着每隔几个月,欧姆大模型都会迭代进化得更加强大。 完善的工具链和工程化框架 成功的大模型在应用层面落地需要与之配套的工具链与工程化框架。 为了帮助用户更好、更快的使用大模型技术与产品,联汇正式发布欧姆大模型工具软件集合,用 AI - 原生的思路,重新想象 AI 智能体的开发工具,让开发者可以快速构建未来的爆款智能体! 欧姆大模型应用体系 过去几年间,联汇科技构建了完善的针对视觉理解场景的工具链平台。开发者可以利用自然语言灵活的表述识别需求,OmVision Studio、OmVision OS 等平台与系统,提升算法生产效率的同时,有效降低了人工智能技术的应用门槛,为更多的企业与行业赋能。 OmVision 应用体系 今天,联汇科技首次发布针对智能体的 OmBot OS 操作系统。开发者可以基于灵活的模块配置,将多模态大模型、向量数据库、人机交互认知架构进行深度融合,为构建基于多模态数据感知、认知、思考与行动的智能体奠定基础。 OmBot OS 架构 OmBot OS 提供自带的长期记忆模块,同时允许开发者用户编写主动思考模块与交互响应模块,支持响应式问答与主动推荐思考的任务场景。同时支持记忆反思模块,模拟人类对于长期记忆的主动压缩与思考过程,从繁杂的原始记忆中抽取出更加高维度的抽象记忆信息,让我们的智能体更加人性化。 OmBot OS 让开发者可以基于灵活的模块配置,将多模态大模型、向量数据库、人机交互等技术进行深度融合,为构建基于多模态数据进行感知、认知、思考与行动的智能体奠定了基础。 以更开放的方式拥抱 AGI 时代 完善的产品矩阵与人在环路指令学习进化体系为联汇科技的技术生长打下扎实基础,在此之上的对外开放能力同样令人期待。 联汇首席科学家赵天成博士表示,我们相信在未来,每个人与每一家企业都可以在 AI 的能力加持,具备更好的记忆、认知和决策能力,我们现在的技术方向,就是让机器不断与我们人类对齐,持续进化,最终真正为人类所用。 在这样的过程中,联汇科技始终以用户为中心,不断进化能力、迭代产品、开放生态,推动降低人工智能使用门槛,加速推动普惠 AI 赋能千行百业。 在 AGI 时代来临之际,人工智能的范式变革正在加速,曾经的故事正在成为现实。
2023-10-19 15:17:53256阅读
OmFusion引擎助力杭州文广集团打造业内首个AIGC驱动的短视频内容生产集成创新平台
近日,杭州文广集团成功研发一个以策、采、编、发全流程人工智能生成内容为技术驱动的短视频实验生产车间。该实验生产车间秉持内容为王、技术驱动、集成创新、开放合作的宗旨,以AI赋能内容生产,并以此为基础进行流程创新,实现了短视频内容生产提质增效。 据悉,2023年伊始,杭州文广集团开始布局人工智能生成视频内容的技术研发创新工作。目前已完成文本驱动超写真语音生成、超写真数字主播生成、视频AI检索、文本驱动的视频剪辑一键成片等技术创新模块的研发,并成功研发了国内首档全流程人工智能生成电视节目《冠军AI亚运》。 杭州文广集团以人工智能技术打造短视频内容生产集成创新平台,开创了国内媒体行业之先河,通过直接对接目前国内最前沿的算法大模型,并充分调用自有庞大的音视频数据资源,技术起点高,应用场景切入点准,在内容生产领域取得了长足进步,具有示范作用。 杭州文广集团拥有深厚的音视频媒资库的资源优势,联汇科技依托OmFusion引擎、AIGC技术打造的OmFusion媒体辅助生产平台通过多模态数据处理、向量数据库、AI增强分析等核心技术为基础,实现对音、视、图、文等多种模态的数据进行融合处理,并构建高维向量数据索引和关系图谱,打造一个具备自监督学习能力的一体化认知型智慧大脑,高效实现视频AI检索、文本驱动视频剪辑一键成片等应用,让视频的内容检索更简单、视频的生产制作更容易。 视频AI检索 OmFusion引擎拥有夯实的检索能力,面对杭州文广集团的巨量媒体数据与资源(音频、视频、图片、图文等),Fusion引擎通过AI自动处理对媒体资料的分类、打标签、向量检索等环节,抽取对象的各种标签特征和知识点,形成全息检索知识库,无需人工编目。同时通过语义检索,克服传统关键词搜索的弊病,检索精准度和获得率远高于关键词搜索。 OmFusion引擎既能满足支持图搜图、文本搜文本、视频搜视频等单模态检索,也可以满足图搜文、文搜视频等跨模态检索,同时通过对视频的全景扫描,满足对人脸、车辆车牌及人体特征等特殊检索需求,大幅提升视频检索的效率和准确率,检索精度可以精确到每帧、每秒。 文本驱动智能剪辑 在文本驱动AI智能剪辑方面,OmFusion引擎实现了一键成片的创作。只需上传文本稿件,OmFusion引擎即可通过AI智能分析文本,合理解析语义,智能分段、分句,根据新闻稿件智能生成镜头脚本,并根据脚本内容在素材库中实现文本、音频、视频、图片等多模态素材快速搜索、剪辑和生成,为用户提供媒体新闻视频、影视动画混剪等,进一步降低了视频制作门槛。 同时通过使用视频字幕生成、视频锦集、视频拆条、视频超分等视频智能化剪辑工具,满足个性化、多样化的视频剪辑需求,高效节省人力时间成本,最大化版权内容价值,有效提升了成片的完整性和精彩程度,大幅提升文广专业工作者的工作与创作效率。 随着人工智能进入了通用人工智能阶段,生成式AI率先落地传媒领域,媒体行业正在大踏步迈入传统内容创作和AIGC并行的时代,联汇科技始终以技术与产品创新为核,为行业客户提供丰富的行业AI技术服务方案,不断加速大模型、AIGC等新技术在赋能行业升级方向中的创造性的实践与应用。
2023-10-19 15:16:17285阅读
中央广播电视总台正式启用联汇科技ProMusic V3音乐播出系统
3月22日,联汇科技ProMusic V3音乐播出系统取代美国广播资讯化服务公司RCS系统,在中央广播电视总台经典音乐广播频道投入使用。 联汇科技ProMusic V3音乐播出系统是面向各级广播电台音乐频率的制播工作需求,专门设计研发的一套专业播出系统,与广电常规频率以主持人直播为主、录播节目为辅的特点不同,音乐频率更加注重音乐节目之间的节奏、风格、节拍数等变化以及音乐节目之间衔接的听感效果。此外,音乐频率的录播属性使其具备了可批量自动编单的条件特性。 面向音乐频率的特别需求和形式,联汇科技创新研发了一套着重节目编目属性管理、具备自动编单业务、强化录播节目自动播出的音乐播出系统——ProMusic V3,在前期与总台多个音乐频率的深度沟通的基础上,ProMusic V3推出个性化功能满足音乐频率的制编需求,并进行持续优化。 ProMusic V3音乐播出系统在整体架构上实现了智能化、自动化、集成化,实现播出站与编排管理站的一体化运。 播出站作为调音台最重要的输入音源,重点保障安全稳定播出,为主持人们提供布局清晰、操作便捷的界面。编排管理站着重优化节目资源管理体系、自动编单过程和节目单编排过程的流程简化和交互体验升级,为用户提供每日节目单的查看编排、批量自动编单、Jingle编排、节目资源管理、用户与权限管理、日志查询等特色核心功能,解决了以往编目管理不规范、编目无法准确统计等问题,实现批量自动编单,缩短编目时间,提升节目质量,实现对音乐频率的全流程数字化管理,进一步提升音乐频率的制播管理效率。 联汇科技作为国内最早开始专业数字媒体技术研究和应用的企业,加速在人工智能技术领域的创新探索,通过先进的产品服务和完善的解决方案为不同用户提供丰富的数字技术解决方案。
2023-10-19 15:14:22287阅读
助力中国移动全球合作伙伴大会,联汇科技打造人工智能2.0应用新范式
10月11日至13日,2023中国移动全球合作伙伴大会在广州保利世贸博览馆举办。中国移动全球合作伙伴大会举办11年来,推动了全球信息产业生态的深度合作,加速了中国信息通信产业的创新突破,引领了信息科技领域的自立自强,加快了数字中国的建设步伐。 本届大会进一步全面展示中国移动和合作伙伴在5G、6G、算力、AI等领域最新技术创新,算力网络等新型基础设施最新解决方案,数字经济和实体经济深度融合最新应用案例,为加快构建新发展格局和推动高质量发展赋予新动能,开启中国式现代化建设的新征程。 联汇科技作为中国移动生态链伙伴参与大会,重点展示了在视觉智能、多模态大模型等领域的应用探索与面向智慧家庭市场的创新成果。 面向智慧家庭市场,中国移动与联汇科技积极探索打造基于大模型、智能体等技术的在家庭生态中的场景化应用。 联汇科技基于自主开发的OmBot智能体框架为基础,打造智能管家解决方案,将感知、思考、记忆和交互四大核心能力植入家庭智能应用,结合家庭智能相机,打造更智能、更懂客户的智能管家产品。深度融合语言和视觉模态理解,基于感知与思考模块实现所见即所知,完成对全量物体的识别、统计,同时基于思考与交互模块,并根据视频画面场景即时更新统计数据,实现语音互动下的智慧视觉问答,深化AI对视频画面的理解、分析,对开放式问题、任务进行即时的回答反馈,极大地提升智慧家庭场景中的智能化服务水平,为用户提供更智能、更个性化的智慧家庭体验。 基于多模态大模型在视频领域的核心处理能力,展示在视联网平台的建设与探索。 联汇打造基于AI2.0预训练大模型为核心的运营商视图AI运营解决方案,依托大模型强大的通识认知能力和自研工具链产品体系,建设高效生产、一键部署、在线调优、全面开放、图形化操作的新一代视图AI的运营体系。中国移动通过构建算网能力稳定、资源集约调度、视频类型融合的视联网平台,作为数字化基础设施灵活供给全行业、全领域的场景化需求。建设包括视频会议、监控、直播、处理与分析以及加密能力的五大场景化能力,推出智慧监管、智慧店铺监控、视频快处等行业解决方案。 随着视觉智能、多模态大模型、自主智能体等技术的持续发展,我们将与生态企业协同创新、加速共进,带来更多前沿的技术和解决方案,推动智能化服务在各个领域实现更深层次的应用。
2023-10-19 15:13:36252阅读
联汇科技入选中国⼈⼯智能技术厂商⽣态图谱智能体板块,加速探索AGI时代
日前,全球软件开发知识与创新社区InfoQ研究中心发布《2023中国人工智能成熟度模型报告》及中国人工智能技术厂商生态图谱,凭借在自主智能体领域的创新探索,联汇科技作为代表厂商,入选图谱通用人工智能(AGI)中智能体板块,再次展现了在通用人工智能(AGI)领域的领先实力。 据悉,InfoQ研究中心已构建了涵盖130多个技术领域的中国技术成熟度评估曲线。针对人工智能领域在2023年的全新变化,InfoQ研究中心再次进行行业梳理,基于技术专利数量、技术发展时间、技术舆论指数等核心指标,结合市场规模和融资事件等公开资料,并通过专家访谈,绘制中国人工智能成熟度模型。 报告表明,2023年⼈⼯智能领域的注意力被大模型相关技术吸引,话题不断破"圈"(学术圈、科技圈、创投圈)。现阶段,多数的⼤模型厂商仍然处于早期竞争阶段,即产品端从"无"到"有"的过程,但用户已经将关注的重点聚焦在了实际的效果和由此带来的成本上。⼤模型厂商需要更加贴合实际需求,充分展现产品价值,才能在激烈竞争中脱颖而出。 联汇科技是中国首个抢跑自主智能体赛道的AI技术企业。依托OmModel欧姆多模态预训练大模型、iBase向量数据库以及AIGC领域的核心技术,设计开发了国内首个大模型驱动的自主智能体(Auto AI Agent)——OmBot自主智能体,其具备像人一样观察和记忆的能力,包含了认知、记忆、思考、行动四大核心能力,同时可根据感知到的情况实时思考,自主决策,动态交互。作为一种自动、自主的智能体,它以最简单的形式中在循环中运行,每次迭代时,它们都会生成自我导向的指令和操作,不断进化和更新。 目前,OmBot自主智能体已发布第一批行业应用:视频小欧、文档小欧与AIGC小欧,实现在运营商、融媒体、智慧城市、视觉智能、行业智能、AIGC等不同行业与场景中个性化产品与方案的落地与应用,通过多形态终端搭载智能体,实现智能内容生成、多维交互等功能,进一步降低了AI技术门槛。 此外,为推动OmBot自主智能体在千行百业的加速落地,联汇科技打造丰富的智能体生产应用工具链:0mBot Studio生产工厂与OmBot OS为智能体行业化、场景化落地提供坚实的基础,进一步加速智能体领域的多元化发。 联汇科技将继续依托在大模型、智能体领域的核心技术,不断优化和升级智能体产业链上下游的产品与服务,积极探索和拓展更多的应用场景,推动AGI技术在更多行业的爆发与赋能。 InfoQ研究中心 InfoQ旨在通过促进软件开发及相关领域知识与创新的传播,与中国技术社区的专家一起,为中高端技术人群提供及时、高质量的技术资讯与技术实践者主导的会议,成为连接中国企业软件技术高端社区与国际主流技术社区的桥梁,InfoQ中国始终在引领中国技术浪潮的发展。
2023-10-19 15:12:31268阅读
预约专家解决问题
提交后鲸选型专家顾问会联系您
您的问题是?
您的联系方式
商务咨询
运营咨询
电话沟通