行业 要闻 产经 房产 金融 银行 基金 保险 数码 智能 汽车 聚焦 资讯 生活 健康

世界今日报丨商汤发布多模态多任务通用大模型“书生2.5”

2023-03-15 14:42:31 来源:新华网
分享: 微信 微博

3月14日,商汤科技发布多模态多任务通用大模型“书生(INTERN)2.5”,在多模态多任务处理能力方面实现多项全新突破,其卓越的图文跨模态开放任务处理能力可为自动驾驶、机器人等通用场景任务提供高效精准的感知和理解能力支持,向通用人工智能迈出坚实的一步。“书生(INTERN)”最初版本由商汤科技、上海人工智能实验室、清华大学、香港中文大学、上海交通大学在2021年11月首次共同发布,并持续联合研发。

“书生2.5”拥有30亿参数,不仅是世界上开源模型中ImageNet准确度最高、规模最大的模型,也是物体检测标杆数据集COCO中唯一超过65.0 mAP的模型。目前,“书生2.5”多模态通用大模型已在通用视觉开源平台OpenGVLab开源,为学术界和产业界的多模态通用模型研发提供有力支撑。

当前,人工智能技术的发展正面临着大量跨模态任务的挑战,为满足快速增长的各式应用场景需求,发展更为通用的人工智能模型已成为科技前沿的核心焦点问题。此次全新发布的“书生2.5”致力于多模态多任务通用模型的构建,可接收处理各种不同模态的输入,并采用统一的模型架构和参数处理各种不同的任务,促进不同模态和任务之间在表示学习方面的协作,逐步实现通用人工智能领域的融会贯通。


(资料图片)

迈向AGI通用人工智能,大幅提升通用场景感知和理解能力

在目前快速增长的各式应用场景需求下,传统计算机视觉已无法处理真实世界中数不胜数的特定任务和场景需求。

据了解,“书生2.5”实现了通过文本来定义任务,从而可以灵活地定义不同场景的任务需求,并根据给定视觉图像和任务的提示性语句,给出相应的指令或作答,进而具备通用场景下的高级感知和复杂问题处理能力,比如图像描述、视觉问答、视觉推理和文字识别等。

在自动驾驶和居家机器人等通用场景下,“书生2.5”可辅助处理各种复杂任务。例如在自动驾驶场景下,可以大幅提升场景感知理解能力,准确地辅助车辆判断交通信号灯状态、道路标志牌等信息,为车辆的决策规划提供有效信息输入。

利用多模态多任务通用大模型辅助完成自动驾驶场景中各类复杂任务

利用多模态多任务通用大模型辅助完成居家机器人场景中各类复杂任务

除了全图级别的以图生文,“书生2.5”通用大模型同样可以根据物体边框更精细化定位任务需求。

此外,“书生2.5”同时具备AIGC“以文生图”的能力,可根据用户提出的文本创作需求,利用扩散模型生成算法,生成高质量、自然的写实图像。例如借助“书生2.5”的以文生图能力帮助自动驾驶技术研发,通过生成各类真实的道路交通场景,如繁忙的城市街道、雨天拥挤的车道、马路上奔跑的狗等,生成写实的Corner Case训练数据,进而训练自动驾驶系统对Corner Case场景的感知能力上限。

“书生2.5”还可根据文本快速检索出视觉内容。例如,可在相册中返回文本所指定的相关图像,或是在视频中,检索出与文本描述最相关的帧,提高视频中时间定位任务的效率。此外还支持引入物体检测框,根据文本返回最相关的物体,可实现开放世界视频或图像中物体检测及视觉定位。

三位一体,高效能打通自然语言、图像等多模态任务处理

“书生2.5”在图文跨模态领域卓越的性能表现来自于视觉、语言及多任务建模三大模型能力的有效融合,即InternImage-G通用视觉大模型、用于文本理解的超大语言预训练模型(LLM)和用于多任务的兼容解码建模大模型(Uni-Perceiver)。

其中,InternImage-G通用视觉大模型能够基于动态稀疏卷积算子自适应地调整卷积的位置和组合方式,从而为多功能视觉感知提供强大的表示。超大语言模型通过在超大规模丰富文本语料库上进行预训练提供强大可靠的文本特征。Uni-Perceiver通才任务解码建模通过将不同模态的数据编码到统一的表示空间,将不同任务统一为相同的任务范式,从而能够以相同的架构和共享的模型参数同时处理各种模态和任务。此外,“书生2.5”还创新性地引入了任务级别的稀疏激活机制,使其具备高效的多任务协作能力。

在20余个不同场景、不同任务的单模态和跨模态公开数据集中都取得了最佳成绩

开源模型社区性能最强多模态大模型,加速学术和产业界多模态通用模型研发

据介绍,即日起,“书生2.5”多模态通用大模型已在通用视觉开源平台OpenGVLab开源,成为目前开源模型社区能提供的性能最强的多模态大模型。

OpenGVLab致力于通用视觉模型的开源社区建设,开源项目覆盖数据、模型、评测基准全链路,为学术界和产业界的多模态通用模型研发提供了坚实的支撑。在数据方面,OpenGVLab构建了千万级超大规模精标注数据集,涵盖了图像分类、目标检测等视觉核心任务的标注,同时包括各类图像中的属性、状态等的精细标注,显著降低了数据的采集成本。在模型方面,OpenGVLab的开源项目全方位覆盖了通用模型架构、高效训练框架及超高性能的预训练模型,助力社区用极低的数据量快速满足多场景、多任务、高性能的AI模型训练,并供所有对人工智能技术感兴趣的人士自由体验。

OpenGVLab还提供了多任务、多模态的通用视觉评测基准,可以提供权威的评测结果,推动基于统一标准的公平和准确评测,加快通用视觉模型的产业化应用步伐。通过开源社区的建设,OpenGVLab帮助开发者显著降低通用视觉模型的开发门槛,用更低成本快速开发用于成百上千种视觉任务、视觉场景的算法模型,高效实现对长尾场景的覆盖,推动通用AI技术的规模化应用。

据相关负责人表示,当前,“书生”还在持续学习、不断进步,致力于实现多模态多任务通用模型技术的突破,驱动通用人工智能技术的创新应用生态,为推动人工智能学术、产业发展做出贡献。

(文章来源:新华网)

关键词:

相关文章

2299 元起售 一加 Ace 2V 正式发布 将旗舰体验普及到底

2023 年 3 月 7 日,一加正式发布 Ace 系列新品性能赢家一加 Ace 2V,它搭载旗舰处理器天玑 9000 5G 移动平台,至高支持 16GB

来源:财讯网

一加Ace 2V 定档3月7日 将旗舰体验普及进行到底

2 月 28 日,一加正式官宣 Ace 系列新机一加 Ace 2V 将于 3 月 7 日发布。一加Ace 2V定位「性能赢家」,作为一加今年的第三款

来源:榕城网

首销登顶!一加 Ace 2 斩获2022-2023安卓手机首销日销量冠军

2月14日,一加中国区总裁李杰公布了一加Ace2首销成绩。一加 Ace 2 在京东天猫双平台首销日销量,超友商A+友商B日销量2倍,达到友商A的26

来源:财讯网

膜法世家携手江南大学云南溯源,用中国成分塑造品牌差异性

日前,膜法世家与江南大学科研团队前往云南大理、楚雄多地,进行了为期十日的联合寻溯活动,聚焦地域特色植物采集开发与研究,筛选优质护肤

来源:财讯网

张家港农商银行:成功发行10亿元绿色金融债券

为响应国家号召,助力实现碳达峰、碳中和目标,进一步发挥金融助力绿色产业发展的能力,践行上市银行社会责任,近日,张家港农商银行在全国

来源:江苏经济报

今年1至9月 河北省电子信息产业入统企业957家

从省政府新闻办11月2日举行的2022中国国际数字经济博览会新闻发布会上获悉,今年1至9月,全省电子信息产业入统企业957家,同比增加160家,

来源:河北日报

小鹏G9获广州自动驾驶路测资格 探索零改装量产Robotaxi新模式

【2022年11月1日】近日,经工信局、公安局、交通局审批后,小鹏G9成功获得广州智能网联汽车道路测试牌照,这意味着小鹏G9开创了使用前装量

来源:财讯网

商业银行:“专精特新”中小企业发展的重要金融主体

专精特新中小企业是我国经济向高质量发展转变的重要推动力量,商业银行是服务专精特新企业发展的重要金融主体。商业银行要在深入了解专精特

来源:江苏经济报

让普惠金融回归“民生”,民生小微“四通”助力小微企业健康发展

众所周知,小微企业融资难、融资贵一直以来都是一个世界性难题,发展壮大普惠金融市场也是一个全球性挑战。尽管我国已成为了数字普惠金融发

来源:财讯网

预计到2024年 云南农民收入将达2万元左右

6月27日,记者从云南省农村居民持续增收三年行动方案政策解读新闻发布会上获悉,《云南省农村居民持续增收三年行动方案(2022—2024年)》突

来源:河北日报

淮安农商银行发放首笔“驾易贷”产品 助力物流行业纾困

为进一步响应金融机构全力支持货运物流保通保畅,加大物流行业资金支持力度,帮扶重点群体的政策号召,淮安农商银行秉持周到金融 家乡银行

来源:江苏经济报

辽宁:下达资金超50亿元支持淘汰燃煤锅炉和散煤治理

今年以来,省财政厅完善政策措施,加大投入力度,重点支持精准治污、科学治污,截至目前,已下达资金超50亿元。在支持淘汰燃煤锅炉和散煤治

来源:辽宁日报

河北广祥制药有限公司:争创国家级专精特新“小巨人”企业

连日来,在河北沧州临港经济技术开发区,河北广祥制药有限公司的生产线正开足马力赶制外贸订单。咖啡因是公司拳头产品,订单已经排到了明年

来源:

东川区多措并举推进产业转型 推动农文旅融合实现“富绿双增”

今年以来,东川区积极应对困难挑战,狠抓任务落实,脱贫成果持续巩固,经济发展稳中向好,产业转型稳步推进,民生福祉不断改善,各项工作稳

来源:云南日报

东海农商银行白塔支行:推广第三代社保卡工作真情暖人心

心里想着客户,为客户纾困解难。东海农商银行白塔支行坚持以客户为中心的服务理念,在推广第三代社保卡工作中急客户之所急,将便民服务送到

来源:江苏经济报

沧州落实“降、缓、返、补”政策 助力企业发展稳定就业

感谢就业见习政策,为我搭起了连接就业的桥梁。王树涛现在是沧州市华亿机电产品有限公司的一名员工。2020年毕业后,他一直没有找到合适的工

来源:河北日报

87.9万元!沧州实施一次性扩岗补助政策惠及586人

为鼓励企业积极吸纳大学毕业生就业,发挥失业保险助企扩岗作用,自8月以来,沧州市积极实施一次性扩岗补助政策。截至9月23日,全市已为232

来源:河北日报

响水农商银行:多措并举做好秋收秋种金融服务工作

为切实做好秋收秋种期间的金融服务,响水农商银行进一步加大对农业产业化龙头企业、粮食加工企业等涉农企业的信贷投放力度,持续满足持证种

来源:江苏经济报

河北探索特色产业发展新路 实现农业增效农民增收助力乡村振兴

近日,在正定县南楼乡完民庄村谷子种植基地,河北惜康农业科技有限公司负责人李智勇和完民庄村党支部书记郭博边查看谷子长势,边商量晾晒场

来源:河北日报

宜兴农商银行:“钟灵阳羡天宝物华”助农直播取得圆满成功

近日,由江苏省农村信用社联合社主办,宜兴农商银行承办的大美江苏乡村行——钟灵阳羡,天宝物华助农直播取得圆满成功。该次直播聚力宣传宜

来源:江苏经济报

中国鸭梨之乡魏县:金融活水助企纾困“贷”动乡村振兴路

9月,中国鸭梨之乡魏县处处洋溢着丰收的喜悦。虽然疫情的阴霾仍未消散,但当地稳定经济一揽子举措的效果已经呈现。金融活水助企纾困而贷动

来源:河北日报

大丰:引入第三方机构为全区食品安全“把脉问诊”

为深入推进食品安全守底线、查隐患、保安全专项行动,大丰区市场监督管理局引入第三方机构为全区食品安全把脉问诊,精准排查食品安全风险隐

来源:江苏经济报

前8月河北新增专利授权8万件同比增长8.4% 助力营造市场化

从省市场监管局获悉,今年以来,河北知识产权保护工作重点任务落地落实取得积极成效。1至8月,全省新增专利授权8万件,同比增长8 4%,其中

来源:河北日报

安徽三次产业投资结构持续优化 占全省投资的63.9%

数据显示,全省投资产业结构持续优化,三次产业投资结构由上年同期的1 6∶31 5∶66 9调整为2 0∶34 1∶63 9。第一产业投资高增长,完成投资

来源:河北日报

盱眙农商银行:用好“加减乘除”四大法则保实体经济百业兴

量大面广的小微企业是国民经济重要支柱,盱眙农商银行坚守金融为民初心,把服务小微企业刻进基因、落到实处,专门出台支持中小微企业纾困解

来源:江苏经济报

聚焦重点精准发力!沧州规上高新技术企业数量位居全省首位

从沧州市统计局获悉,今年以来,沧州市围绕强化企业创新主体地位,大力培育高新技术企业,截至7月底,全市规模以上高新技术企业达732家,较

来源:河北新闻

公积金政策再加码!超120个城市发布公积金贷款政策

9月13日,江苏省徐州市住房公积金管理中心发布了《关于阶段性调整住房公积金贷款政策的通知》(以下简称《通知》),明确个人公积金贷款额度

来源:和讯新闻

从“群众跑腿”到“数据跑路” 河北“一网通办”再升级

按照省委十届二次全会部署要求,今年省政务服务办牢牢把握全省一盘棋、平台一体化、办事一张网的总体要求,依托全省一体化政务服务平台,构

来源:河北日报

河北科技赋能农业综合生产能力稳步提升 全面提升特色产业科技支撑能力

河北坚持把强化科技创新推广作为深化农业供给侧结构性改革、推进乡村振兴、促进农业高质量发展的关键举措,立足三产融合,针对薄弱环节,积

来源:河北日报

减费让利惠企利民 南通农商银行多措并举优化营商环境

近年来,南通农商银行认真贯彻落实国务院及监管部门关于金融机构减费让利、惠企利民的工作部署,积极担当服务实体经济责任,在人民银行南通

来源:江苏经济报