Llama2等30+模型接入千帆大模型平台,推理成本降50%
鱼羊 发自 凹非寺量子位 | 公众号 QbitAI
最强开源大模型Llama2,性能更进一步~
7B、13B、70B三个版本全都有,均可以直接调用部署。
(资料图)
你可能想不到的是,这波操作还是百度搞出来的。
最新消息,百度智能云千帆大模型平台又双叒升级了,这回还悄然变身国内拥有最多大模型的平台:
不仅能跑文心大模型,Llama2全系列、ChatGLM2-6B、RWKV-4-World、MPT-7B-Instruct、Falcon-7B等共33个大模型也已全面接入。
还都是经过性能、安全双重增强的那种——
通过优化模型吞吐、降低模型尺寸,实测调优后模型体积可压缩至25%-50%,推理成本最多可降低50%。百度智能云还基于自身安全积累,完成了二次安全增强。
于是,一听说千帆大模型平台已经开放申请测试,我们赶紧第一时间上手体验了一把。
有意思的是,我们亲测发现,这波更新之后,用大模型的门槛还肉眼可见越来越低了。
大模型数量国内第一,还是“千帆优选”
如果你还没搞清楚“千帆大模型平台”究竟是什么,那么可以简单这样理解:
一个支持各种大模型开发部署的“炼丹炉”。
在千帆这个一站式大模型平台上,企业用户可以按照自身的需求,直接把大模型接入自家应用,或者干脆重新训练、调优出一个属于自己的大模型。
正如前文所言,为了满足企业对大模型多样的需求,千帆大模型平台除百度自研的文心大模型外,还支持Llama 2全系列、ChatGLM2-6B、RWKV-4-World、MPT-7B-Instruct、Falcon-7B等33个大模型。
从后台界面可以看出,从数据服务,到大模型训练,再到大模型的评估、测试、部署,千帆都提供了完整的开发和应用工具链。
在“模型仓库”中的预置模型中,可以找到文心大模型、BLOOMZ-7B和此番更新的全部第三方大模型,一键就能开始部署。
辣么问题来了,其中不少都是开源模型,在千帆上调用跟直接拿代码用相比,有啥好处?
直白一点说,就是便宜、易用,“千帆优选”。
首先,在诸多开源大模型中,并不是每一个都效果理想,有可商用协议。而对上线千帆平台的第三方模型,百度都会事先完成测试验证,确保模型在效果、安全性、可商用三个方面的可靠性。
其次,百度会提前对第三方模型进行性能增强。具体而言,是通过优化模型吞吐、降低模型尺寸,实现模型推理速度的大幅提升。
根据百度的测算,调优后模型体积可压缩至25%-50%,推理成本最多可降低50%。
实际上,推理恰恰是大模型应用阶段的算力消耗大户。量子位智库认为,随着大模型训练阶段完成,未来AI服务器的主要需求将向推理侧转移。IDC的预测则显示,到2026年,AIGC的算力62.2%将作用于模型推理。
再者,调用开源模型很大的一个问题就是,在安全合规方面不能满足国内的需求。为此,千帆对第三方大模型做了二次安全增强,接入了百度多年来在安全上的积累。另外百度也保证,客户在千帆上调用第三方模型,享有平台的安全保障。
最后,如果有进一步调优大模型的需求,那么在千帆这样的平台上,各个环节都集成了低门槛工具,上手十分方便,包括数据的标注、处理、回流,SFT(全量参数微调、P-tuning、LoRA)、RLHF等调优方法,以及大模型的评估、压缩、测试、部署等。
此前,百度智能云就曾在技术交流活动中现场上演10分钟微调大模型。
不会提示工程也能上手大模型
值得一提的是,在此番更新之后,百度智能云还上线了Prompt模板库,长这样:
关注大模型的小伙伴们想来没少听说过“提示工程”这个词。所谓提示(Prompt)工程,就是通过聊天提问的方式,来影响大模型输出内容的质量。
也就是说,只要你的提问技巧够高明,在不耗费大量资源更新模型权重(微调)的情况下,也能让大模型的回答质量更上一层楼。
不过虽说是“聊天”,但针对大模型的提问,那绝对是项技术活儿。吴恩达老师就专门出过有关提示工程的课程。
而千帆平台的这个Prompt模板功能,实际上就是帮你在不熟悉提示工程的情况下,也能快速玩转大模型。
比如让某开源大模型帮忙推荐菜谱。
如果只是告诉它:想吃辣。
生成的回答是这样的:
没什么毛病但有点简略。这个时候就可以一键引用千帆模型库里的“厨师”模板:
我想让你充当我的私人厨师。我将告诉你我的饮食偏好和过敏症,你将建议我尝试的食谱。你应该只回复你推荐的菜谱,而不是其他。不要写解释。想吃辣。
就能得到一份更为详细的建议:
目前,千帆共预置了103款Prompt模板,覆盖对话、编程、电商、医疗、游戏、翻译、演讲等十余个场景。
看来,很多问题不是大模型不会,是我问的不对。
待你“参透”这些咒语的通用规律,比如设定角色、细化要求,还可以在千帆上自制模板,方便测试效果和复用。
千帆大模型平台研发团队认为,很多企业使用大模型时,觉得效果不好是模型本身的问题。但其实很多情况下,企业无需花费大量资源调优大模型,基于模板优化Prompt,即可得到满意的模型效果。
工程师们还向我们透露,根据调研,随着大模型能力的逐渐增强,越来越多的中小企业逐渐由监督微调改为直接调用大模型。因此如何通过优化跟大模型对话的方式,让大模型输出更好的内容,其实正是大模型落地探索过程中的一大痛点。
千帆上线海量Prompt模板,实际上就降低了企业应用大模型的门槛。
大模型应用门槛正在降低
不难看出,千帆这波大更新,主打的就是一个简单易用。
事实上,当大模型走过最初的技术狂热,真正来到探索应用的阶段,不仅是大模型正在激发全新的应用创新,越来越多传统行业也在积极融入大模型生态。
而在这个过程中,无论是前者还是后者,对于降低大模型的使用门槛,都有着迫切的需求。
千帆工程师也表示,从百度自身的实践上来看,大模型最终要达到好的应用效果,除了基础模型本身的能力之外,更重要的是要“找到场景”。而只有降低门槛,才能让更多专业的人把精力聚焦到对场景的理解和场景的应用之上。
千帆大模型平台,如今正是在这一方向上持续打样。
这一方面是因为百度在打造文心大模型的过程中,对大模型技术本身有更深入的理解。
另一方面,在3月份率先发布国产大语言模型之后,百度是国内“目前接触用户/开发者最多的大语言模型厂商”,手握国内最丰富的大模型客户测试经验,对于行业当下所面临的痛点,有着更明确的认识。
甚至可以说,在国内的一众大模型厂商中,百度无疑拥有从数据,到算力,到算法再到实践经验的最全大模型生成资料。
如今,百度不仅局限于自己打造大模型,还正在把越来越多第三方大模型做进基础设施,并不断降低基础设施的使用门槛。
在搜索时代的“百度一下”,或许也将在大模型时代,通过千帆赋予新的意义——
现在接触大模型,最直接的方式还是:百度一下。
标签:
推荐
- Llama2等30+模型接入千帆大模型平台,推理成本降50%
- 《雾雨谜宫》发售首月 全球累计出货量突破30万套!
- 《碧蓝幻想Versus:崛起》11月发售 另有免费版
- 蔚蓝档案新手十连角色推荐
- 跳水世界杯超级总决赛:杨昊夺男子10米台冠军 中国队狂揽8金
- 萌化了!旅韩大熊猫“爱宝”双胞胎宝宝满月照公开
- 快讯!韩国男子无差别行凶致14人死伤 照片姓名被曝光
- 成都大运会闭幕式剧透来了!舞台搬到公园 “直播”联动全球
- 【海评面】外国运动员开启“夸夸”模式:大运村太棒了
- ҈大҈暴҈雨҈!冰҈雹!13级=͟͟͞͞阵=͟͟͞͞风=͟͟͞͞!强对流天气来袭,这些地方暴雨如注!气象部门紧急提醒→
- 一个黔西南的“土专家”和贵州大学八个“虫秀才”的PK
- 外媒:因台风预警,韩国“世界童军大露营”将提前结束
- 为逃警方追捕 巴西男子爬上电线杆待了近24小时
- 意大利南部海域两艘移民船失事,至少2死逾30人失踪
- 腾势N8正式上市
- 洪玛奈被任命为柬埔寨新首相
- 公司信息更新报告:补充核心城市优质资源,单月新增7宗开发地块
- GPT-5要来了?AI行业会发生哪些剧变?
- 柬埔寨国王任命洪玛奈为新首相
- 德国城市盛夏出动扫雪机
- 急速驰援!吉林省民兵应急分队展开救援
- 海尔518L超薄零嵌冰箱,降农残
- 昌吉市二六工镇“村BA”火热开赛
- 所有权具体包含哪些权利以及所有权有哪些特征
- 佩洛西称特朗普应讯像“受惊小狗” 特朗普回应:言论极其刻薄恶毒
- 20余名媒体人走进咸宁,近距离感受“康养之城”的魅力
- 自在西游怎么换绑手机号 自在西游换绑手机号方法
- 烽火战国英雄天赋加点(烽火战国英雄天赋)
- 环球深观察丨他的案子进一步加剧了美国党争
- 【文化评析】沉浸式感受传统文化之“热”
- 法媒:摩洛哥一辆巴士坠入峡谷 24人死亡
- 以色列对叙利亚发动空袭,4人死亡!
- 韩媒:台风“卡努”本周四登陆韩国 韩全境将出现强降雨和大风
- 华东师大紧急排查洪涝地质灾害受灾学生 发放第一批补助款 确保顺利返校
- 太可爱了!舌头卖萌,在韩大熊猫双胞胎满月照曝光
- 芯片战场丨年内最大规模IPO来了!华虹半导体“回A”首秀
- 2023年度全国教书育人楷模候选人07 白琦瑞
- 因地制宜 持续探索(科技视点·跟随科研人员去治沙④)
- 团结协作 共筑梦想(大运观澜)
- 【文化评析】沉浸式感受传统文化之“热”
- 寻找“金嗓子” 唱出好日子
- 兰州市城管委持续加强城管执法系统服务工作
- 拉卡拉:8月4日融券卖出32.68万股,融资融券余额6.12亿元
- 猿辅导设立“青少年科学探索基金”助力天才少年的挖掘与培养 具体是什么情况?
- 西宁成立首个“候鸟式”人才工作站
- 问记者丨流域性洪水、蓄滞洪区、保证水位……这些词是什么意思?
- 外媒:消息人士曝,日本政府最早8月下旬排放福岛核污染水入海
- 外媒:俄连接克里米亚和赫尔松两座大桥遭袭,乌军方宣布对袭击负责
- 台风“卡努” 预计9日接近日本九州地区
- “新农人”推动各国农业“新发展”(国际视点)
- 大运会赛场内外收获多
- 博德之门3明萨拉位置在哪 博德之门3明萨拉位置一览
- 一眼识破高速口大型“山寨”吉祥物 温州公安侦破2起侵犯亚运会著作权案件
- 坚决打赢防汛抗洪救灾遭遇战
- 苹果客服回应 iPhone 不支持地震预警:下载第三方 App 可实现
- 服务进出口总额同比增长8.5%(新数据 新看点)
- 专精特新企业发展势头强劲
- 清淤、消杀、排涝……河北涿州开展灾后修复工作
- 国家防办、应急管理部会商部署重点地区防汛救灾工作
- 跨省支援全力抢险 河北、北京部分地区受灾居民用电基本恢复
- 国民技术:融资净偿还59.66万元,融资余额2.35亿元(08-04)
- 华为Mate 50E屏幕是多少寸的
- 外媒:瑞士去年12万名军官不住军营住酒店,约花费850万瑞士法郎
- 美国网红博主在纽约赠送礼品引发骚乱,警方紧急动员抓捕60多人
- 指导11岁儿子开飞机,巴西父子坠机身亡
- 42国在沙特讨论乌克兰问题,美乌希望争取支持,多国立场并未改变
- 韩议员敦促美放弃对华芯片遏制:美国越制裁中国,中国就越努力进步
- 三大运营商亮出“黑科技” 打通抢险救援通信“生命线”
- 近期好价,入手荣耀Play7TPro,仅需1219元
- 大坝决堤 造成美国阿拉斯加州至少一栋建筑被毁
- 美国佛罗里达州一机场暂时疏散旅客
- 美国加州长滩市一游艇发生火灾 致2死3伤
- 尼日尔军方宣布关闭领空
- 韩国警方两天累计抓获46名“杀人预告”发帖者
- 女性童年创伤可能增加其成年后妊娠并发症等风险
- 展示中国传统表演艺术之美(侨界关注)
- 中法携手演绎世界经典
- 共筑中国网络安全防线(网上中国)
- 杭州支持中小企业购买算力服务
- 一代水影厉害吗_一代水影
- 洁净板是什么材质的(洁净板是什么材质)
- 21℃的城市 360度的人生|我市酒店迎来入住高峰,旅游市场热度大增
- 山楂树关停要注意什么
- 山东地震前后天空现诡异红光?官方回应
- 国际奥委会媒体运行前总监:中国办赛的能力令人叹服
- “取得联系!”直击吉林舒兰抢险救灾
- 河北涿州:排涝清淤、消杀等工作持续进行中
- 从寻常街巷到热门打卡地 特色文化商业带动消费升级
- 新消费激活新势能 打造多维度融合的城市消费新地标
- 两天下了两年的雨,无伤亡!邢台梁家庄村是如何做到的……
- 世界最大跨径双层悬索桥主塔桩基全部完工
- 遇到地震怎么办?这些知识一定要掌握
- (成都大运会)体操选手“八仙过海”:名将惺惺相惜 遗憾收获并存
- 追梦路上不断超越自我 听听他们与大运会之间的故事
- 不止于奖牌!世界运动员成都大运会上见证友谊 成就梦想
- (成都大运会)外国代表团成员沉浸式体验巴蜀文化:这里令人着迷
- 2023成都双年展:借力大运会 有力促进中外文化展示交流
- 共保障城乡低保对象228.6万人 我省提标扩面增效做好困难群众救助
- 大力发展数字农业 打造现代农机装备产业集群
- 听文物讲故事·解码三星堆丨三星堆玉器:绚丽文化长河中的相同“密码”
X 关闭
政策法规
X 关闭