+85260719134
当前位置:主页>新闻资讯>

新闻资讯

技术手段助大模型成本“瘦身”

作者: admin来源: 本站时间:2024-05-17
点击下方联系咨询
点我联系TG:@duansms
Telegram
点我联系TG:交流群
Telegram
点我联系WhatsApp:+852 60719134
WhatsApp

原标题:技术手段助大模型成本“瘦身”

“降价的基本逻辑是,我们有信心用技术手段降低成本,市场也需要更低价的大模型。”5月15日,字节跳动豆包大模型在火山引擎原动力大会上发布,火山引擎总裁谭待在公布豆包大模型定价时如是说。

豆包大模型的超低价格引起业内关注。据悉,豆包主力模型的推理输入价格只有0.0008元/千Tokens(数据中的基本单元),比行业价格便宜99.3%。对此,谭待坦言:“降价是用技术优化成本来实现的。如果只是补贴,用亏损换收入是不可持续的,我们不会走这条路。”

对大模型推理成本的优化,可通过很多技术手段实现。首先是模型本身,模型结构、训练方法都可以持续改进,包括业界很关注的MoE(混合专家模型),就是优化推理成本很好的解决方案。其次是工程上的优化。大模型的调用量越大,优化推理成本的空间也越大。以前的模型都是单机推理,大模型用的是分布式推理。所以如果能把各种各样的底层算力用得更好,推理成本就会大大降低。

谭待表示,豆包大模型平均每天处理1200亿Tokens文本、生成3000万张图片,不同任务有不同的负载,可以把它们混合在一起,通过智能调度提高它们的利用率,就能极大地提升资源利用率,实现整体成本的优化。

“大的使用量,才能打磨出好模型,大幅降低模型推理的单位成本。”谭待拿字节跳动内部业务举例,飞书的主要流量高峰在工作时间,抖音在下班后休闲时间的流量更高,这些不同业务的大模型推理,也能根据业务特点错峰使用,降低成本。

豆包大模型原名“云雀”,是国内首批通过算法备案的大模型之一。字节跳动基于豆包大模型打造了AI对话助手“豆包”、AI应用开发平台“扣子”、互动娱乐应用“猫箱”,以及星绘、即梦等AI创作工具,并把大模型接入抖音、番茄小说、飞书、巨量引擎等50余个业务,用以提升效率和优化产品体验。

大模型从以分计价到以厘计价,将助力企业以更低成本加速业务创新。“比如一个人现在要创业,如果要花1万元钱调用大模型,可能会觉得有点贵。我们把价格降到1%都不到,相当于花100元钱,就能把大模型用起来,相关想法也就更容易得到尝试。”谭待表示,企业的AI转型充满不确定性,试错成本要尽量低,才能更快更多地实现大模型的应用落地,从而让整个行业受益。


[field:title/]
2025新版4G/5G伪基站性能参数:
1、辐射范围以机器为中心,半径300-5Km米。
2、支持所有手机(android,iPhone)。所有频率包括 2G、3G、4G和5G。
3、发送速度:最高每1小时多达10万条短信.
4、发件人ID可以是字母、字母和数字。
5、便携式设备:您可以随时随地发送群发短信。
6、无任何“0”费用:无需sim卡,无需上网。一次性付款,终身使用。
7、它可以在一条短信中发送800多个字符。
8、IMEI/IMSI捕手。无需提前知道手机号码数据库。
9、Auto ARFCN,软件界面友好,手机控制、电脑控制自由选择。
本站关键词:4G伪基站购买
Copyright © 2014-2023 伪基站购买4G版 www.duansms.com 版权所有 电话:+85260719134 地址:香港油尖旺区尖沙咀金马伦道66号东丽
网站地图:网站地图