从“科技公司”进化到“创新科技公司” 字节跳动在AI马拉松前500米跑出加速度

近年来,全球AI技术的飞跃式发展令人瞩目,其已显著超越了初级阶段的摸索与尝试,正式步入了一个更为成熟、全面的中级发展阶段。在这一阶段,AI技术在实践应用中展现出了前所未有的潜力与价值。近日,火山引擎Force原动力大会在北京正式召开。值得注意的是,这是字节跳动深度探索AI技术领域发展的一场盛宴,集中展示了国内**AI大模型与Agent开发平台等AI云原生服务,广受关注。

作为字节跳动强大的创新技术支撑来源,火山引擎将根植在AI行业的经验,坚定长期投入,追求智能突破,服务产业应用,持续把新模型、新技术开放给企业客户。

以“创新”为核心抓手 从技术突围到产业落地

当前,面对AI大模型的百花齐放,以字节跳动为代表的多家科技企业,正在尝试根据自身的业务形态与产品进行结合创新。以豆包大模型为例,通过训练大规模的语言模型,该模型在处理自然语言、理解人类意图以及生成高质量文本方面取得了显著的突破,成为这一技术进步的典型代表。

过去两年多,豆包大模型收获了不少市场的认可,这尤其体现在豆包大模型tokens的日均调用数上。去年12月,豆包大模型的日均tokens调用量是4万亿。今年3月份,豆包大模型的日均调用数是12.7万亿。以豆包1.5为例,多模态能力在60个公开评测基准中取得38项最佳成绩,已广泛应用在电商识图、自动驾驶数据标注、门店巡检等场景。

随着技术不断突破,豆包大模型再次迎来升级。本次大会,豆包大模型1.6与视频生成模型Seedance 1.0 pro等新模型携手亮相。

据介绍,全新升级的豆包1.6系列模型不仅能支持多模态理解和图形界面操作,还能够理解和处理真实世界问题。同时,图形界面操作能力则让豆包1.6进一步具备“行动力”。包括可自动操作浏览器完成酒店预订,识别购物小票并整理成Excel表格等任务。

此外,豆包视频生成模型Seedance 1.0 pro也同步亮相。据悉,该模型支持文字与图片输入,可生成多镜头无缝切换的1080P高品质视频,主体运动稳定性与画面自然度较高。

字节跳动技术副总裁洪定坤表示,豆包1.6模型在编程能力上进步很大,已经接入字节的AI编程产品TRAE内测,新模型将很快推送给用户。据洪定坤透露,在字节内部,目前超过80%的工程师在使用TRAE辅助开发。TRAE的整体月活用户已经超过了100万。

资料显示,豆包大模型目前已涵盖多模态、视频、图像、语音、音乐等模型品类,全方位推进智能提升和应用落地。在行业应用上,豆包大模型服务着全球TOP10手机厂商中的9家、八成主流汽车品牌、70%的系统重要性银行及超五成985高校。

在消费行业,瑞幸咖啡就基于豆包大模型,打造了首个AI点单智能体,能够实现语音下单、猜你喜欢、点单更省时等功能,为用户带来“动动嘴就能点咖啡”的全新咖啡消费体验。而在金融行业,还联合中国银联通过硬件级端到端全链路加密,助力构建安全可信的金融大模型基础设施。同时,在企业服务方面也有亮眼成绩。近期,飞书就推出的AI新功能“知识问答”基于豆包大模型构建,融合外部与企业专属知识,并严格遵循知识权限,精准回答业务问题。目前,飞书知识问答已在安克创新、地平线等企业落地。

现场,随着全新模型的发布与更多企业案例展示,获得了观众不断讨论。有行业人士在交流中认为,随着字节跳动的全面入场,这些“创新”的大模型产品将助力中国的AI领域加速发展,其核心竞争力将在众多大模型中实现突围,形成标杆效应。

目前在国际知名评测榜单Artificial Analysis上,Seedance在文生视频、图生视频两项任务上均排名首位,超越Veo3、可灵2.0等优秀模型。数据显示,豆包大模型日均tokens使用量较去年5月首次发布时增长137倍。另据IDC报告,豆包大模型在中国公有云大模型市场份额排名第一。

可以看到,在“技术革新”的大前提下,字节跳动正在以火山引擎为核心抓手,赋能AI创新升级,重点落在豆包大模型的交互新模式、高度体验等多方面能力提升。字节跳动CEO梁汝波强调,未来字节跳动会通过火山引擎持续把新模型、新技术开放给企业客户。期待和大家一起把更多的技术创新成果应用到实际场景中。

助力Agent规模化应用提速,技术和商业的双重突破

此外,在AI Agent快速发展的当下,规模化落地面临多重挑战。根据行业观察,企业级Agent的实际应用成本压力尤为突出。例如,单个Agent每日token消耗成本可达20美元,而IDC数据显示,2024年中国AI Agent市场规模仅50亿元,远低于预期,反映出企业对高成本的观望心态。

在谈到Agent规模化应用提速的愿景时。火山引擎总裁谭待认为,随着深度思考、多模态和工具调用等模型能力提升,是构建Agent的关键要素。据介绍,由于Agent每次执行任务都会消耗大量tokens,模型使用成本也要降下来,才能推动Agent的规模化应用。

面对AI Agent 落地的成本挑战,火山引擎以“技术+商业”双轮驱动推进规模化。

商业创新方面,重构定价逻辑。豆包1.6首创按“输入长度”区间定价,深度思考、多模态能力与基础语言模型统一价格。在企业使用量最大的0-32K输入区间,豆包1.6的输入价格为0.8元/百万tokens、输出8元/百万tokens,综合成本只有豆包1.5深度思考模型或DeepSeek R1的三分之一。Seedance 1.0 pro模型每千tokens仅0.015元,每生成一条5秒的1080P视频只需3.67元,为行业最低。

技术升级方面,全栈服务赋能开发。为了更好地支持Agent开发与应用,火山引擎AI云原生全栈服务全面升级,发布了火山引擎MCP服务、PromptPilot智能提示工具、AI知识管理系统、veRL强化学习框架等产品,并推出多模态数据湖、AICC私密计算、大模型应用防火墙,以及一系列AI Infra套件。

豆包1.6的定价策略不仅是一次简单的降价,更是AI普惠的战略升级。加速Agent规模化,企业使用成本将降至行业平均的1/3左右,可以推动多模态深度思考功能在客服、数据分析等场景的普及。同时,重构行业定价逻辑以上下文长度为核心的分桶定价模式,为行业提供了更科学的成本核算标准,倒逼竞品优化技术架构。

谭待强调,AI时代会推动开发范式与技术架构全面升级。他说:“PC时代主体是Web,移动时代是APP,AI时代则是Agent。Agent能够自主感知、规划和反思,完成复杂任务。从被动工具转变为主动执行者。豆包大模型和AI云原生将持续迭代,助力企业构建和大规模应用Agent。”

坚定长期投入,加速科研突破,提升AI大模型能力

不难发现,加大投入,加快创新,不断提升AI大模型能力成为字节跳动在AI时代站稳第一梯队的关键,也成为引领中国AI企业转型升级的一个样板。

一直以来,字节跳动作为科技企业的探路者,在产品创新中推出一个又一个的成功佳作。本次旗下火山引擎带来新产品的背后也是对AI行业的重构,并广受**伙伴好评。

在今年5月的联想创新科技大会上,全新推出的天禧个人超级智能体在火山引擎AI机密计算核心技术的支持下,联想的“可信混合计算方案”使得天禧个人超级智能体的安全能力从终端延伸至云端,做到“无网安全,有网同样安全”。联想集团执行副总裁兼中国区总裁刘军表示:“这是联想与火山引擎发挥各自领域技术优势的一次全新尝试,对混合式AI安全架构的搭建具有里程碑意义。希望与火山引擎继续深入**,将安全方案拓展到更多AI终端、AI基础设施和AI解决方案与服务,为中国消费者和中国企业打造安全可信的AI新未来!助力中国AI产业在全球实现弯道超车!”

事实上,对于AI的发展与潜力,凭借敏锐的行业嗅觉,字节跳动早已开始全面布局。除了本次豆包1.6模型与豆包视频生成模型Seedance pro的成功发布外,字节跳动还在聊天、社交、图片、视频、教育与硬件产品布局,仅在一年里,字节跳动布局AI的速度明显加快,在这些领域至少推出了十余款AI产品,从而组成了庞大的AI版图。以创新为武器,针对AI时代的到来做出更多的尝试和改变。

正如梁汝波所言:“AI技术仍处于发展早期,如同马拉松征程的前500米,坚信未来人与AI的协作将带来更丰富的交互体验,激发更多创造力,加速科研突破,为人们的生活与工作、社会发展带来深远影响。”

梁汝波还强调,做好火山引擎对字节跳动成为一家优秀的科技公司、保持技术竞争力很重要。在AI大模型带来技术变革的时代,字节跳动要从“科技公司”进化到“创新科技公司”,在AI时代保持真正的技术竞争力。同时,也会通过火山引擎,持续把字节的新模型、新技术,开放给企业客户,让新技术接受市场的检验。

文 王如

您需要 登录账户 后才能发表评论

发表评论 取消回复

电子邮件地址不会被公开。 必填项已用*标注