图片源流:企业官方
蓝鲸新闻12月19日讯(记者 朱俊熹)字节进步再卷AI模子价钱。在12月18日举办的火山引擎Force大会上,字节进步精良发布豆包视觉意会模子,输入价钱为0.003元/千tokens。继通用大模子后,多模态模子也由以分计价迈入以厘计价的阶段。
据字节旗下云奇迹平台火山引擎先容,豆包视觉意会模子的订价比行业价钱低85%,十分于一元钱就不错惩办284张720P的图片。与国表里其他具备多模态才调的大模子比较,OpenAI GPT-4o的输入价钱为0.0175元/千tokens,Anthropic的Claude 3.5 Sonnet订价为0.021元/千tokens,阿里Qwen-Vl-Max为0.02元/千tokens。
本年5月,字节进步在精良对外发布豆包大模子时,就曾因订价比同业低99.3%而掀翻海潮。阿里云、百度、腾讯等头部厂商很快紧随自后,纷纷告示跟进降价,燃起了国内大模子价钱战。在廉价的驱动下,大模子的诈欺也运转加快。火山引擎数据夸耀,限制现在,豆包通用模子的日均tokens使用量已超越4万亿,较初次发布时增长了33倍。
火山引擎总裁谭待在给与媒体群访时提到,跟着模子资本大幅裁汰、后果得到提高,近半年来商场上关于模子使用的响应才多了起来,运转更祥和模子调用量、token数。他在演讲时示意,“咱们但愿用一个合理的、可陆续的,关节是一步到位的价钱,让企业和开导者不错宽心果敢地去使用,去作念多模态。”
新推出的豆包视觉意会模子约略精确识别视觉实质,同期具备意会和推理、视觉神色等才调。在现场示例中,该模子不错识别动物的影子玄虚、杂志内页的星云、体检陈说的某项具体见地。其诈欺场景可能包括教师方面的判卷相通、作文转变,或旅游、电商营销等界限。
谭待称,字节进步在类o1的推理模子界限相同有所布局。在解答数学、物理、代码问题上,豆包视觉意会模子已具备此类才调的雏形。完好意思版推理模子会在进一步完善后推出,“不会太久”。
除字节外,国内也有大模子公司在视觉地点取得新进展。12月16日,独角兽月之暗面发布视觉想考模子k1,主推既能通过视觉精确识别,又能散播推遐想考,在数学、物理、化学等评测中发达最初。上周,私募巨头幻方量化旗下的AI公司DeepSeek开源全新视觉模子VL2。该公司称,视觉是东谈主类获取外界信息的主要源流,在大模子方面的进展却远远过时于话语模子,提高模子视觉才调的真理真理更在于全地点提高其感知和领路才调。
在这次火山引擎行径中,字节进步还发布了豆包3D生成模子,多款产物迎来更新。其中,豆包通用模子pro已全濒临皆GPT-4o,使用价钱为后者的1/8。音乐模子的复古时长从60秒升级至3分钟,文生图模子2.1版块约略完结精确生成汉字、一句话P图等产物化才调。字节瞻望,来岁春季将推出具备更长视频生成才调的豆包视频生成模1.5版,并很快上线端到端及时语音模子。
谈及对大模子将来落地场景的判断时,谭待称AI对话是一个通用的场景,但大模子在分娩力、买卖化场景中的增速并不慢。以近3个月为例,豆包大模子在信息惩办场景的调用量增长了39倍,客服与销售场景增长16倍。“聊天功能是一个很基础的功能,得加上深度推理、视觉意会等功能才能惩办更复杂的任务。而这才是模子之后发展空间越来越大的前提,视觉对大模子的调用量和场景会带来很大的匡助。”谭待示意。
在谭待看来,商场仍处于早期,比起竞争会更关注用户对复杂话语场景、视觉等方面的需求。与互联网时间C端先于B端崛起不同,大模子的这两个方面并不是割裂的,其背后都基于相同的模子才调。因此,字节对大模子的判断是To B和To C皆头并进。
对火山引擎这一双外洞开字节手艺器用的云厂商而言,AI成为了新的增长契机。谭待示意,拉升火山引擎商场份额的关节在于两点。一是界限上风,作念到界限大、弹性高、资本低廉,企业会自干系词然地迁徙过来或作出选定。而火山引擎的上风是从初期起,就将字节旗下抖音、本日头条的里面界限与外部界限和洽起来修复。其次,要把捏住AI大模子这一手艺变革,通过豆包得回更多关注和新的协作契机。
谭待并未露馅云收入受大模子带动的具体数据外围足球软件APP,仅对使用大模子的客户数目、使用进度赐与了确定的评价。“从云原生到AI云原生,火山但愿作念成这块的领军企业。”他示意。