图片起原:企业官方探花 眼睛妹
蓝鲸新闻12月19日讯(记者 朱俊熹)字节跨越再卷AI模子价钱。在12月18日举办的火山引擎Force大会上,字节跨越正经发布豆包视觉解析模子,输入价钱为0.003元/千tokens。继通用大模子后,多模态模子也由以分计价迈入以厘计价的阶段。
据字节旗下云办事平台火山引擎先容,豆包视觉解析模子的订价比行业价钱低85%,十分于一元钱就不错责罚284张720P的图片。与国表里其他具备多模态才气的大模子比拟,OpenAI GPT-4o的输入价钱为0.0175元/千tokens,Anthropic的Claude 3.5 Sonnet订价为0.021元/千tokens,阿里Qwen-Vl-Max为0.02元/千tokens。
本年5月,字节跨越在正经对外发布豆包大模子时,就曾因订价比同业低99.3%而掀翻海潮。阿里云、百度、腾讯等头部厂商很快紧随自后,纷纷告示跟进降价,燃起了国内大模子价钱战。在廉价的驱动下,大模子的利用也开动加快。火山引擎数据炫夸,限制现在,豆包通用模子的日均tokens使用量已越过4万亿,较初度发布时增长了33倍。
火山引擎总裁谭待在接纳媒体群访时提到,跟着模子本钱大幅裁减、效用得到进步,近半年来市集上关于模子使用的反应才多了起来,开动更眷注模子调用量、token数。他在演讲时默示,“咱们但愿用一个合理的、可接续的,要津是一步到位的价钱,勾引twitter让企业和开发者不错宽心斗胆地去使用,去作念多模态。”
新推出的豆包视觉解析模子大概精确识别视觉本色,同期具备解析和推理、视觉描摹等才气。在现场示例中,该模子不错识别动物的影子抽象、杂志内页的星云、体检讲演的某项具体方针。其利用场景可能包括进修方面的判卷辅导、作文改削,或旅游、电商营销等范围。
香港三级电影谭待称,字节跨越在类o1的推理模子范围相似有所布局。在解答数学、物理、代码问题上,豆包视觉解析模子已具备此类才气的雏形。好意思满版推理模子会在进一步完善后推出,“不会太久”。
除字节外,国内也有大模子公司在视觉场合取得新进展。12月16日,独角兽月之暗面发布视觉想考模子k1,主推既能通过视觉精确识别,又能漫衍推梦想考,在数学、物理、化学等评测中推崇最初。上周,私募巨头幻方量化旗下的AI公司DeepSeek开源全新视觉模子VL2。该公司称,视觉是东说念主类获取外界信息的主要起原,在大模子方面的进展却远远逾期于说话模子,进步模子视觉才气的趣味更在于全场合进步其感知和融会才气。
在这次火山引擎算作中,字节跨越还发布了豆包3D生成模子,多款居品迎来更新。其中,豆包通用模子pro已全濒临皆GPT-4o,使用价钱为后者的1/8。音乐模子的复旧时长从60秒升级至3分钟,文生图模子2.1版块大概竣事精确生成汉字、一句话P图等居品化才气。字节瞻望,来岁春季将推出具备更长视频生成才气的豆包视频生成模1.5版,并很快上线端到端及时语音模子。
谈及对大模子改日落地场景的判断时,谭待称AI对话是一个通用的场景,但大模子在出产力、交易化场景中的增速并不慢。以近3个月为例,豆包大模子在信息责罚场景的调用量增长了39倍,客服与销售场景增长16倍。“聊天功能是一个很基础的功能,得加上深度推理、视觉解析等功能才能责罚更复杂的任务。而这才是模子之后发展空间越来越大的前提,视觉对大模子的调用量和场景会带来很大的匡助。”谭待默示。
在谭待看来,市集仍处于早期,比起竞争会更关注用户对复杂说话场景、视觉等方面的需求。与互联网时期C端先于B端崛起不同,大模子的这两个方面并不是割裂的,其背后都基于相似的模子才气。因此,字节对大模子的判断是To B和To C皆头并进。
对火山引擎这一双外通达字节期间器具的云厂商而言,AI成为了新的增长契机。谭待默示,拉升火山引擎市集份额的要津在于两点。一是限度上风,作念到限度大、弹性高、本钱低廉,企业会自联系词然地迁徙过来或作出遴荐。而火山引擎的上风是从初期起,就将字节旗下抖音、当天头条的里面限度与外部限度妥洽起来开拓。其次,要把合手住AI大模子这一期间变革,通过豆包获取更多关注和新的协调契机。
谭待并未走漏云收入受大模子带动的具体数据,仅对使用大模子的客户数目、使用过程给以了细则的评价。“从云原生到AI云原生探花 眼睛妹,火山但愿作念成这块的领军企业。”他默示。