【TechWeb】4 月 22 日音书,本日,蚂蚁百灵崇敬出 Ling-2.6-flash,款总参数目 104B、激活参数 7.4B 的 Instruct 模子。该模子主“Token 率(Token Efficiency)”,在保执竞争力智能水平的同期,快、省以及适大规模真确运用。
据三评测Artificial Analysis 数据,Ling-2.6-flash 展现了隆起的 Token Efficiency 势,以 15M output tokens 完结了 26 分 的 Intelligence Index,在保执较强智能水平的同期赣州钢绞线 矿用,将输出花消扫尾在相对低的位置。比拟部分依赖长输出同样分数的模子,Ling-2.6-flash 在“智能证实”与“输出资本”之间取得了均衡。
关于修复者和企业场景而言,这种率势意味着低的理支拨、快的字反应、短的全体生成时延,以及通晓的交互体验,知足在真确部署环境下对速率、资本与体验的综要求。
Ling-2.6-flash 沿用了 Ling 2.5 的混线架构盘算推算赣州钢绞线 矿用,这种度寥落化的 MoE 架构在硬件证实上势彰着。在 4 卡 H20 条款下理速率快可达到 340 tokens/s,Prefill 费解达到 Nemotron-3-Super 的 2.2 倍。在 Output Speed 测评中,Ling-2.6-flash以 215 tokens/s 的壮健输出速率位列同参数别模子的梯队。
从 Token 花消来看,Ling-2.6-flash 的智比显耀擢升。在 Artificial Analysis 完好测评中,Ling-2.6-flash 总花消为 15M tokens,而 Nemotron-3-Super 等模子达到或过 110M tokens。这意味着,Ling-2.6-flash 仅用约 1/10 的 token 花消完成了同类评测任务。
Ling-2.6-flash 面向 Agent 场景进行了定向增强,在扫尾 Token 花消的前提下,钢绞线也曾保执了强的任求履行力,模子在 BFCL-V4、TAU2-bench、SWE-bench Verified、Claw-Eval、PinchBench 等Agent 关联基准上达到同尺寸 SOTA 水平。与此同期,Ling-2.6-flash 在通用常识、数学理、教导除名及长文本分解等维度保执秀水准。
API 订价面,Ling-2.6-flash 输入每百万tokens订价 0.1 好意思元,输出 0.3 好意思元。现在,Ling-2.6-flash 的 API 已崇敬向用户洞开,并提供为期周的限时费试用。用户不错通过OpenRouter 、百灵大模子 tbox 赢得对应管事。据了解,该模子后续将通过蚂蚁数科发布生意版块LingDT,管事专家修复者及中小企业。
天津市瑞通预应力钢绞线有限公司周前,Ling-2.6-flash 的匿名测试版块“Elephant Alpha”上线OpenRouter,上线以来,其调用量执续增长,勾通多日位列 Trending 榜,日均 tokens 调用量达 100B 别,周增长5000。
声明:网稿件,未经授权回绝转载。 --> 相关词条:铁皮保温施工 隔热条设备 锚索 离心玻璃棉 万能胶生产厂家1.本网站以及本平台支持关于《新广告法》实施的“极限词“用语属“违词”的规定,并在网站的各个栏目、产品主图、详情页等描述中规避“违禁词”。
2.本店欢迎所有用户指出有“违禁词”“广告法”出现的地方,并积极配合修改。
3.凡用户访问本网页,均表示默认详情页的描述,不支持任何以极限化“违禁词”“广告法”为借口理由投诉违反《新广告法》,以此来变相勒索商家索要赔偿的违法恶意行为。