当前位置:首页 > 元宇宙 > AI

2600 tokens s:Meta 发布 Llama API,携手 Cerebras 打造最快 AI 推理解决方案

来源: 责编: 时间:2025-05-01 20:25:56 167观看
导读 4 月 30 日消息,在首届 LlamaCon 大会上,Meta 公司在推出独立 AI 应用之外,还发布了 Llama API,目前以免费预览形式向开发者开放。援引博文,Llama API 支持开发者测试包括 Llama 4 Scout 和 Llama 4 Maverick 在内

4 月 30 日消息,在首届 LlamaCon 大会上,Meta 公司在推出独立 AI 应用之外,还发布了 Llama API,目前以免费预览形式向开发者开放。rZO28资讯网——每日最新资讯28at.com

援引博文,Llama API 支持开发者测试包括 Llama 4 Scout 和 Llama 4 Maverick 在内的最新模型,提供一键 API 密钥创建以及轻量级的 TypeScript 和 Python SDK。rZO28资讯网——每日最新资讯28at.com

开发者可通过一键创建 API 密钥,快速上手使用,同时 API 还提供轻量级的 TypeScript 和 Python SDK。为了方便开发者从 OpenAI 平台迁移应用,Llama API 完全兼容 OpenAI SDK。rZO28资讯网——每日最新资讯28at.com

rZO28资讯网——每日最新资讯28at.com

Meta 还联手 Cerebras 和 Groq,进一步优化 Llama API 的性能。Cerebras 宣称,其 Llama 4 Cerebras 模型的 tokens 生成速度高达 2600 tokens / s,比 NVIDIA 等传统 GPU 解决方案快 18 倍。rZO28资讯网——每日最新资讯28at.com

根据 Artificial Analysis 基准测试数据,这一速度远超 ChatGPT 的 130 tokens / s 和 DeepSeek 的 25 tokens / s。rZO28资讯网——每日最新资讯28at.com

Cerebras CEO 兼联合创始人 Andrew Feldman 表示:“我们很自豪能让 Llama API 成为全球最快的推理 API。开发者在构建实时应用时需要极致速度,Cerebras 的加入让 AI 系统性能达到 GPU 云无法企及的高度。”rZO28资讯网——每日最新资讯28at.com

此外,Groq 提供的 Llama 4 Scout 模型速度为 460 tokens / s,虽不及 Cerebras,但仍比其他 GPU 方案快 4 倍。在Groq上,Llama 4 Scout 每百万 tokens 输入费用为 0.11 美元,每百万 tokens 输出费用为 0.34 美元;Llama 4 Maverick 每百万 tokens 输入费用为 0.50 美元,每百万 tokens 输出费用为 0.77 美元。rZO28资讯网——每日最新资讯28at.com

本文链接:http://www.28at.com/showinfo-45-12691-0.html2600 tokens s:Meta 发布 Llama API,携手 Cerebras 打造最快 AI 推理解决方案

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: Meta Llama AI 模型下载量突破 12 亿,开发者贡献数万个衍生模型

下一篇: 微软发布 Phi-4 系列小语言 AI 推理模型,AIME 2025 跑分超满血版 Deepseek R1

标签:
  • 热门焦点
  • 人间诚实周鸿祎:360 All in 大模型的六个解读

    主笔 / 村口有牛文章架构师 / 毛自聪出品 / 巨头财经5月至今,人间躁动,各路大模型你方唱罢我登场,VC圈互联网圈媒体圈已近癫狂。谁也没想到,今日,360再度刷屏,老牌互联网巨头展现
  • 字节跳动,刚刚投了一位虚拟女生

    今年第一笔虚拟人融资出炉了。投资界获悉,杭州李未可科技有限公司显示发生股东变更,新增字节跳动关联公司北京量子跃动科技有限公司。今天公司方面正式确认,本轮
  • 米哈游推出元宇宙品牌;VR/AR老牌企业当红齐天完成B轮+融资

    今日热点:苹果AR/VR头显的FaceTime或基于Memojis和SharePlay构建而成;VR/AR老牌企业当红齐天完成B轮+融资;米哈游推出元宇宙品牌HoYoverse;国产VR射击游戏《Contra
  • 纽约街头出现NFT自动贩卖机

    一家初创公司宣布在纽约市开放一台NFT自动售货机,允许任何人——即使是没有加密资产的人也能购买NFT。该交易平台名为Neon,上个月完成了一轮300万美元的种子募捐
  • 元宇宙社交时代,华丽归来的超级QQ秀重构虚拟社交场景

    作者:狂人 不知不觉间,QQ已经迎来了第23个生日。作为国内社交平台的起点,QQ可谓是睥睨全网,不仅有庞大的用户群体,还将虚拟形象及QQ整合成在线虚拟社区,开启了时髦
  • 音乐NFT平台里的下一匹黑马是谁?

    NFT 销售额在 2021 年开始暴涨,从 2018 年的仅 4069 万美元的交易量,到 2021 年,NFT 交易量飙升至 442 亿美元以上,并不断刷新记录并达到新的高度。预测到2025 年N
  • 新闻业在元宇宙的现状和未来

    “美联社有毛病吧,这真的过分了!”,一位媒体编辑在推特中愤怒地表示。这是针对一款视频NFT的批评言论之一,之后取消了此次销售,因为该视频呈现了移民穿越地中海的苦
  • GameFi 深度解析,元宇宙内容雏形显现

    GameFi=Game(游戏)+Defi(去中心化金融),核心特点为“Play to Earn”。通过技术与去中心化价值观赋能,GameFi 游戏资产化身为NFT 和代币上链,具备了可验证性和流通性;开
  • 虚拟人的3大纪律和6种品牌孵化模式

    作者:陈格雷(老小格)及团队虚拟人很热,我们最近广泛收集和研究了、各种消费品牌企业在虚拟人开发上的一些主要特点,整理出6种最主要的品牌虚拟人模式,后面一一介绍。
Top