当前位置:首页 > 科技  > 网络

百川智能王小川:美国OpenAI要把1000万个GPU连接起来做大模型 这种想法像登月一样

来源: 责编: 时间:2023-10-31 16:46:04 427观看
导读 快科技10月31日消息,在今天上午举办的2023云栖大会上,百川智能创始人兼CEO王小川发表演讲称,今年年底之前,国内会有几家公司能够做到GPT3.5的水平,明年国内会有若干款超级应用。 王小川表示,百川智能做大模型的

快科技10月31日消息,在今天上午举办的2023云栖大会上,百川智能创始人兼CEO王小川发表演讲称,今年年底之前,国内会有几家公司能够做到GPT3.5的水平,明年国内会有若干款超级应用。34m28资讯网——每日最新资讯28at.com

王小川表示,百川智能做大模型的理念是“理想上慢一步,落地上快三步”。4月下场之后,百川在两个月时间就完成了第一个70亿参数的模型的发布,行业一般需要半年,比预期时间节省了三倍。34m28资讯网——每日最新资讯28at.com

他直言,在大模型领域,确实得承认跟美国存在差距。他预计今年年底之前国内会有几家公司能达到GPT 3.5的水平,到明年也有信心能够达到GPT4.0的水平,但是达到之后,可能很难去超越他们。34m28资讯网——每日最新资讯28at.com

他在发言中还谈到在美国与OpenAI交流时了解到的情况。34m28资讯网——每日最新资讯28at.com

他们在正在设计一个把1000万颗GPU连在一起做模型的技术。咱们做GPT3.5的时候用了4000颗GPU,做GPT4的时候是25000颗,英伟达一年生产能力才100万颗,而OpenAI在设计把1000万个GPU连接起来,这样一种想法像登月一样。“34m28资讯网——每日最新资讯28at.com

“我对他们充满了敬畏。我更自豪的地方是,我们在做应用方面可能比美国走得更快。”王小川表示。34m28资讯网——每日最新资讯28at.com

王小川认为,在做应用方面,中国企业会走得很快。基于现在已有的技术,相信中国明年有若干款超级应用。34m28资讯网——每日最新资讯28at.com

公开资料显示,百川智能成立于2023年4月10日,由前搜狗公司CEO王小川创立。其核心团队来自搜狗、Google、腾讯、百度、华为、微软、字节等知名科技公司,目前团队规模170余人,研发人员占比超80%。34m28资讯网——每日最新资讯28at.com

成立半年,百川智能便接连发布baichuan-7B/13B,Baichuan2-7B/13B四款开源可免费商用大模型及Baichuan-53B、Baichuan2-53B两款闭源大模型,平均每28天就会发布一款新的大模型。34m28资讯网——每日最新资讯28at.com

10月30日,百川智能发布Baichuan2-192K大模型,其上下文窗口长度达192K,是目前全球长的上下文窗口,能够处理约35万个汉字,是目前支持长上下文窗口优秀大模型Claude2(支持100K上下文窗口,实测约8万字)的 4.4倍,更是 GPT-4(支持32K上下文窗口,实测约 2.5万字)的14倍。34m28资讯网——每日最新资讯28at.com

据悉,Baichuan2-192K现已正式开启内测,以API(应用程序接口)调用的方式开放给核心合作方,目前已经与财经类媒体及律师事务所等机构达成了合作,将全球领先的长上下文能力应用到了传媒、金融、法律等具体场景当中,不久后将全面开放。34m28资讯网——每日最新资讯28at.com

34m28资讯网——每日最新资讯28at.com

本文链接:http://www.28at.com/showinfo-17-16113-0.html百川智能王小川:美国OpenAI要把1000万个GPU连接起来做大模型 这种想法像登月一样

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: 阿里云宣布大模型家族全面升级 :通义千问2.0发布 通义千问App正式上线

下一篇: 半导体持续亏损!三星Q3利润暴降78%

标签:
  • 热门焦点
  • 印度登月最关键一步!月船三号今晚进入环月轨道

    8月5日消息,据印度官方消息,月船三号将于北京时间今晚21时30分左右开始近月制动进入环月轨道。这是该探测器能够成功的最关键步骤之一,如果成功将开始围
  • Automa-通过连接块来自动化你的浏览器

    1、前言通过浏览器插件可实现自动化脚本的录制与编写,具有代表性的工具就是:Selenium IDE、Katalon Recorder,对于简单的业务来说可快速实现自动化的上手工作。Selenium IDEKat
  • 把LangChain跑起来的三个方法

    使用LangChain开发LLM应用时,需要机器进行GLM部署,好多同学第一步就被劝退了,那么如何绕过这个步骤先学习LLM模型的应用,对Langchain进行快速上手?本片讲解3个把LangChain跑起来
  • 三言两语说透柯里化和反柯里化

    JavaScript中的柯里化(Currying)和反柯里化(Uncurrying)是两种很有用的技术,可以帮助我们写出更加优雅、泛用的函数。本文将首先介绍柯里化和反柯里化的概念、实现原理和应用
  • 阿里大调整

    来源:产品刘有媒体报道称,近期淘宝天猫集团启动了近年来最大的人力制度改革,涉及员工绩效、层级体系等多个核心事项,目前已形成一个初步的“征求意见版”:1、取消P序列
  • iQOO Neo8 Pro抢先上架:首发天玑9200+ 安卓性能之王

    经过了一段时间的密集爆料,昨日iQOO官方如期对外宣布:将于5月23日推出全新的iQOO Neo8系列新品,官方称这是一款拥有旗舰级性能调校的作品。随着发布时
  • OPPO K11搭载高性能石墨散热系统:旗舰同款 性能凉爽释放

    日前OPPO官方宣布,将于7月25日14:30举办新品发布会,届时全新的OPPO K11将正式与大家见面,将主打旗舰影像,和同档位竞品相比,其最大的卖点就是将配备索尼
  • OPPO Reno10 Pro英雄联盟定制礼盒公布:萨勒芬妮同款配色梦幻十足

    5月24日,OPPO推出了全新的OPPO Reno 10系列,包含OPPO Reno10、OPPO Reno10 Pro和OPPO Reno10 Pro+三款新机,全系标配了超光影长焦镜头,是迄今为止拍照
  • 电博会与软博会实现"线下+云端"的双线融合

    在本次“电博会”与“软博会”双展会利好条件的加持下,既可以发挥展会拉动人流、信息流、资金流实现快速交互流动的作用,继而推动区域经济良性发展;又可以聚
Top