当前位置:首页 > 科技  > 资讯

百川智能发布Baichuan 4及首款AI智能助手百小应,模型能力国内第一

来源: 责编: 时间:2024-05-22 17:07:32 249观看
导读5月22日,百川智能发布最新一代基座大模型Baichuan 4,并推出成立之后的首款AI助手“百小应”。Baichuan 4相较Baichuan 3 在各项能力上均有极大提升,其中通用能力提升超过10%,数学和代码能力分别提升14%和9%,在国

5月22日,百川智能发布最新一代基座大模型Baichuan 4,并推出成立之后的首款AI助手“百小应”。Baichuan 4相较Baichuan 3 在各项能力上均有极大提升,其中通用能力提升超过10%,数学和代码能力分别提升14%和9%,在国内权威大模型评测机构SuperCLUE的评测中,模型能力国内第一。此外,Baichun 4还具备行业领先的多模态能力,在各大评测基准上表现优异,领先Gemini Pro、Claude3-sonnet等多模态模型。Iv428资讯网——每日最新资讯28at.com

在Baichuan 4强大能力的基础上,百川智能将搜索技术与大模型深度融合,推出懂搜索、会提问的AI助手“百小应”。百小应不仅可以随时回答用户提出的各种问题,速读文件、整理资料、辅助创作等,还具备多轮搜索、定向搜索等搜索能力,能更精准地理解用户需求,为用户提供专业、丰富的知识和资源。此外还会在用户问题的基础上通过一系列提问来帮助用户明确自身需求,给出更精准的答案。百小应现在已经在Web端(ying.ai)及移动端各大应用商店同步上线。Iv428资讯网——每日最新资讯28at.com

此外,百川智能还宣布开放Baichuan 4、Baichuan3-Turbo、Baichuan3-Turbo-128k、Assistant API四款API,所有开发者、企业用户均可登录百川智能开发者中心选择并接入相应API,便捷高效地体验百川智能新一代模型的强大能力。(开发者体验中心: https://platform.baichuan-ai.com/playground)Iv428资讯网——每日最新资讯28at.com

Baichuan 4模型能力国内第一,多项能力超越国外主流模型Iv428资讯网——每日最新资讯28at.com

作为百川智能发布的最新一代基座大模型,Baichuan 4在国内权威大模型评测机构SuperCLUE的评测中,模型能力国内第一,相较上一代大模型Baichuan 3提升显著。Iv428资讯网——每日最新资讯28at.com

Iv428资讯网——每日最新资讯28at.com

不仅如此,与国外主流大模型对比,Baichuan4在知识百科、长文本、生成创作等文科类中文任务上明显优于国外大模型。Iv428资讯网——每日最新资讯28at.com

Iv428资讯网——每日最新资讯28at.com

Baichuan 4能在较短的时间内取得突破,源于其在训练过程中引入了诸多业界领先的技术优化手段。例如,在预训练阶段采用了基于Model-based+Human-based的协同数据筛选优化方法,以及对长文本建模位置编码科学的Scaling Law,有效提升了模型对数据的利用;在对齐阶段重点优化了模型Reasoning、Planning、Instruct following能力,通过loss驱动的数据选取与训练,多阶段爬坡,多模型参数融合等方式有效提升了模型的关键指标和稳定性。同时突破RLHF和RLAIF融合的RLxF强化学习对齐技术,大幅提升模型的指令遵循等能力。Iv428资讯网——每日最新资讯28at.com

此外,Baichuan 4还具备行业领先的多模态能力,在MMMU、MMBench-EN、CMMMU、MMBench-CN、MathVista等评测基准上表现优异,大幅领先Gemini Pro、Claude3-sonnet等多模态模型。Iv428资讯网——每日最新资讯28at.com

Iv428资讯网——每日最新资讯28at.com

上线首款AI助手百小应,懂搜索、会提问Iv428资讯网——每日最新资讯28at.com

“百小应”是百川智能成立之后推出的首款AI应用。百川智能认为,不同于信息时代工具属性的产品,大模型创造的是新物种,让AI从工具变为伙伴。虽然受限于模型能力,当下的AI应用还无法完全做到如同人一样,能够使用工具、会思考、有情感等,但随着模型能力的持续提升,相关应用一定会逐步具备完整能力。Iv428资讯网——每日最新资讯28at.com

为了让用户能够拥有更优质的智能体验,百小应很好地融合了Baichan 4行业领先的通用能力与百川智能前沿的搜索技术,具备多步搜索、智能定向搜索等能力,将百小应打造成一款懂搜索、会提问的AI助手。Iv428资讯网——每日最新资讯28at.com

多轮搜索指的是针对用户提出的问题,百小应逐步解析,深入探究,解锁问题的核心答案。相比单轮搜索,在市场调研、产业分析等复杂场景下,多轮搜索能够有效地获取更专业、更有深度的信息。定向搜索则能让百小应精准定位问题领域,直接访问权威站点,快速、准确的找到相关信息。Iv428资讯网——每日最新资讯28at.com

Iv428资讯网——每日最新资讯28at.com

在搜索结果呈现方面,百小应同样与其他在单次搜索后“简单总结网页信息”的应用不同,它是将搜索结果作为观点、论据直接应用到问答结果中。与此同时,其结果的结构化也非常优秀,能够将搜索结果以表格等结构化形式呈现,优化信息布局,便于用户快速定位、解读所需信息,可以为行业分析、调研工作提供强大助力。此外,还在搜索结果中增加了来源参考,用户只需点击引用角标即可快速校验搜索结果,十分便捷。Iv428资讯网——每日最新资讯28at.com

Iv428资讯网——每日最新资讯28at.com

不仅如此,针对一部分用户无法明确表述出自身需求,或者问题过于笼统、抽象的情况,百小应还贴心的用提问功能构建了个性化解决方案,百小应会在用户问题的基础上通过一系列提问来帮助用户明确自身需求,然后再给出更精准的答案。Iv428资讯网——每日最新资讯28at.com

Iv428资讯网——每日最新资讯28at.com

除了强大的搜索和提问功能以外,用户还能在百小应中上传PDF、word文档,或者直接输入网页链接(URL),阅读并分析书籍、报告、学术论文等长篇内容,仅用一分钟便能读完上市公司财报。在Baichuan 4多模态能力的支持下,用户在提问的同时还可以同步上传图片,对图片内容进行解读,或者将图片作为补充材料,获取更精准的回答;并且,它还支持用户通过语音的方式进行交互。Iv428资讯网——每日最新资讯28at.com

Iv428资讯网——每日最新资讯28at.com

百小应的名称源自“一呼百应”;icon中的橙色区别于科技领域常用的冷色调,寓意有温度的人工智能;icon中的形象由水滴和对话气泡组合而成,水滴象征百川入海的无尽智慧,对话气泡象征沟通交流。Iv428资讯网——每日最新资讯28at.com

Iv428资讯网——每日最新资讯28at.com

MaaS 1000万免费token、AaaS免费试用,兼顾性能与成本Iv428资讯网——每日最新资讯28at.com

百川智能认为,企业客户需要的并不是大模型,而是生产力、生产效率的提升,拥有 MaaS+ AaaS(Agent as a service)双重能力,企业才能构建出智能化的最佳方案。Iv428资讯网——每日最新资讯28at.com

秉持这一理念,百川智能推出了全新的MaaS+AaaS服务。MaaS版块由基座模型组成,分为旗舰版和专业版。旗舰版将全量开放Baichuan 4的各项能力,Baichuan 4不仅拥有国内第一的中文能力,并且具备行业领先的金融知识和问答能力,在SuperCLUE的金融知识百科能力上Baichuan 3就已取得了A+的最高评级。Iv428资讯网——每日最新资讯28at.com

专业版包含Baichuan3-Turbo和Baichuan3-Turbo-128K两款模型,在价格方面相比旗舰版Baichuan 4更实惠,且均针对企业用的高频场景进行了针对性优化,综合测试相比GPT3.5整体效果提升8.9%。百川智能表示,即日起,MaaS 的新用户可以获得1000万免费token。Iv428资讯网——每日最新资讯28at.com

Assitants API是百川智能在Baichuan 4基础上针对Agent构建推出的API接口,不仅支持Code interpreter、RAG内建工具,还支持自定义工具调用,方便企业接入各种丰富复杂的API。评测结果显示其工具调用能力接近Open AI Assistants API,本次发布的Assitants API现已正式开启公测,感兴趣的用户均可申请免费试用。Iv428资讯网——每日最新资讯28at.com

Iv428资讯网——每日最新资讯28at.com

未来,百川智能将推出零代码Agent创建平台产品,让业务人员通过自然语言的方式,也能创建Agent,更好地赋能企业智能化发展。Iv428资讯网——每日最新资讯28at.com

目前百川智能已经服务了数千家客户, 包括完美世界游戏、爱奇艺、 创梦、什么值得买等各行业的领军企业,并且与信雅达、用友、软通动力、新致软件、达观数据等多家行业生态伙伴,以及华为、曙光等硬件厂商和中国移动、电信、联通等运营商达成了合作,携手构建百川大模型生态。Iv428资讯网——每日最新资讯28at.com

本文链接:http://www.28at.com/showinfo-16-90015-0.html百川智能发布Baichuan 4及首款AI智能助手百小应,模型能力国内第一

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: 五粮液浓香酒:劳动节送礼的精致艺术

下一篇: 秀我中国|为农机安上“智慧大脑”

标签:
  • 热门焦点
  • 卢伟冰长文解析K60至尊版 对Redmi有着里程碑式的意义

    在今天的Redmi后性能时代战略发布会结束之后,Redmi总经理卢伟冰又带来了一篇长文,详解了为什么 Redmi 要开启后性能时代?为什么选择和 MediaTek、Pixelworks 深度合作?以及后性
  • 5月iOS设备性能榜:M1 M2依旧是榜单前五

    和上个月一样,没有新品发布的iOS设备性能榜的上榜设备并没有什么更替,仅仅只有跑分变化而产生的排名变动,刚刚开始的苹果WWDC2023,推出的产品也依旧是新款Mac Pro、新款Mac Stu
  • K6:面向开发人员的现代负载测试工具

    K6 是一个开源负载测试工具,可以轻松编写、运行和分析性能测试。它建立在 Go 和 JavaScript 之上,它被设计为功能强大、可扩展且易于使用。k6 可用于测试各种应用程序,包括 Web
  • 一篇聊聊Go错误封装机制

    %w 是用于错误包装(Error Wrapping)的格式化动词。它是用于 fmt.Errorf 和 fmt.Sprintf 函数中的一个特殊格式化动词,用于将一个错误(或其他可打印的值)包装在一个新的错误中。使
  • 之家push系统迭代之路

    前言在这个信息爆炸的互联网时代,能够及时准确获取信息是当今社会要解决的关键问题之一。随着之家用户体量和内容规模的不断增大,传统的靠"主动拉"获取信息的方式已不能满足用
  • JVM优化:实战OutOfMemoryError异常

    一、Java堆溢出堆内存中主要存放对象、数组等,只要不断地创建这些对象,并且保证 GC Roots 到对象之间有可达路径来避免垃 圾收集回收机制清除这些对象,当这些对象所占空间超过
  • 阿里大调整

    来源:产品刘有媒体报道称,近期淘宝天猫集团启动了近年来最大的人力制度改革,涉及员工绩效、层级体系等多个核心事项,目前已形成一个初步的“征求意见版”:1、取消P序列
  • 苹果、三星、惠普等暂停向印度出口笔记本和平板电脑

    集微网消息,据彭博社报道,在8月3日印度突然禁止在没有许可证的情况下向印度进口电脑/平板及显示器等产品后,苹果、三星电子和惠普等大公司暂停向印度
  • 微软发布Windows 11新版 引入全新任务栏状态

    近日,微软发布了Windows 11新版,而Build 22563更新主要引入了几周前曝光的平板模式任务栏等,系统更流畅了。更新中,Windows 11加入了专门针对平板优化的任务栏
Top