当前位置:首页 > 科技  > 软件

为什么搜索的未来是向量?

来源: 责编: 时间:2024-07-01 17:15:42 225观看
导读出品 | 51CTO技术栈(微信号:blog51cto)如果用户在一个网站上遭遇糟糕的体验,近90%的用户将不会再次访问该网站。请花点时间理解这一惊人的统计数据。传统的网站可靠性工程师主要关注“五个9”,即确保网站99.999%的时间都能

出品 | 51CTO技术栈(微信号:blog51cto)nZH28资讯网——每日最新资讯28at.com

如果用户在一个网站上遭遇糟糕的体验,近90%的用户将不会再次访问该网站。请花点时间理解这一惊人的统计数据。传统的网站可靠性工程师主要关注“五个9”,即确保网站99.999%的时间都能正常运行和访问。然而,这只是确保用户获得良好体验的一部分。nZH28资讯网——每日最新资讯28at.com

还有什么其他因素会导致用户点击离开网站并且永远不再回来呢?无法找到他们正在寻找的内容。nZH28资讯网——每日最新资讯28at.com

搜索某物却无法快速有效地找到它,可能是用户最失望的体验之一。你希望创建一个这种情况很少发生的网站。然而,用户使这变得非常困难。很多时候,他们不知道自己确切在寻找什么。他们心中有一个模糊的需求图像,但缺乏精确的描述词,他们的搜索最终只能用像“用于拧紧螺丝的工具”这样的关键词来提交。如果由人类来回答这个搜索请求,他会返回一套螺丝刀索引。那你的基于关键词的搜索会返回什么呢?nZH28资讯网——每日最新资讯28at.com

  • 关于拧紧技巧的文章。
  • 关于不同类型螺丝的博客文章。
  • 与螺丝刀无关的工具。
  • 这种例子每天都会发生,而且一天要发生无数次。

面对这个困境,我们需要一种新的资源来改善用户体验,即使在用户自身缺乏清晰性时也能提供清晰性。向量搜索提供了传统关键词搜索无法单独实现的可能性。nZH28资讯网——每日最新资讯28at.com

1.向量搜索的工作原理

向量搜索利用先进的机器学习模型将文本数据转化为高维向量,捕捉单词和短语之间的语义关系。与依赖精确匹配的传统基于关键词的搜索不同,向量搜索理解查询背后的上下文和含义,从而能够检索出更相关的结果。通过将查询和文档映射到相同的向量空间,它测量它们的相似度,即使用户的输入不精确或模糊,也能实现精确和直观的搜索体验。这种方法大大提高了搜索结果的准确性和相关性,使其成为现代信息检索系统的强大工具。nZH28资讯网——每日最新资讯28at.com

换句话说,当用户在由向量搜索支持的搜索功能中搜索“用于拧紧螺丝的工具”时,系统不仅查找包含这些确切单词的文档。相反,它解释查询背后的含义,并识别包含“螺丝刀”及相关术语的相关文档。nZH28资讯网——每日最新资讯28at.com

2.搜索的未来是向量

通过理解上下文和语义,向量搜索能够提供与用户意图高度相关的结果,即使查询中没有精确的关键词。这种能力使向量搜索成为改善用户体验的宝贵工具,通过提供精确和准确的搜索结果来响应不精确或描述性的查询。nZH28资讯网——每日最新资讯28at.com

这里有一个简单的向量搜索的例子。nZH28资讯网——每日最新资讯28at.com

大家都知道,将数据转化为向量涉及嵌入过程,其中文本数据被转换为高维空间中的数值表示。在这个上下文中,向量是一个数学实体,通过将单词和短语表示为多维空间中的点来捕捉它们的语义含义。通过将单词嵌入到向量中,模型可以根据它们在大型数据集中的上下文和用法来测量不同术语之间的相似性。这种转换允许更细致和上下文感知的搜索功能,为信息检索和人工智能的进步铺平了道路。nZH28资讯网——每日最新资讯28at.com

为了提供一个相对简单的示例,假设搜索功能所基于的数据集仅是一个字符串,由“Your text string goes here.”组成。这个字符串将被转换为字符串中单词的数值表示的向量。嵌入将包括如下值:nZH28资讯网——每日最新资讯28at.com

-0.006929283495992422nZH28资讯网——每日最新资讯28at.com

-0.005336422007530928nZH28资讯网——每日最新资讯28at.com

-4.547132266452536e-05nZH28资讯网——每日最新资讯28at.com

-0.024047505110502243nZH28资讯网——每日最新资讯28at.com

这些向量表示单词的语义含义,并允许搜索功能根据上下文而不是仅基于精确的关键词匹配来理解和检索相关信息。nZH28资讯网——每日最新资讯28at.com

当用户在这个简化的数据集上搜索类似“这个字段应该使用什么数据类型?”的短语时,搜索引擎会将查询转换为向量表示。然后,它将这个查询向量与数据集的向量进行比较。nZH28资讯网——每日最新资讯28at.com

尽管样本数据集中没有“这个字段应该使用什么数据类型?”的确切单词,但向量搜索识别出查询的上下文和语义与“Your text string goes here.”相似。nZH28资讯网——每日最新资讯28at.com

因此,搜索引擎可以根据向量的相似性返回最相关的结果。这有效地将不确定和不清晰的用户查询转化为更具确定性和清晰度的结果。nZH28资讯网——每日最新资讯28at.com

参考链接:https://thenewstack.io/the-future-of-search-is-vector/nZH28资讯网——每日最新资讯28at.com

本文链接:http://www.28at.com/showinfo-26-97899-0.html为什么搜索的未来是向量?

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: 微服务架构中的通信风格

下一篇: SpringCloud微服务又想变回单体怎么办

标签:
  • 热门焦点
  • 三言两语说透设计模式的艺术-单例模式

    写在前面单例模式是一种常用的软件设计模式,它所创建的对象只有一个实例,且该实例易于被外界访问。单例对象由于只有一个实例,所以它可以方便地被系统中的其他对象共享,从而减少
  • 一篇聊聊Go错误封装机制

    %w 是用于错误包装(Error Wrapping)的格式化动词。它是用于 fmt.Errorf 和 fmt.Sprintf 函数中的一个特殊格式化动词,用于将一个错误(或其他可打印的值)包装在一个新的错误中。使
  • 让我们一起聊聊文件的操作

    文件【1】文件是什么?文件是保存数据的地方,是数据源的一种,比如大家经常使用的word文档、txt文件、excel文件、jpg文件...都是文件。文件最主要的作用就是保存数据,它既可以保
  • JavaScript学习 -AES加密算法

    引言在当今数字化时代,前端应用程序扮演着重要角色,用户的敏感数据经常在前端进行加密和解密操作。然而,这样的操作在网络传输和存储中可能会受到恶意攻击的威胁。为了确保数据
  • 雅柏威士忌多款单品价格大跌,泥煤顶流也不香了?

    来源 | 烈酒商业观察编 | 肖海林今年以来,威士忌市场开始出现了降温迹象,越来越多不断暴涨的网红威士忌也开始悄然回归市场理性。近日,LVMH集团旗下苏格兰威士忌品牌雅柏(Ardbeg
  • 阿里瓴羊One推出背后,零售企业迎数字化新解

    作者:刘旷近年来随着数字经济的高速发展,各式各样的SaaS应用服务更是层出不穷,但本质上SaaS大多局限于单一业务流层面,对用户核心关切的增长问题等则没有提供更好的解法。在Saa
  • 7月4日见!iQOO 11S官宣:“鸡血版”骁龙8 Gen2+200W快充加持

    上半年已接近尾声,截至目前各大品牌旗下的顶级旗舰都已悉数亮相,而下半年即将推出的顶级旗舰已经成为了数码圈爆料的主流,其中就包括全新的iQOO 11S系
  • 到手价3099元起!iQOO Neo8 Pro今日首销:安卓性能最强旗舰

    5月23日,iQOO如期举行了新品发布会,全新的iQOO Neo8系列也正式与大家见面,包含iQOO Neo8和iQOO Neo8 Pro两个版本,其中标准版搭载高通骁龙8+,而Pro版更
  • 荣耀Magic4 至臻版 首创智慧隐私通话 强劲影音系统

    2022年第一季度临近尾声,在该季度内,许多品牌陆续发布自己的最新产品,让大家从全新的角度来了解当今的手机技术。手机是电子设备中,更新迭代十分迅速的一款产品,基
Top