当前位置:首页 > 科技  > 软件

阿里云史诗级故障赔偿拿到了!但是业务也是影响的一片狼藉

来源: 责编: 时间:2023-11-30 09:30:12 356观看
导读2023 年 11 月 12 日 18 时许,阿里云发布公告称,阿里云云产品控制台服务异常,阿里云立即发布公告,公告显示,北京时间2023年11月12日17:44起,阿里云监控发现云产品控制台访问及API调用出现异常,阿里云工程师正在紧急介入排查

2023 年 11 月 12 日 18 时许,阿里云发布公告称,阿里云云产品控制台服务异常,阿里云立即发布公告,公告显示,北京时间2023年11月12日17:44起,阿里云监控发现云产品控制台访问及API调用出现异常,阿里云工程师正在紧急介入排查。工程师通过分批重启组件服务,绝大部分地域控制台服务已恢复访问。O4l28资讯网——每日最新资讯28at.com

业务影响

数据排查

图片图片O4l28资讯网——每日最新资讯28at.com

排查

图片图片O4l28资讯网——每日最新资讯28at.com

结果

最终结果是三分之一的直播录制视频完全丢失,其它的录制视频都是不完整,也就是说只录制了前半部分,后半部分是没有的。O4l28资讯网——每日最新资讯28at.com

赔付

PS:由于业务影响较大,所以除了代金券赔付,还有额外的现金赔付,现金数额㊙️㊙️O4l28资讯网——每日最新资讯28at.com

赔偿短信

【阿里云】尊敬的xxx:您好,非常抱歉阿里云11月12日发生的产品故障对您产生的影响。根据阿里云向您承诺的《服务等级协议》,本次您的SLA赔偿金总额应为227.24元,我们将为您实际发放总额227.24元。您可前往控制台-“SLA赔偿”查看并领取。如您有任何疑问,欢迎联系您的商务经理、拨打400-80-13260转9、或提交工单联系我们。我们再次诚挚地为此次故障道歉。O4l28资讯网——每日最新资讯28at.com

补偿发放通知

图片图片O4l28资讯网——每日最新资讯28at.com

SLA赔付

图片图片O4l28资讯网——每日最新资讯28at.com

故障报告

影响范围
  1. OSS、OTS、SLS、MNS 等产品的部分服务受到影响,大部分产品如 ECS、RDS、网络等运行不受影响。
  2. 云产品控制台、管控 API 等功能受到影响
时间

北京时间 2023 年 11 月 12 日 17:39-19:20O4l28资讯网——每日最新资讯28at.com

问题概况

北京时间 2023 年 11 月 12 日 17:39 起,阿里云云产品控制台访问及管控 API调用出现异常、部分云产品服务访问异常,工程师排查故障原因与访问密钥服务(AK)异常有关。工程师修订白名单版本后,采取分批重启 AK 服务的措施,于 18:35 开始陆续恢复,19:20 绝大部分 Region 产品控制台和管控API 恢复。O4l28资讯网——每日最新资讯28at.com

处理过程

2023 年 11 月 12 日O4l28资讯网——每日最新资讯28at.com

17:39 阿里云云产品控制台访问及管控 API 调用出现异常。O4l28资讯网——每日最新资讯28at.com

17:50 工程师确认故障是 AK 服务异常导致,影响云产品控制台、管控 API 调 用异常,以及依赖 AK 服务的云产品服务运行异常。O4l28资讯网——每日最新资讯28at.com

18:01 工程师定位到根因。O4l28资讯网——每日最新资讯28at.com

18:07 开始执行恢复措施,包括修订白名单版本、重启 AK 服务。O4l28资讯网——每日最新资讯28at.com

18:35 杭州等 Region 开始恢复正常。O4l28资讯网——每日最新资讯28at.com

19:20 绝大部分 Region 的云产品控制台和管控 API 调用恢复正常。O4l28资讯网——每日最新资讯28at.com

原因

访问密钥服务(AK)在读取白名单数据时出现读取异常,因处理读取异常的代码存在逻辑缺陷,生成了一份不完整白名单,导致不在此白名单中的有效请求失败,影响云产品控制台及管控 API 服务出现异常,同时部分依赖 AK 服务的产品因不完整的白名单出现部分服务运行异常。O4l28资讯网——每日最新资讯28at.com

改进措施

1、增加 AK 服务白名单生成结果的校验及告警拦截能力。O4l28资讯网——每日最新资讯28at.com

2、增加 AK 服务白名单更新的灰度验证逻辑,提前发现异常。O4l28资讯网——每日最新资讯28at.com

3、增加 AK 服务白名单的快速恢复能力。O4l28资讯网——每日最新资讯28at.com

4、加强云产品侧的联动恢复能力。O4l28资讯网——每日最新资讯28at.com

总结

尽管阿里云在此次事故后进行了赔偿,但仍然引起了一些质疑。有些人认为这是阿里云裁员的结果,说了这么多,好像我们自己搭建机房不出问题似的,如同360老总说的一样死海效应,做实事的往往会最先离职,都蒸发了,最后留下的都是混日子的老油条,包括管理层也一样。O4l28资讯网——每日最新资讯28at.com

对于企业而言,多平台灾备是非常必要的。尽管阿里云在此次事故中表现出了较强的处理能力和平台安全能力,但仍然需要考虑到其他云服务提供商的可用性。企业需要制定灾备计划并保持与多个云服务提供商的合作,以确保在出现类似问题时能够快速响应并减少损失。O4l28资讯网——每日最新资讯28at.com

总之,这件事情给我们提醒,任何服务都有可能出现问题。关键在于企业如何管理和应对这些问题。通过制定灾备计划并与多个云服务提供商合作,企业可以更好地应对类似的问题并确保业务的连续性。O4l28资讯网——每日最新资讯28at.com

O4l28资讯网——每日最新资讯28at.com

本文链接:http://www.28at.com/showinfo-26-35332-0.html阿里云史诗级故障赔偿拿到了!但是业务也是影响的一片狼藉

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: 优化Spring Boot中HttpServletRequest参数处理的实用工具类

下一篇: Python GUI 新手入门教程:轻松构建图形用户界面

标签:
  • 热门焦点
  • Mate60手机壳曝光 致敬自己的经典设计

    8月3日消息,今天下午博主数码闲聊站带来了华为Mate60的第三方手机壳图,可以让我们在真机发布之前看看这款华为全新旗舰的大致轮廓。从曝光的图片看,Mate 60背后摄像头面积依然
  • 8月总票房已突破10亿!《封神》第一:口碑已经成了

    8月5日消息,据灯塔专业版数据,截至8月5日9时35分,8月总票房(含预售)已突破10亿。其中,《封神》以大比分的优势领先。根据官方消息,目前该片总票房已经超过14.
  • 三言两语说透柯里化和反柯里化

    JavaScript中的柯里化(Currying)和反柯里化(Uncurrying)是两种很有用的技术,可以帮助我们写出更加优雅、泛用的函数。本文将首先介绍柯里化和反柯里化的概念、实现原理和应用
  • 如何使用JavaScript创建一只图像放大镜?

    译者 | 布加迪审校 | 重楼如果您曾经浏览过购物网站,可能遇到过图像放大功能。它可以让您放大图像的特定区域,以便浏览。结合这个小小的重要功能可以大大改善您网站的用户体验
  • 自律,给不了Keep自由!

    来源 | 互联网品牌官作者 | 李大为编排 | 又耳 审核 | 谷晓辉自律能不能给用户自由暂时不好说,但大概率不能给Keep自由。近日,全球最大的在线健身平台Keep正式登陆港交所,努力
  • 当家的盒马,加速谋生

    来源 | 价值星球Planet作者 | 归去来自己“当家”的盒马,开始加速谋生了。据盒马官微消息,盒马计划今年开放生鲜供应链,将其生鲜商品送往食堂。目前,盒马在上海已经与
  • 东方甄选单飞:有些鸟注定是关不住的

    文/彭宽鸿编辑/罗卿东方甄选创始人俞敏洪带队的“7天甘肃行”直播活动已在近日顺利收官。成立后一年多时间里,东方甄选要脱离抖音自立门户的传闻不绝于耳,“7
  • iQOO 11S评测:行业唯一的200W标准版旗舰

    【Techweb评测】去年底,iQOO推出了“电竞旗舰”iQOO 11系列,作为一款性能强机,该机不仅全球首发2K 144Hz E6全感屏,搭载了第二代骁龙8平台及144Hz电竞
  • 电博会与软博会实现"线下+云端"的双线融合

    在本次“电博会”与“软博会”双展会利好条件的加持下,既可以发挥展会拉动人流、信息流、资金流实现快速交互流动的作用,继而推动区域经济良性发展;又可以聚
Top