OSS 可用性诊断排查

本文涉及的产品
对象存储 OSS,20GB 3个月
云服务器 ECS,每月免费额度200元 3个月
云服务器ECS,u1 2核4GB 1个月
简介: 本文主要介绍遇到 OSS 可用性异常的排查方法

2000元阿里云代金券免费领取,2核4G云服务器仅664元/3年,新老用户都有优惠,立即抢购>>>


阿里云采购季(云主机223元/3年)活动入口:请点击进入>>>,


阿里云学生服务器(9.5元/月)购买入口:请点击进入>>>,

尊敬的客户,

您好,阿里云对象存储OSS(Object Storage Service)是阿里云提供的海量、安全、低成本、高可靠的云存储服务。其数据设计持久性不低于99.9999999999%(12个9),服务可用性(或业务连续性)不低于99.995%。目前发现您阿里云账号下的 Bucket 出现可用性(5xx)降低的潜在风险,建议您按照如下思路检查:

  • 1、如果发现客户端侧出现 504/502/503 的场景,可以尝试 ping 延迟是否稳定、MTR 链路是否存在间接性丢包、telnet 服务端 80/443 端口是否正常通信。如果发现网络异常,需要先排除掉客户端的网络链路异常后再向下分析。
  • 2、如果发现客户端侧出现 500 的场景并且复现频率较高,可以先通过 try catch 机制捕获到异常后合理进行重试,记录下异常的 requestID 尽快反馈到阿里云售后进行分析。
  • 3、如果是 ECS 通过公网访问 OSS 出现了 5xx ,检查您的 ECS 是否有公网带宽超过限制、网卡持续跑满的情况。带宽超限后应及时扩容 ECS 带宽,避免带来业务影响。
  • 4、检查 ECS 主机的网络连接数、文件描述符的数量是否出现瓶颈,可能导致 SocketTimeOut 的问题出现。根据主机的负载情况、实例规格,合理的设置并发数量,优化业务代码。
  • 5、检查客户业务代码中初始化配置的, MaxConnections、SocketTimeout、ConnectionTimeout 参数是否合理,弱网情况下应该适当放大。
  • 6、检查客户是否配置过 OSS 镜像回源功能,保证镜像回源的站点可以正常通信,尽量不要对 OSS 回源 IP 设置防火墙策略, OSS 镜像回源采用的是公网 IP 回源,定期会进行 IP 或者 IP 段的更换,如果客户的原站设置了防火墙,可能出现 5xx 的回源超时
相关实践学习
借助OSS搭建在线教育视频课程分享网站
本教程介绍如何基于云服务器ECS和对象存储OSS,搭建一个在线教育视频课程分享网站。
目录
相关文章
|
存储 运维 监控
阿里云对象存储 OSS 发布全球第一可用性 SLA 背后的技术体系
2020年6月,阿里云对象存储 OSS 通过十年积累的技术红利,将可用性 SLA(Service Level Agreement) 提升 10 倍,做到了全球第一的核心竞争力,是其他的云厂家的 10~20 倍,如下图所示。
1329 0
阿里云对象存储 OSS 发布全球第一可用性 SLA 背后的技术体系
|
网络协议 Java 开发工具
【 OSS 排查方案-9 上传 OSS 延迟超时】
基础排查 一、 上传 OSS 出现慢的场景,OSS 会返回一个 requestID 属性,请保留这个 requestID 这是 OSS 所有信息的查询入口,升级阿里云时可以快速定位问题,如果上传超时的话时没有这个属性的。
8648 1
|
移动开发 JSON JavaScript
阿里云OSS PostObject错误及排查详细版本
PostObject使用表单上传文件到OSS。PostObject的消息实体通过 多重表单格式multipart/form-data 编码,详细说明请参看 RFC 2388。Put Object中参数通过HTTP请求头传递,Post Object参数则作为消息体的表单域传递。
1623 0
|
存储 缓存 弹性计算
OSS 限流诊断排查
本文主要介绍遇到 OSS 限流的排查方法
2351 0
|
存储 监控 算法
OSS异常流量排查及防护
OSS适用于存储各种类型的静态资源。您在OSS中存储静态资源。当OSS生成流量大的异常流量时,可能是恶意引用黑客攻击或请求访问OSS资源的恶意IP引起的。针对上述情况,本文将向您展示如何定位异常流量以及如何保护流量。
1534 0
OSS异常流量排查及防护
|
存储 运维 负载均衡
提升 10 倍!阿里云对象存储 OSS 可用性 SLA 技术揭秘
对象存储被广泛应用于互联网应用中,当我们打开手机观看视频、收听音乐、分享图片、浏览网页、淘宝购物时,背后的数据基本都是存在对象存储中。应用使用卡、打不开就和对象存储的可用性 SLA 有关,SLA 越高,应用体验越好。本文分享阿里云在对象存储 OSS(Open Storage Service) 的可用性 SLA (Service Level Agreement) 上的实践和技术沉淀。
2407 0
提升 10 倍!阿里云对象存储 OSS 可用性 SLA 技术揭秘
|
对象存储
十年沉淀,阿里云发布全球领先的对象存储OSS可用性SLA
阿里云发布全球领先的对象存储OSS可用性SLA
1091 0
十年沉淀,阿里云发布全球领先的对象存储OSS可用性SLA
|
存储 负载均衡 安全
|
API 对象存储
【OSS 排查方案-10 请求 OSS 返回 404】
什么是 404 404 标准的 http code 状态码,代表用户请求的资源在服务端不存在, 404 并不是一个异常状态码?而是一个正常的响应。换句话说 404 已经成为了一个结果,这种响应常见在 client 端下载 OSS 的资源时出现。
【OSS 排查方案-10 请求 OSS 返回 404】
|
编解码 对象存储 索引
【OSS 排查方案-12 livechannel 直播推流】
OSS livechannel 推流过程 生成推流 URL设置推流状态 录制 M3u8 缺失 默认录制成品的 m3u8 所以只有最后 3 片,遵循的是 hls 协议的默认规则,是正常想象,可以通过调用 PostVodPlaylist 接口将指定时间范围内的 ts 文件汇聚到一个 m3u8 索引内来解决; tips EndTime 必须大于 StartTime,且时间跨度不能大于 1 天。
【OSS 排查方案-12 livechannel 直播推流】
http://www.vxiaotou.com