开发者社区 > 云原生 > 微服务 > 正文

阿里云某个集群启动arthas总失败,其他集群都是正常的,启动失败没有任何输出,有大概的排查方向吗?

阿里云某个集群启动arthas总是失败,其他集群都是正常的,启动失败没有任何输出,有人能解答一下大概的排查方向吗?我不清楚为什么arthas端口连不上,我换过随便一个端口也连不上,这个是说明arthas attach失败了吗?
[root@aydraasportal-7ffb55944f-l7g5r /home/admin/logs/ayiraasportal]

sh as.sh

Arthas script version: 3.7.2
[INFO] JAVA_HOME: /opt/java/openjdk
Found existing java process, please choose one and input the serial number of the process, eg : 1. Then hit ENTER.

  • [1]: 24 /home/admin//ayiraasportal.jar

Arthas home: /root/.arthas/lib/3.7.2/arthas
Calculating attach execution time...
Attaching to 24 using version /root/.arthas/lib/3.7.2/arthas...

real 0m0.115s
user 0m0.150s
sys 0m0.026s
Attach success.
telnet connecting to arthas server... current timestamp is 1714035709
Trying 127.0.0.1...
telnet: connect to address 127.0.0.1: Connection refused

展开
收起
-Feng、冯冯 2024-05-09 08:36:13 43 0
1 条回答
写回答
取消 提交回答
  • 2000元阿里云代金券免费领取,2核4G云服务器仅664元/3年,新老用户都有优惠,立即抢购>>>

    当在阿里云集群上启动Arthas失败且没有输出时,可以按照以下步骤进行排查:

    1. 网络检查

      • 确保集群内的网络是正常的,可以尝试ping其他服务或者外部地址以检查网络连通性。
      • 检查安全组设置,确保允许Arthas默认的端口(默认是3658)或者是你指定的新端口的入站和出站通信。
    2. 系统资源检查

      • 检查服务器的内存和CPU资源,确保有足够的资源运行Arthas。
      • 确认磁盘空间是否充足,Arthas的运行可能需要一定的临时空间。
    3. Java环境

      • 确保Java环境是正确的,Java版本与Arthas兼容。
      • 检查JAVA_HOME环境变量是否已设置,并指向正确的JDK路径。
    4. Arthas版本

      • 使用最新版本的Arthas,因为旧版本可能有已知的问题。
      • 或者尝试回退到已知稳定的版本,看看是否能正常启动。
    5. 日志输出

      • Arthas在启动时应该会产生日志,尝试增加日志级别或查看系统日志(如/var/log/messages/var/log/syslog,具体位置取决于Linux发行版),寻找可能的错误信息。
      • 如果没有日志输出,可能需要手动启动Arthas并捕获标准输出和错误输出,例如:./bin/arthas-boot > arthas.log 2>&1 &
    6. 进程检查

      • 使用ps命令检查是否存在冲突的Arthas进程,有可能是之前启动的实例没有正确关闭,导致新的实例无法启动。
    7. 权限问题

      • 检查启动Arthas的用户是否有足够的权限执行相关操作。
    8. 防火墙设置

      • 如果是容器环境,检查Docker或Kubernetes的网络策略,确保容器可以访问Arthas监听的端口。
    9. Arthas配置

      • 检查Arthas的配置文件,特别是~/.arthas/lib目录下的配置,看是否有误配置。
    10. 手动attach

      • 尝试手动attach到Java进程,使用jps找到目标进程ID,然后使用./bin/arthas.sh --port [your_port] [your_pid]命令手动attach。

    如果以上步骤都无法解决问题,建议联系阿里云的技术支持,他们可能有更专业的工具和方法来诊断和解决这个问题。同时,提供尽可能详细的信息,包括集群环境、Arthas版本、Java版本以及任何可能的错误信息,这样他们能更快地定位问题。

    2024-05-09 19:24:42
    赞同 1 展开评论 打赏
问答分类:
问答地址:

为微服务建设降本增效,为微服务落地保驾护航。

相关电子书

更多
阿里云云原生 Serverless 技术实践营 PPT 演讲 立即下载
阿里云产品十月刊 立即下载
基于阿里云构建博学谷平台实时湖仓 立即下载
http://www.vxiaotou.com