带你读《弹性计算技术指导及场景应用》——1. 单实例上运行Linux桌面多开解决方案(2)

本文涉及的产品
云服务器 ECS,每月免费额度200元 3个月
云服务器ECS,u1 2核4GB 1个月
简介: 带你读《弹性计算技术指导及场景应用》——1. 单实例上运行Linux桌面多开解决方案(2)

带你读《弹性计算技术指导及场景应用》——1. 单实例上运行Linux桌面多开解决方案(1):/article/1423692


使用EGL Backend

使用EGL Backend时,Host上不用安装Xorgxfce4x11vnc等组件,只需要安装NVIDIA驱动,创建容器时,也不用将X11unix socket目录(/tmp/.X11-unix)映射给容器访问。

Host安装与设置

Host上安装与配置步骤如下:

?        安装NVIDIA驱动;

?        安装nvidia-docker2

?        下载NVIDIA官方docker镜像(比如nvidia/cuda:14.3-base-ubuntu18.04);

?        启动容器(启动时,不需要将/tmp/.X11-unix映射到容器中);?

容器安装与设置

容器中安装与配置步骤如下:

?        安装桌面环境(本文安装xfce4);

?        VirtualGL官方网站下载VirtualGLTurboVNC安装包进行安装;

?        配置VirtualGL/opt/VirtualGL/bin/vglserver_config -config +s +f +t

?        安装NVIDIA用户态驱动(容器中安装驱动时,不要安装内核态驱动),命令示例:./NVIDIA-Linux-x86_64-470.80run -a -q --ui=none --no-kernel-module

?        启动运行TurboVNC

export TVNC_VGLRUN="vglrun -d egl0 +wm"

/opt/TurboVNC/bin/vncserver -wm xfce -vgl -geometry 1920x1080 -depth 24

其中egl0表示第一个GPU;?

性能测试

glmark2测试结果

分别在Host上和Container中,使用glmark2软件,设置不同的2D X ServerDISPLAY环境变量)以及不同的Backendvglrun命令的-d参数),测试跑分,结果如下表所示。?

编号

测试

位置

Xfce4

Backend

使用VirtualGL

测试命令

画面

输出

GPU

使用率

glmark2

CPU使用率

Host Xorg

CPU使用率

Xvnc CPU

使用率

glmark2

得分

1

Host

/

DISPLAY=:0 glmark2

Host(:0)

100%

100%

400%

0.00%

11350

2

Host

GLX

DISPLAY=:0 vglrun -d :0 glmark2

Host(:0)

79%

45%

900%

0.00%

849

3

Host

GLX

DISPLAY=:1 vglrun -d :0 glmark2

Host(:1)

39%

105%

4.00%

67.00%

2086

4

Host

GLX

DISPLAY=:0 vglrun -d egl glmark2

Host(:0)

83%

53%

98.00%

0.00%

902

5

Host

GLX

DISPLAY=:1 vglrun -d egl glmark2

Host(:1)

39%

107%

0.00%

64.00%

1851

6

Host

EGL

DISPLAY=:0 vglrun -d :0 glmark2

Host(:0)

81%

46%

900%

0.00%

842

7

Host

EGL

DISPLAY=:1 vglrun -d :0 glmark2

Host(:1)

39%

104%

4.00%

69.00%

2041

8

Host

EGL

DISPLAY=:0 vglrun -d egl glmark2

Host(:0)

82%

53%

98.00%

0.00%

899

9

Host

EGL

DISPLAY=:1 vglrun -d egl glmark2

Host(:1)

39%

105%

0.00%

66.00%

1844

10

Container

/

DISPLAY=:0 glmark2

Host(:0)

100%

100%

47.00%

0.00%

11204

11

Container

GLX

DISPLAY=:0 vglrun -d :0 glmark2

Host(:0)

89%

60%

100%

0%

962

12

Container

GLX

DISPLAY=:1 vglrun -d :0 glmark2

Container(:1)

39%

105%

4%

68%

2052

13

Container

GLX

DISPLAY=:0 vglrun -d egl glmark2

Host(:0)

89%

92%

99%

0%

1522

14

Container

GLX

DISPLAY=:1 vglrun -d egl glmark2

Container(:1)

39%

106%

0%

62%

1862

15

Container

EGL

DISPLAY=:0 vglrun -d :0 glmark2

Host(:0)

89%

61%

98%

0%

951

16

Container

EGL

DISPLAY=:1 vglrun -d :0 glmark2

Container(:1)

39%

105%

4%

64%

2012

17

Container

EGL

DISPLAY=:0 vglrun -d egl glmark2

Host(:0)

89%

92%

99%

0%

1519

18

Container

EGL

DISPLAY=:1 vglrun -d egl glmark2

Container(:1)

39%

106%

0%

64%

1837

?

GpuTest测试结果?

编号

测试位置

Xfce4 Backend

使用VirtualGL

测试命令

画面输出

GPU总使用率

GpuTest CPU使用率

Host Xorg CPU使用率

Xvnc CPU使用率

得分

FPS

19

Host

/

DISPLAY=:0 ./GpuTest /test=gi /width=1600 /height=900 /benchmark

Host(:0)

100.00%

100.00%

88.00%

0.00%

15730

262

20

Host

/

DISPLAY=:0 ./GpuTest /test=gi /width=1600 /height=900 /benchmark

Host(:0)

100.00%

100.00%

86.10%

0.00%

15540

259

21

Host

/

DISPLAY=:0 ./GpuTest /test=gi /width=1600 /height=900 /benchmark

Host(:0)

100.00%

100.00%

87.10%

0.00%

15230

253

22

Container

GLX

DISPLAY=:1 vglrun -d egl ./GpuTest /test=gi /width=1600 /height=900 /benchmark

Container(:1)

800%

96.00%

0.00%

280%

14816

246

23

Container

GLX

DISPLAY=:1 vglrun -d egl ./GpuTest /test=gi /width=1600 /height=900 /benchmark

Container(:1)

800%

97.00%

0.00%

280%

14838

247

24

Container

GLX

DISPLAY=:1 vglrun -d egl ./GpuTest /test=gi /width=1600 /height=900 /benchmark

Container(:1)

79.00%

97.00%

0.00%

200%

14788

246

25

Container

EGL

DISPLAY=:1 vglrun -d egl ./GpuTest /test=gi /width=1600 /height=900 /benchmark

Container(:1)

80.00%

97.00%

0.00%

200%

14814

246

26

Container

EGL

DISPLAY=:1 vglrun -d egl ./GpuTest /test=gi /width=1600 /height=900 /benchmark

Container(:1)

78.00%

97.00%

0.00%

200%

14828

247

27

Container

EGL

DISPLAY=:1 vglrun -d egl ./GpuTest /test=gi /width=1600 /height=900 /benchmark

Container(:1)

79.00%

100.00%

0.00%

20.80%

14819

246

28

Container

EGL

DISPLAY=:1 vglrun -d :0 ./GpuTest /test=gi /width=1600 /height=900 /benchmark

Container(:1)

78.00%

99.00%

0.00%

24.80%

14739

245

29

Container

EGL

DISPLAY=:1 vglrun -d :0 ./GpuTest /test=gi /width=1600 /height=900 /benchmark

Container(:1)

77.00%

100.00%

0.00%

280%

14699

244

30

Container

EGL

DISPLAY=:1 vglrun -d :0 ./GpuTest /test=gi /width=1600 /height=900 /benchmark

Container(:1)

79.00%

100.00%

0.00%

24.80%

14625

243

测试结果示例:

image.png

GravityMark测试结果

编号

测试位置

Xfce4 Backend

使用VirtualGL

API

Asteroids

GPU

使用率

GravityMark

CPU使用率

Xorg CPU

使用率

Xvnc CPU

使用率

得分

FPS

每帧时间(ms)

31

Host

/

Vulkan

1000000

98.0%

0%

48.0%

0.0%

10408

63

16.051

32

Host

/

Vulkan

200000

90%

7.0%

36.0%

0.0%

29705

177.9

5.621

33

Host

/

OpenGL

1000000

100.0%

100.0%

28.7%

0.0%

2963

17.7

56.497

34

Host

/

OpenGL

200000

100.0%

94.1%

68.3%

0.0%

19659

117.7

8.496

35

Container

EGL

Vulkan

1000000

87.0%

97.0%

0%

19.8%

10217

62

16.340

36

Container

EGL

Vulkan

200000

70%

90%

0%

29.7%

24312

145.6

6.868

37

Container

EGL

OpenGL

1000000

99.0%

100.0%

0%

10.0%

3046

18.2

54.945

38

Container

EGL

OpenGL

200000

90%

100%

20.8%

19.8%

18659

117

8.953

 

 

GravityMark的其他设置如下:

?        Render: Default

?        Antialiasing: Default(Temporal)

?        Resolution: 1600x900

?        LOD Bias: Default?

测试结果示例:

image.png

测试结果分析及结论

以下分别针对OpenGLVulkan测试结果进行分析。

OpenGL性能

1)     使用TurboVNC比使用Xorg作为2D X Server性能更好

测试2对比34对比56对比78对比911对比1213对比1415对比1617对比18,可以得出结论,VirtualGL将画面输出到TurboVNC相比输出到Host上的Xorg,性能显著更好,GPU占用率也更低,这是得益于TurboVNC的优化;

2)     使用TurboVNC作为2D X Server时,EGL BackendGLX Backend的性能差距非常小

测试252627对比测试282930显示,使用TurboVNC作为2D X Server时,EGL BackendGLX Backend性能差距非常小,约为2%以内;

3)     TurboVNC启动Xfce4时使用的Backend对性能几乎没有影响

测试3对比75对比912对比1614对比18,可以得出结论,TurboVNC启动Xfce4时使用的Backend(即TVNC_VGLRUN环境变量设置的Backend)对性能几乎没有影响;

4)     GPU测试软件测试过程中帧率非常高时,VirtualGL给测试软件带来的结果波动很大;当帧率接近实际使用场景时,VirtualGL带来的损耗非常小;

测试110对比其他测试,可以看到,使用VirtualGL时,最好的性能也只有不使用VirtualGL时的18%,对于这个性能损耗,VirtualGL作者在Github Issues(Performance loose?Slow performance without ssh (same machine))中有解释,glmark2测试显示的性能损耗主要来自于VirtualGL引入的framebuffer read backglxgearsglmark2GPU测试软件的主要原理是,渲染大量的三角形,并测试GPU的极限渲染帧率,而VirtualGL需要在应用程序完成一帧渲染的时候,回读framebuffer,并(通过TurboVNC)传输给客户端显示,因此导致了极限帧率的巨大下降。glmark2测试过程中的部分日志如下:

Host上直接运行glmark2时:

root@aliyun:/etc/X11# glmark2
=======================================================
glmark2 2014.03+git2015061fa71af2d
=======================================================
OpenGL Information
GL_VENDOR: NVIDIA Corporation
GL_RENDERER: NVIDIA A10/PCIe/SSE2
GL_VERSION: 4.6.0 NVIDIA 470.801
=======================================================
[build] use-vbo=false: FPS: 9187 FrameTime: 0.109 ms
=======================================================
glmark2 Score: 11350 
=======================================================

Container中通过VirtualGL运行glmark2时:

root@desktop2-glx:/home# DISPLAY=:1 vglrun -d egl0 glmark2
=======================================================
glmark2 2014.03+git2015061fa71af2d
=======================================================
OpenGL Information
GL_VENDOR: NVIDIA Corporation
GL_RENDERER: NVIDIA A10/PCIe/SSE2
GL_VERSION: 4.6.0 NVIDIA 470.801
=======================================================
[build] use-vbo=false: FPS: 1442 FrameTime: 0.693 ms
=======================================================
glmark2 Score: 1837 
=======================================================

可以看到,VirtualGL导致每帧的时间从0.109ms增加到了0.693ms,因此引起了结果的巨大降低,但是,增加的时间对普通应用来说,是微不足道的,普通应用的刷新率通常为60Hz,每帧时间的最大值可以达到16.67msVirtualGL增加的这部分时间(0.584ms)相对于16.67ms是非常小的。

测试38对比34,可以看到,在FPS110左右时,VirtualGL带来的损耗约为5%(1-117/117.7);测试37对比33,可以看到,当帧率非常低时,VirtualGL带来的性能损耗被淹没在帧率本身的波动中了,甚至出现了使用VirtualGL比不使用VirtualGL性能更好的情况;?

Vulkan性能

测试35对比31显示,当FPS60左右时,VirtualGL带来的Vulkan性能损耗在2%以内(1-62/63);测试36对比32显示,在FPS150左右时,VirtualGL带来的Vulkan性能损耗约为18%(1-145.6/177.9)

总体结论:

Multiseat方案配置复杂,受硬件限制较大,不适合作为产品方案。?

XephyrXpra方案由于没有GPU加速,也不适合作为产品方案。?

使用VirtualGL方案,可以很好地在阿里云异构实例上实现Linux桌面多开,多开的桌面之间互不影响,多个用户可分别使用VNC客户端连接自己的桌面运行业务软件。VirtualGL会给渲染的每一帧增加耗时,但是,在通常使用场景(刷新率60Hz)下,VirtualGL带来的OpenGLVulkan开销均在5%以内。?

VirtualGL使用EGL Backend时,还可以不依赖于X11 ServerHost上只需要安装显卡驱动,无需额外软件,部署非常方便。?

此外需要注意的是,由于TurboVNC在启动的时候设置了独立的dbus session并自动拉起了启动桌面环境,虽然本文是在一个容器中启动一个桌面,并不意味着桌面和容器是一一对应的,用户如果对桌面以及业务软件之间的安全隔离性没有要求,完全可以在一个容器中,或者直接在Host环境上,多次运行以下命令来    开启多个独立的xfce桌面:

export TVNC_VGLRUN="vglrun -d egl0 +wm" /opt/TurboVNC/bin/vncserver -wm xfce -vgl -geometry 1920x1080 -depth 24?

Linux桌面多开最佳实践

Linux桌面多开最佳方案为VirtualGL方案(配合使用TurboVNC)。?

对于VirtualGL方案,由于使用GLX Backend需要将HostX11 socket目录(/tmp/.X11-unix)映射到容器中,多个容器同时使用时,有潜在的冲突风险和安全风险,因此,建议参考5.2使用EGL BackendHost上只需要安装NVIDIA驱动,相关设置都在容器中,方便备份和迁移。?

如果用户业务软件在渲染时,不需要实时显示,软件会将最终结果输出到文件,那么,可以在运行软件的时候设置"VGL_READBACK=none"以获得最好的性能,命令示例:

DISPLAY=:1 VGL_READBACK=none vglrun -d egl0 glmark2

设置"VGL_READBACK=none"后,应用软件的窗口是黑屏,VirtualGLframebuffer read back引入的性能影响将会被消除。

相关实践学习
基于阿里云DeepGPU实例,用AI画唯美国风少女
本实验基于阿里云DeepGPU实例,使用aiacctorch加速stable-diffusion-webui,用AI画唯美国风少女,可提升性能至高至原性能的2.6倍。
相关文章
|
5天前
|
Web App开发 存储 Linux
Linux(33)Rockchip RK3568 Ubuntu22.04上通过SSH运行Qt程序和关闭Chrome的密钥提示
Linux(33)Rockchip RK3568 Ubuntu22.04上通过SSH运行Qt程序和关闭Chrome的密钥提示
66 0
|
5天前
|
Linux 开发工具 C语言
Linux 安装 gcc 编译运行 C程序
Linux 安装 gcc 编译运行 C程序
36 0
|
5天前
|
监控 安全 Linux
【专栏】Linux中六个常用的网络命令:ping、traceroute、netstat、nmap、ifconfig和ip
【4月更文挑战第28天】本文介绍了Linux中六个常用的网络命令:ping、traceroute、netstat、nmap、ifconfig和ip,以及它们在测试网络连通性、追踪路由、查看网络状态、安全扫描和接口配置等场景的应用。通过学习和运用这些命令,系统管理员和网络爱好者能更有效地诊断和管理网络问题,确保网络稳定运行。
|
5天前
|
机器学习/深度学习 自然语言处理 Linux
【专栏】Linux 中的机器学习:Whisper适用于语音助手、翻译等领域,随着技术发展,其应用前景广阔
【4月更文挑战第28天】本文探讨了在Linux环境下,先进自动语音识别系统Whisper的运用与实现高效ASR。Whisper基于PyTorch,支持多语言识别,具有高准确性和实时性。文中介绍了安装配置Whisper的步骤,包括安装依赖、下载代码、配置环境变量及编译安装。通过数据准备、模型训练和识别,可实现语音识别功能。Whisper适用于语音助手、翻译等领域,随着技术发展,其应用前景广阔。
|
5天前
|
监控 Linux 数据处理
|
5天前
|
Linux 编译器 调度
xenomai内核解析--双核系统调用(二)--应用如何区分xenomai/linux系统调用或服务
本文介绍了如何将POSIX应用程序编译为在Xenomai实时内核上运行的程序。
31 1
xenomai内核解析--双核系统调用(二)--应用如何区分xenomai/linux系统调用或服务
|
5天前
|
消息中间件 存储 Linux
linux实时应用如何printf输出不影响实时性?
本文探讨了Linux实时任务中为何不能直接使用`printf(3)`,并介绍了实现不影响实时性的解决方案。实时任务的执行时间必须确定且短,但`printf(3)`的延迟取决于多个因素,包括用户态glibc缓冲、内核态TTY驱动和硬件。为确保实时性,通常将非实时IO操作交给低优先级任务处理,通过实时进程间通信传递信息。然而,即使这样,`printf(3)`在glibc中的实现仍可能导致高优先级任务阻塞。Xenomai 3提供了一个实时的`printf()`实现,通过libcobalt库在应用编译链接时自动处理,预分配内存,使用共享内存和线程特有数据来提高效率和实时性。
24 0
linux实时应用如何printf输出不影响实时性?
|
5天前
|
安全 Linux Shell
Linux常用命令详解与实战应用
【5月更文挑战第7天】本文详述了Linux常用命令,包括文件与目录操作(ls, cd, pwd, cp, mv, rm)、文本处理(cat, grep, sed)及系统管理(top, df, du)命令。通过实例演示了如何使用这些命令,帮助读者理解和掌握Linux操作,提升系统管理效率。学习和熟练运用这些基础命令,是高效使用Linux的关键。
|
5天前
|
Linux Shell 程序员
【Linux】权限(shell运行原理、概念,Linux权限)
【Linux】权限(shell运行原理、概念,Linux权限)
17 2
|
5天前
|
监控 Linux Shell
http://www.vxiaotou.com