备案控制台

开发者社区云原生文章正文

基于阿里云 ACK 搭建开源向量数据库 Milvus

2023-06-07 2991

版权

版权声明：

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 生成式 AI（Generative AI）引爆了向量数据库（Vector Database）市场，基于大模型的各种应用场景会需要使用到向量数据库。其中，Milvus 是一个高度灵活、可靠且速度极快的云原生开源向量数据库。它为 embedding 相似性搜索和 AI 应用程序提供支持，并努力使每个组织都可以访问向量数据库。 Milvus 可以存储、索引和管理由深度神经网络和其他机器学习（ML）模型生成的十亿级别以上的 embedding 向量。本文介绍在阿里云ACK上部署Milvus并且通过attu访问的步骤。

一、准备资源

可先参考 Environment Checklist for Milvus Milvus on Kubernetes 在云上购买和配置相关的资源。

本人购买的云资源是：

ACK托管版

K8S版本 1.24.6-aliyun.1

3台 32vCPU 128GB ecs.g6.8xlarge

MAC电脑客户端（已安装kubectl工具）

二、集群创建：

登陆ACK控制台：https://cs.console.aliyun.com/?spm=5176.181001.J_5253785160.4.38a84e26LzhVIl#/k8s/cluster/list

本集群基于Terway网络构建

为了便于集群访问公网，以及公网访问集群API Server，集群开通时候默认勾选了SNAT和Eip暴露公网api server

集群Worker节点按照实际需求选用规格配比,本次选用g6实例，配置essd云盘

由于，前置步骤为集群开启了SNAT，本次不针对每个Worker开启公网地址，如果额外有需求要每个worker绑定公网IP，可以这里开启，或者后续单独给每台worker绑定eip

后置步骤，按照默认开通集群。

二、连接刚刚创建的ACK集群

选用MAC电脑安装kubectl工具(参考安装指导)

https://kubernetes.io/docs/tasks/tools/install-kubectl-macos/

安装完毕后，创建$HOME/.kube目录下的config

进去刚刚创建好的集群，粘贴公网访问凭证到config中，也可以生成临时的凭证

上述操作完毕后，

kubectl get namespace

测试连通性

详细的操作指导同样可以参考官网链接：

https://help.aliyun.com/document_detail/86494.html?spm=a2c4g.86737.0.0.7ba65143wCxNEb

集群创建完毕后，为了后面部署Milvus，创建一个存储类，并且设置为默认，供后面Milvus的各组件可以自动创建存储卷

集群进入存储-存储类-创建

存储类型选用了cloud_essd类型云盘，额外新增了zoneId，设置存储所在区域和worker节点在同一个可用区

设置上面创建的存储类为默认的存储类

kubectl patch storageclass milvus-beijing -p '{"metadata": {"annotations":{"storageclass.kubernetes.io/is-default-class":"true"}}}'

其中，红框部分替换为自己创建的存储类的名称

通过，可以看到设置的存储类已经标识为default

kubectl get sc

三、部署Milvus数据库

本次部署，需要helm部署方式，详细的可以参考官网文档

https://milvus.io/docs/install_cluster-helm.md

首先，添加 Milvus Helm 仓库并更新。

helm repo add milvus https://milvus-io.github.io/milvus-helm/

helm repo update

因为我之前部署过，所以这里显示已经存在

安装Milvus 和Attu

helm install my-release milvus/milvus --set attu.enabled=true

安装完毕后显示如下：

验证下pod的拉起情况，发现etcd的状态是pending状态，不正常，原因是官方设置etcd的PVC总量是10G，而阿里云essd，需要至少20G才能初始化

kubectl get pods

删掉重建，设置存储容量大于等于20G

再根据kubectl get pods刷新，发现所有的Pod都是runnng状态了，两个job类型的pod是completed状态；也可以在控制台的负载界面观察pod的情况（工作负载-有状态，工作负载-无状态）

四、优化Milvus配置

为了可以公网访问attu工具，需要将attu工具开通公网，控制台登陆集群后，网络-服务，找到my-release-milvus-attu服务

更新服务的类型由虚拟集群ip为节点负载均衡（公网）

更新完毕后，会新增外部端点访问，可以通过浏览器访问attu的登陆界面

如果需要公网访问集群，也可以通过上述方法，将Milvus更新公网端口

如果针对不同的数据量，可以使用Milvus Sizing Tool去计算Milvus各组件建议的资源配比；通过milvus_resources.yaml 刷新集群组件资源配置

https://milvus.io/tools/sizing/

文章标签：

容器服务Kubernetes版

云原生数据仓库 AnalyticDB PostgreSQL版

Perl

容器

Cloud Native

机器学习/深度学习

人工智能

负载均衡

Kubernetes

API

数据库

存储

关键词：

阿里云数据库

容器服务Kubernetes版阿里云

阿里云ack

开源数据库

云原生数据仓库 AnalyticDB PostgreSQL版milvus

相关实践学习

容器服务Serverless版ACK Serverless 快速入门：在线魔方应用部署和监控

通过本实验，您将了解到容器服务Serverless版ACK Serverless 的基本产品能力，即可以实现快速部署一个在线魔方应用，并借助阿里云容器服务成熟的产品生态，实现在线应用的企业级监控，提升应用稳定性。

云原生实践公开课

课程大纲开篇：如何学习并实践云原生技术基础篇： 5 步上手 Kubernetes 进阶篇：生产环境下的 K8s 实践相关的阿里云产品：容器服务 ACK 容器服务 Kubernetes 版（简称 ACK）提供高性能可伸缩的容器应用管理能力，支持企业级容器化应用的全生命周期管理。整合阿里云虚拟化、存储、网络和安全能力，打造云端最佳容器化应用运行环境。了解产品详情: https://www.aliyun.com/product/kubernetes

lbnvxrxk642ts

目录

相关文章

阿里云瑶池数据库SelectDB

|

3天前

|

SQL 存储调度

从 Volcano 火山模型到 Pipeline 执行模型，阿里云数据库 SelectDB 内核 Apache Doris 执行模型的迭代

一个合适的执行模型对于提高查询效率和系统性能至关重要。本文全面剖析 Apache Doris Pipeline 执行模型的设计与改造历程，并在 2.1 版本对并发执行模式与调度模式进一步优化，解决了执行并发受限、执行及调度开销大等问题。

阿里云瑶池数据库SelectDB

163 0 0

从 Volcano 火山模型到 Pipeline 执行模型，阿里云数据库 SelectDB 内核 Apache Doris 执行模型的迭代

云浠Cherry

|

5天前

|

监控 Cloud Native 大数据

即刻预约｜阿里云数据库 SelectDB 版商业化发布会，5月21日14:00与您相约

2024年5月2日14:00，阿里云数据库 SelectDB 版商业化产品发布会将于线上重磅举行，即刻开启预约！? 直播地址：/special/selectdb?utm_content=g_1000393528

云浠Cherry

220 0 1

即刻预约｜阿里云数据库 SelectDB 版商业化发布会，5月21日14:00与您相约

向量检索Milvus版

|

5天前

|

弹性计算自然语言处理开发工具

基于阿里云向量检索 Milvus 版和 LangChain 快速构建 LLM 问答系统

本文介绍如何通过整合阿里云Milvus、阿里云DashScope Embedding模型与阿里云PAI（EAS）模型服务，构建一个由LLM（大型语言模型）驱动的问题解答应用，并着重演示了如何搭建基于这些技术的RAG对话系统。

向量检索Milvus版

158 0 0

阿里云瑶池数据库

|

2天前

|

Cloud Native 关系型数据库分布式数据库

祝贺！阿里云PolarDB斩获数据库国际顶会ICDE 2024工业赛道最佳论文

阿里云斩获国际顶会ICDE 2024最佳论文，0.5秒实现数据库跨机实例迁移。

阿里云瑶池数据库

75 5 5

祝贺！阿里云PolarDB斩获数据库国际顶会ICDE 2024工业赛道最佳论文

vohelon

|

5天前

|

Cloud Native 关系型数据库分布式数据库

PolarDB是阿里云自主研发的关系型云原生数据库

【5月更文挑战第14天】PolarDB是阿里云自主研发的关系型云原生数据库

vohelon

44 3 3

hdy_coming

|

5天前

|

SQL 关系型数据库 Serverless

阿里云关系型数据库RDS

阿里云关系型数据库RDS

hdy_coming

18 2 2

小殊小殊

|

5天前

|

算法数据库 Docker

大模型必备向量数据库-Milvus的安装过程

大模型必备向量数据库-Milvus的安装过程

小殊小殊

14 0 0

DBdoctor官方

|

5天前

|

Cloud Native 关系型数据库分布式数据库

数据库性能诊断工具DBdoctor通过阿里云PolarDB产品生态集成认证

DBdoctor（V3.1.0）成功通过阿里云PolarDB分布式版（V2.3）集成认证，展现优秀兼容性和稳定性。此工具是聚好看科技的内核级数据库性能诊断产品，运用eBPF技术诊断SQL执行，提供智能巡检、根因分析和优化建议。最新版V3.1.1增加了对PolarDB-X和OceanBase的支持，以及基于cost的索引诊断功能。PolarDB-X是阿里巴巴的高性能云原生分布式数据库，兼容MySQL生态。用户可通过提供的下载地址、在线试用链接和部署指南体验DBdoctor。

DBdoctor官方

153 0 0

一歲抬頭

|

5天前

|

Shell Android开发

Android系统 adb shell push/pull 禁止特定文件

Android系统 adb shell push/pull 禁止特定文件

一歲抬頭

34 1 1

kind-tester

|

5天前

|

Android开发 Python

Python封装ADB获取Android设备wifi地址的方法

Python封装ADB获取Android设备wifi地址的方法

kind-tester

64 0 0

热门文章

最新文章

Python与NoSQL数据库（MongoDB、Redis等）面试问答

Druid数据库连接池简介及应用推广(老项目翻出来做下记录)

Centos7安装mariadb数据库

MySQL环境搭建——“MySQL数据库”

数据库库表结构设计：原理、实例与最佳实践

关系型数据库ALTER语句

寻找最懂数据库的你，开启云端推广事业！丰厚收益，轻松赚取！

MySQL数据库优化技巧：提升性能的关键策略

Python与MySQL数据库交互：面试实战

关系型数据库删除数据

阿里云神龙架构的背景

阿里云数据库使用方法，从购买、创建数据库账号密码到连接数据库全流程

阿里云第八代云服务器实例通用型g8i实例性能和适用场景介绍

【产品动态】阿里云弹性计算产品月刊-2024年2月

倚天产品介绍|阿里云核心产品—倚天710

阿里云BssOpenAPI是一个基于阿里云开放API的服务

阿里云CDN HTTPS 证书配置流程

DataWorks常见问题之添加阿里云selectdb失败如何解决

阿里云可观测 2024 年 2 月产品动态

阿里云服务器ESSD云盘性能等级PL0、PL1、PL2、PL3区别，云盘性能级别PL知识点参考

相关课程

更多

跟阿里云技术专家学习智能推荐系统

阿里云负载均衡SLB实战演练

云原生基础概念及阿里云云原生产品介绍

阿里云图数据库GDB入门与应用

企业上云攻略-阿里云网络产品应用系列教程

阿里云物联网平台专题介绍

相关电子书

更多

阿里云云原生 Serverless 技术实践营 PPT 演讲

阿里云产品十月刊

基于阿里云构建博学谷平台实时湖仓

相关实验场景

更多

使用阿里云ECS监控您的特斯拉

使用阿里云ECS安装家用内网穿透服务

在阿里云百炼大模型中快速创建企业知识应用

使用阿里云ECS搭建一套网页IDE

使用阿里云ECS搭建自己的持续集成服务

阿里云百炼xAnalyticDB PostgreSQL构建AIGC应用

推荐镜像

更多

kubernetes

pouch

terraform

下一篇

2024年阿里云免费云服务器及学生云服务器申请教程参考