|
7小时前
|
机器学习/深度学习 人工智能 JSON
|

LLM 大模型学习必知必会系列(二):提示词工程-Prompt Engineering 以及实战闯关

LLM 大模型学习必知必会系列(二):提示词工程-Prompt Engineering 以及实战闯关

24 0
来自: 自然语言处理  版块
|
7小时前
|
机器学习/深度学习 人工智能 自然语言处理
|

LLM 大模型学习必知必会系列(一):大模型基础知识篇

LLM 大模型学习必知必会系列(一):大模型基础知识篇

27 2
来自: 自然语言处理  版块
|
8小时前
|
物联网 Shell Swift
|

NPU推理&微调大模型实战

本文为魔搭社区轻量级训练推理工具SWIFT微调实战教程系列

33 4
|
23小时前
|
存储 人工智能 API
|

【AIGC】基于检索增强技术(RAG)构建大语言模型(LLM)应用程序

【5月更文挑战第7天】基于检索增强技术(RAG)构建大语言模型(LLM)应用程序实践

28 1
|
1天前
|
数据可视化 物联网 关系型数据库
|

幻方开源第二代MoE模型 DeepSeek-V2,魔搭社区推理、微调最佳实践教程

5月6日,幻方继1月份推出首个国产MoE模型,历时4个月,带来第二代MoE模型DeepSeek-V2,并开源了技术报告和模型权重,魔搭社区可下载体验。

63 8
|
2天前
|
存储 机器学习/深度学习 人工智能
|

RAG:AI大模型联合向量数据库和 Llama-index,助力检索增强生成技术

RAG:AI大模型联合向量数据库和 Llama-index,助力检索增强生成技术

49 8
来自: 自然语言处理  版块
|
2天前
|
自然语言处理 物联网 API
|

检索增强生成(RAG)实践:基于LlamaIndex和Qwen1.5搭建智能问答系统

检索增强生成(RAG)实践:基于LlamaIndex和Qwen1.5搭建智能问答系统

76 6
来自: 自然语言处理  版块
|
2天前
|
机器学习/深度学习 算法 物联网
|

LISA微调技术解析:比LoRA更低的显存更快的速度

LISA是Layerwise Importance Sampling for Memory-Efficient Large Language Model Fine-Tuning的简写,由UIUC联合LMFlow团队于近期提出的一项LLM微调技术,可实现把全参训练的显存使用降低到之前的三分之一左右,而使用的技术方法却是非常简单。

38 9
|
3天前
|
自然语言处理 API 开发工具
|

基于LangChain-Chatchat实现的本地知识库的问答应用-快速上手(检索增强生成(RAG)大模型)

基于LangChain-Chatchat实现的本地知识库的问答应用-快速上手(检索增强生成(RAG)大模型)

95 0
来自: 自然语言处理  版块
|
3天前
|
自然语言处理 前端开发 物联网
|

社区供稿 |【中文Llama-3】Chinese-LLaMA-Alpaca-3开源大模型项目正式发布

Chinese-LLaMA-Alpaca-3开源大模型项目正式发布,开源Llama-3-Chinese-8B(基座模型)和Llama-3-Chinese-8B-Instruct(指令/chat模型)

108 6
|
3天前
|
人工智能 文字识别 语音技术
|

学习资料大全? | 一起来魔搭社区学AI吧!

魔搭社区特别推出研习社栏目,包含AI前沿技术解读、模型应用最佳实践、动手做AI应用(AIGC/Agent/RAG)等主题,持续更新,代码实战点击即运行

80 5
|
3天前
|
人工智能 自然语言处理 文字识别
|

社区供稿 | 元象首个多模态大模型XVERSE-V开源,刷新权威大模型榜单,支持任意宽高比输入

元象公司发布了开源多模态大模型XVERSE-V,该模型在图像输入的宽高比方面具有灵活性,并在多项评测中展现出优越性能,超越了包括谷歌在内的多个知名模型。XVERSE-V采用创新方法结合全局和局部图像信息,适用于高清全景图识别、文字检测等任务,且已在Hugging Face、ModelScope和GitHub上开放下载。此外,模型在视障场景、内容创作、教育解题、百科问答和代码生成等领域有广泛应用,并在VizWiz等测试集中表现出色。元象致力于推动AI技术的普惠,支持中小企业、研究者和开发者进行研发和应用创新。

30 6
|
4天前
|
安全 Java Docker
|

spring cloud使用jar包部署和docker部署的区别

5月更文挑战第2天

40 7
|
6天前
|
存储 关系型数据库 MySQL
|

?浅聊MVCC?

MVCC(多版本并发控制)是数据库的一种并发控制方法,通过快照读和当前读实现优雅的并发操作。快照读读取快照数据,而当前读获取最新数据,涉及加锁。Undo Log存储记录的旧版本,用于回滚事务和MVCC的快照读。行记录包含隐式字段如db_trx_id和db_roll_ptr,用于追踪记录版本。Read View解决数据可见性问题,根据事务ID判断记录是否对当前事务可见。MVCC结合Read View和Undo Log确保在可重复读隔离级别下避免不可重复读问题。

23 3
|
9天前
|
关系型数据库 MySQL 测试技术
|

sysbench 对MySQL压测100分钟的命令

使用 `sysbench` 对 MySQL 数据库进行性能测试(压测)时,首先确保 `sysbench` 和 MySQL 数据库已经安装,并且你有一个测试数据库可以使用。下面是一个针对 MySQL 数据库进行压测的示例命令,测试时长为 100 分钟(6000 秒)。 在运行此命令之前,请确保以下内容: - 使用适当的数据库连接参数(主机、端口、用户名、密码、数据库名)。 - 根据你的需求调整测试参数(如并发数、线程数、事务数等)。 以下是一个示例命令,使用 `sysbench` 对 MySQL 数据库进行压测 100 分钟: ```shell sysbench --db-driver=m

27 0
|
9天前
|
弹性计算 数据可视化
|

对云效流水线 Flow 的一些体验

Flow是阿里云的CI/CD工具,以其可视化界面和拖拽式构建流程简化了新手上手难度,同时提供代码检查、构建、测试及部署等功能。尽管对CI/CD概念新手仍有学习曲线,Flow的入门教程有助于理解和使用。Flow在性能和开放性上表现出色,支持多种语言和框架,能与阿里云服务集成。成本相对较低,适合与阿里云生态匹配的团队。与其他CI/CD工具比较,Flow在功能和性能上有竞争力,但最佳选择取决于团队具体需求。总体而言,Flow是值得考虑的CI/CD解决方案。

137 1
|
10天前
|
搜索推荐
|

百度百科都是谁写的

百度百科是全民共建的网络百科全书,允许注册用户编辑词条,强调平等、协作与分享。它拥有严格的审核机制,确保内容客观、权威,以参考资料为支撑。编辑者来自各行各业,从学生到专业人士,他们的贡献提升了百科的可信度。新创建的词条若具丰富引用,尤其来自政府网站,其可信度更高。通过用户间的交流与合作,百度百科不断进化和完善。

44 1
|
10天前
|
自然语言处理 前端开发 Swift
|

社区供稿 | 中文llama3模型哪家强?llama3汉化版微调模型大比拼

随着llama3的发布,业界越来越多的针对其中文能力的微调版本也不断涌现出来,我们在ModelScope魔搭社区上,搜集到几款比较受欢迎的llama3中文版本模型,来从多个维度评测一下,其对齐后的中文能力到底如何? 微调后是否产生了灾难性遗忘问题。

143 2
|
11天前
|
自然语言处理 Swift
|

千亿大模型来了!通义千问110B模型开源,魔搭社区推理、微调最佳实践

近期开源社区陆续出现了千亿参数规模以上的大模型,这些模型都在各项评测中取得杰出的成绩。今天,通义千问团队开源1100亿参数的Qwen1.5系列首个千亿参数模型Qwen1.5-110B,该模型在基础能力评估中与Meta-Llama3-70B相媲美,在Chat评估中表现出色,包括MT-Bench和AlpacaEval 2.0。

402 0
|
13天前
|
人工智能 测试技术 API
|

Phi-3:小模型,大未来!(附魔搭社区推理、微调实战教程)

近期, Microsoft 推出 Phi-3,这是 Microsoft 开发的一系列开放式 AI 模型。Phi-3 模型是一个功能强大、成本效益高的小语言模型?(SLM),在各种语言、推理、编码和数学基准测试中,在同级别参数模型中性能表现优秀。为开发者构建生成式人工智能应用程序时提供了更多实用的选择。

395 1
|
14天前
|
自然语言处理 前端开发 Swift
|

Llama3 中文通用Agent微调模型来啦!(附手把手微调实战教程)

Llama3模型在4月18日公布后,国内开发者对Llama3模型进行了很多训练和适配,除了中文纯文本模型外,多模态版本也陆续在发布中。

410 3

社区供稿 | XTuner发布LLaVA-Llama-3-8B,支持单卡推理,评测和微调

日前,XTuner 团队基于 meta 最新发布的 Llama-3-8B-Instruct 模型训练并发布了最新版多模态大模型 LLaVA-Llama-3-8B, 在多个评测数据集上取得显著提升。

175 1
|
16天前
|
存储 人工智能 搜索推荐
|

在魔搭使用SD-WebUI,玩转AIGC!

stable-diffusion-webui是一个便捷的工具,大大降低了复杂AI技术的使用门槛,让更多人能享受到AI驱动的图像生成技术带来的便利与创新可能。

134 0
|
16天前
|
并行计算 PyTorch 算法框架/工具
|

社区供稿 | 本地部署通义千问大模型做RAG验证

这篇文章中,我们通过将模搭社区开源的大模型部署到本地,并实现简单的对话和RAG。

230 1
|
16天前
|
Cloud Native Serverless 开发者
|

阿里云助力开发者创新:探索云原生技术的新境界

阿里云开发者社区推动云原生技术发展,提供丰富产品(如容器服务、Serverless、微服务架构、服务网格)与学习平台,助力企业数字化转型。开发者在此探索实践,共享资源,参与技术活动,共同创新,共创云原生技术新篇章。一起加入,开启精彩旅程!

111 2
|
17天前
|
自然语言处理 开发者 异构计算
|

社区供稿 | Llama3-8B中文版!OpenBuddy发布新一代开源中文跨语言模型

此次发布的是在3天时间内,我们对Llama3-8B模型进行首次中文跨语言训练尝试的结果:OpenBuddy-Llama3-8B-v21.1-8k。

540 1
|
17天前
|
安全 测试技术 Swift
|

Llama 3开源!魔搭社区手把手带你推理,部署,微调和评估

Meta发布了 Meta Llama 3系列,是LLama系列开源大型语言模型的下一代。在接下来的几个月,Meta预计将推出新功能、更长的上下文窗口、额外的模型大小和增强的性能,并会分享 Llama 3 研究论文。

2167 2
|
17天前
|
存储 人工智能 自然语言处理
|

社区供稿 | 开放开源!蚂蚁集团浙江大学联合发布开源大模型知识抽取框架OneKE

OneKE 是由蚂蚁集团和浙江大学联合研发的大模型知识抽取框架,具备中英文双语、多领域多任务的泛化知识抽取能力,并提供了完善的工具链支持。OneKE 以开源形式贡献给 OpenKG 开放知识图谱社区。

137 0
|
20天前
|
物联网 PyTorch 测试技术
|

手把手教你捏一个自己的Agent

Modelscope AgentFabric是一个基于ModelScope-Agent的交互式智能体应用,用于方便地创建针对各种现实应用量身定制智能体,目前已经在生产级别落地。

103086 5
|
20天前
|
Web App开发 算法 PyTorch
|

社区供稿 | vLLM部署Yuan2.0:高吞吐、更便捷

vLLM是UC Berkeley开源的大语言模型高速推理框架,其内存管理核心——PagedAttention、内置的加速算法如Continues Batching等,一方面可以提升Yuan2.0模型推理部署时的内存使用效率,另一方面可以大幅提升在实时应用场景下Yuan2.0的吞吐量。

81 6
|
20天前
|
前端开发 Java 定位技术
|

生活小事件(SpringMVC主要的组件及作用和执行流程)

Spring MVC 的主要组件包括 DispatcherServlet(核心,请求调度)、HandlerMapping(URL 映射到处理器)、HandlerAdapter(统一执行处理器)、Handler(处理业务逻辑,通常为 @Controller 类)、ViewResolver(视图解析)和 View(渲染输出)。通过这些组件的协作,Spring MVC 实现了从接收请求到返回响应的流程,类似于警察处理交通违规的协调过程。

58 6
|
22天前
|
SQL 自然语言处理 JavaScript
|

快来与 CodeQwen1.5 结对编程!

今天,来自 Qwen1.5 开源家族的新成员,代码专家模型 CodeQwen1.5开源!CodeQwen1.5 基于 Qwen 语言模型初始化,拥有 7B 参数的模型,其拥有 GQA 架构,经过了 ~3T tokens 代码相关的数据进行预训练,共计支持 92 种编程语言、且最长支持 64K 的上下文输入。效果方面,CodeQwen1.5 展现出了优秀的代码生成、长序列建模、代码修改、SQL 能力等,该模型可以大大提高开发人员的工作效率,并在不同的技术环境中简化软件开发工作流程。

221 0
|
22天前
|
人工智能 Apache
|

社区供稿 | 140B参数、可商用!OpenBuddy 发布首个开源千亿中文 MoE 模型的早期预览版

我们很自豪地于今天发布OpenBuddy最新一代千亿MoE大模型的早期预览版本:OpenBuddy-Mixtral-22Bx8-preview0-65k。此次发布的早期预览版对应约50%的训练进度。

60 0
|
22天前
|
人工智能 文字识别 物联网
|

新一代端侧模型,面壁 MiniCPM 2.0开源,魔搭社区最佳实践

MiniCPM-V 2.0 不仅带来优秀端侧多模态通用能力,更带来惊艳的 OCR 表现。通过自研的高清图像解码技术,可以突破传统困境,让更为精准地识别充满纷繁细节的街景、长图在端侧成为可能。

190 0
|
22天前
|
数据采集 机器学习/深度学习 存储
|

性能提升30%!中国电信进一步开源12B星辰大模型TeleChat-12B!魔搭社区最佳实践来啦!

中国电信人工智能研究院开源12B参数规模星辰语义大模型TeleChat-12B,相较1月开源7B版本,内容、性能和应用等方面整体效果提升30%,其中,多轮推理、安全问题等领域提升超40%。在C-eval、MMLU、AGIEVAL等国际权威榜单上,排名处于国内同级别参数开源模型的前列,进一步促进大模型开源生态繁荣,助力AI产业加速高质量发展。另据悉,中国电信人工智能研究院将于年内开源千亿级参数大模型。

92 3
|
23天前
|
测试技术
|

Vript:最为详细的视频文本数据集,每个视频片段平均超过140词标注 | 多模态大模型,文生视频

[Vript](https://github.com/mutonix/Vript) 是一个大规模的细粒度视频文本数据集,包含12K个高分辨率视频和400k+片段,以视频脚本形式进行密集注释,每个场景平均有145个单词的标题。除了视觉信息,还转录了画外音,提供额外背景。新发布的Vript-Bench基准包括三个挑战性任务:Vript-CAP(详细视频描述)、Vript-RR(视频推理)和Vript-ERO(事件时序推理),旨在推动视频理解的发展。

36 1
来自: 多模态  版块
|
23天前
|
Linux 网络安全
|

linux如何关闭防火墙

记住,关闭防火墙可能会降低系统安全性,请在真正需要的情况下关闭,并确保你在网络环境中采取其他安全措施。

19 0
|
27天前
|
前端开发 计算机视觉
|

InstantStyle,无需训练,风格保留文生图

InstantStyle 是一个通用框架,它采用两种简单但有效的技术来实现风格和内容与参考图像的有效分离。

67 0
|
28天前
|
人工智能 物联网 PyTorch
|

8卡环境微调Grok-1实战

SWIFT(Scalable lightWeight Infrastructure for Fine-Tuning)是魔搭ModelScope开源社区推出的一套完整的轻量级训练推理工具,基于PyTorch的轻量级、开箱即用的模型微调、推理框架,让AI爱好者用自己的消费级显卡就能玩转大模型和AIGC。

84 3
|
29天前
|
机器学习/深度学习 测试技术 TensorFlow
|

ModelScope模型使用与EAS部署调用

本文以魔搭数据的模型为例,演示在DSW实例中如何快速调用模型,然后通过Python SDK将模型部署到阿里云PAI EAS服务,并演示使用EAS SDK实现对服务的快速调用,重点针对官方关于EAS模型上线后示例代码无法正常调通部分进行了补充。

57 2
来自: 计算机视觉  版块
|
29天前
|
机器学习/深度学习 自然语言处理 机器人
|

【RAG实践】Rerank,让RAG更近一步

本文主要关注在Rerank,本文中,Rerank可以在不牺牲准确性的情况下加速LLM的查询(实际上可能提高准确率),Rerank通过从上下文中删除不相关的节点,重新排序相关节点来实现这一点。

306 0
|
29天前
|
关系型数据库 MySQL 数据库
|

MySQL之show profile相关总结

综上所述,`SHOW PROFILE`是MySQL提供的一个用于查询性能分析的工具,可以帮助开发人员定位查询性能问题,并进行优化。通过分析每个阶段的执行时间和资源消耗情况,可以更好地理解查询的执行过程,从而提升数据库性能。

16 0
|
1月前
|
存储 自然语言处理 负载均衡
|

元象开源首个MoE大模型:4.2B激活参数,效果堪比13B模型,魔搭社区最佳实践来了

近日,元象发布其首个Moe大模型 XVERSE-MoE-A4.2B, 采用混合专家模型架构 (Mixture of Experts),激活参数4.2B,效果即可媲美13B模型。该模型全开源,无条件免费商用,支持中小企业、研究者和开发者可在元象高性能“全家桶”中按需选用,推动低成本部署。

74 7
|
1月前
|
数据采集 存储 人工智能
|

TripoSR开源!从单个图像快速生成 3D 对象!(附魔搭社区推理实战教程)

近期,VAST团队和Stability AI团队合作发布了TripoSR,可在一秒内从单个图像生成高质量3D对象。

142 0
|
1月前
|
人工智能 开发框架 前端开发
|

适合假期自学一战成名的必看秘籍-五板斧打造AgentScope应用

本文写给有一定编程基础的学习者,得以入门 源码级 开发Agentscope应用,并上线创空间,参加AgentScope的应用开发挑战赛。

267 2
|
1月前
|
搜索推荐 决策智能
|

Multi-Agent实践第7期:智能体的高效协作

教程第7期

256 3
|
1月前
|
数据可视化 物联网 Swift
|

澜舟科技开源孟子3-13B大模型,魔搭社区推理训练最佳实践!

4月1日,澜舟科技宣布开源Mengzi3-13B大模型,对学术研究完全开放,同时支持免费商用。

176 2
|
1月前
|
JSON 前端开发 决策智能
|

Multi-Agent实践第6期:面向智能体编程:狼人杀在AgentScope

本期文章,我们会介绍一下AgentScope的一个设计哲学(Agent-oriented programming)

242 3
|
1月前
|
自然语言处理 数据可视化 物联网
|

Qwen1.5-MoE开源,魔搭社区推理训练最佳实践教程来啦

通义千问团队推出Qwen系列的首个MoE模型,Qwen1.5-MoE-A2.7B。

1295 4

ModelScope模型即服务

ModelScope旨在打造下一代开源的模型即服务共享平台,为泛AI开发者提供灵活、易用、低成本的一站式模型服务产品,让模型应用更简单!

22
今日
9870
内容
5
活动
2154
关注
你好!
登录掌握更多精彩内容

相关产品

  • 人工智能平台 PAI
  • 文字识别
  • 智能语音交互
  • http://www.vxiaotou.com