阿里放大招了!“通义听悟”确实有点新意了,为国产AI大模型打响应用第一枪

本文涉及的产品
服务治理 MSE Sentinel/OpenSergo,Agent数量 不受限
可观测可视化 Grafana 版,10个用户账号 1个月
简介: 阿里放大招了!“通义听悟”确实有点新意了,为国产AI大模型打响应用第一枪

2000元阿里云代金券免费领取,2核4G云服务器仅664元/3年,新老用户都有优惠,立即抢购>>>


阿里云采购季(云主机223元/3年)活动入口:请点击进入>>>,


阿里云学生服务器(9.5元/月)购买入口:请点击进入>>>,

阿里云 AI 神器通义听悟上线了,宣称是身边的 AI 学习助手。这名字听着挺玄乎的,通义听悟到底是个什么玩意?具体有什么用呢?下面我们一起来看看它有什么神器的地方。

通义听悟介绍

通义听悟是接入了阿里大模型的聚焦音视频内容的工作学习AI助手。基础的功能包含以下几点:

  • 实时语音转写,生成智能记录
  • 文件转写,音视频文件快速上传转成文字
  • 实时翻译,大幅提升跨语言写作效率
  • 快速标记内容,整理内容重点信息,智能全文概要

针对一些细分场景,听悟还设置了不少「宝藏功能」:打开 Chrome 插件,外语学习者和听障人士可以借助双语悬浮字幕条随时随地看无字幕视频,日程冲突时,听悟还可成为职场人士的「开会替身」,在静音情况下入会 AI 可代为记录会议、整理要点;转写结果可下载为字幕文件,方便新媒体从业者视频后期制作;听悟梳理的问答回顾可以让记者、分析师、律师、HR 等群体整理访谈更高效。
通义听悟 Chrome 插件将在近期对所有用户开放下载

具体到玩法,正如通义听悟的「自我介绍」中所说:

  • 如果你是一名职场人士,通义听悟可以帮你记录和回顾你的每一场会议;

  • 如果你是一位学生朋友,通义听悟可以让你不遗漏老师讲授的每一个重点;

  • 如果你是一名金融分析师或媒体从业人员,通义听悟可以存档你每一次的调研访谈;

  • 如果你想以最快的时间看完你最喜爱的视频博主的直播分享,通义听悟可以使你以成倍的速度抓住最精彩的内容。

接下来,让我们看看通义听悟的本领如何。

实测通义听悟

学啥新东西第一个想到的就是去 B 站看看有没有免费课程。

有时候没空看视频,就想能不能把视频中的对话转成文字,这样就不需要自己手动做笔记了,每次回顾只看文字稿就行了。

如何把视频中 UP 主说的话转成文字? 之前一直没找到好使的工具,用了通义听悟,确实不错。

在「通义听悟」上传了一个 30 min 的老蒋解读 B 站商业化的视频,大该用了2 分钟就完成了转文字。

让我震惊的是,不是单纯的视频对话转文字, AI 自动帮你做了总结、分了段落 ...

自动生成的全文概要

自动生成的章节速览

自动生成的对话文字

说实话,用到视频转文字、自动总结功能,对平时自学的小伙伴确实是一个不错的助手,更多的功能,等着大家一起去发现,感兴趣的去申请内测吧!
通义听悟: https://tingwu.aliyun.com/u/6WXvEJc0Jc00JJ30

目录
相关文章
|
6天前
|
人工智能 图形学
阿里AI模型EMO免费上线通义APP
阿里AI模型EMO免费上线通义APP
30 1
|
13天前
|
人工智能 Serverless 异构计算
上海站丨飞天技术沙龙 Serverless + AI 专场开启报名!
"飞天技术沙龙——Serverless 技术实践营"将于2024年5月31日举行,聚焦Serverless在AI中的应用。活动包括演讲、实操,探讨Serverless演进趋势、AI应用开发及降低成本等议题。限额80人,报名审核制,现场还有大奖和证书待您领取。扫描链接<https://summit.aliyun.com/Serverless2024shanghai>报名。
上海站丨飞天技术沙龙 Serverless + AI 专场开启报名!
|
16天前
|
人工智能 自然语言处理 搜索推荐
阿里通义千问的这次升级不仅带来了实实在在的利好,也为我们展示了AI技术的巨大潜力和广阔前景
【5月更文挑战第13天】阿里通义千问3月22日升级,开放1000万字长文档处理功能,成为全球处理容量最大的AI应用,超越ChatGPT等。此升级助力用户(如金融分析师、法律人士、科研人员)高效处理文档,提升工作效率,并推动AI在各行业深入应用,加速数字化转型。未来,通义千问可能发展更强大的自然语言处理能力、拓宽应用场景及提供智能个性化推荐,展现AI技术潜力与前景。
49 2
|
16天前
|
消息中间件 人工智能 监控
|
16天前
|
人工智能
[AI 阿里 EMO] 集成进通义千问app,全民演唱,人人可用!
阿里EMO技术的最新进展,现在集成进通义千问app,允许用户通过图+音频生成任意时长的视频,实现全民演唱的互动体验。
[AI 阿里 EMO] 集成进通义千问app,全民演唱,人人可用!
|
16天前
|
人工智能 API 决策智能
【AI Agent系列】【阿里AgentScope框架】实战1:利用AgentScope实现动态创建Agent和自由组织讨论
【AI Agent系列】【阿里AgentScope框架】实战1:利用AgentScope实现动态创建Agent和自由组织讨论
231 2
|
16天前
|
人工智能 决策智能 C++
【AI Agent系列】【阿里AgentScope框架】5. Pipeline模块的组合使用及Pipeline模块总结
【AI Agent系列】【阿里AgentScope框架】5. Pipeline模块的组合使用及Pipeline模块总结
84 1
|
16天前
|
人工智能 决策智能
【AI Agent系列】【阿里AgentScope框架】4. 深入源码:Pipeline模块如何组织多智能体间的数据流?- 循环结构
【AI Agent系列】【阿里AgentScope框架】4. 深入源码:Pipeline模块如何组织多智能体间的数据流?- 循环结构
66 0
|
16天前
|
人工智能 决策智能
【AI Agent系列】【阿里AgentScope框架】3. 深入源码:Pipeline模块如何组织多智能体间的数据流?- 顺序结构与条件分支
【AI Agent系列】【阿里AgentScope框架】3. 深入源码:Pipeline模块如何组织多智能体间的数据流?- 顺序结构与条件分支
54 2
|
16天前
|
人工智能 决策智能
【AI Agent系列】【阿里AgentScope框架】2. Pipeline模块入门:使用Pipeline模块实现最简单的多智能体交互
【AI Agent系列】【阿里AgentScope框架】2. Pipeline模块入门:使用Pipeline模块实现最简单的多智能体交互
86 0
http://www.vxiaotou.com