王强强
作业帮 语音技术团队负责人
作业帮语音技术实践
如何在语音识别中实现端到端及数据高效利用,如何在高并发场景中实现语音发音纠错,如何提升模型的因素区分及抗干扰能力,如何实现小数据量语音技术框架开发。本次分享,从三个方面,即语音识别技术、语音测评技术、语音合成技术进行分析,解读作业帮是如何进行语音技术实践的。
张骏
字节跳动 AI Lab语音识别算法研究员
字节语音识别技术在飞书会议中的应用
目前,在办公场景中语音识别技术的应用越发普及,从办公邮件到办公语音助手,从即时通讯中的语音输入到实时字幕&会后转写,语音识别技术的普及除了带来方便外,也产生了许多的技术难点。本次分享将从实际场景中发现的问题出发,即会议智能化和提升效率,通过语音识别任务、下游任务及会议等方向的挑战,进行端到端语音识别系统的算法介绍。
谭旭
微软 亚洲研究院主管研究员
构建高水平的语音合成系统实践
本次分享,就高水平语音合成系统背景进行介绍并对技术落地中遇到的难点问题做出了分析。以高水平语音合成系统的设计为案例,展示了从设计的思考到实现的全过程。对实验进行了评估同时对未来工作进行了展望。
刘忠亮
SOUL 语音算法负责人
SOUL社交场景下的智能语音技术实践之路
近年来,随着元宇宙的兴起,社交场景成为其最重要的应用入口之一,那么,语音技术是如何解决社交元宇宙场景下的安全和交互等复杂问题。本次报告将主要介绍SOUL社交元宇宙场景下的端到端语音识别和多模态语音合成技术的构建路线以及在语音安全和语音交互等业务场景下的应用
周维
58同城 AI Lab语音算法部负责人、算法架构师
端到端语音识别技术在58同城的探索实践
AI智能语音已经在多个领域达成了落地,语音对话机器人、语音内容分析平台、语音应用等都是基于AI语音识别技术开发的,那么如何实现端到端语音识别技术呢。本次分享将介绍58同城在WeNet端到端语音识别上的实践经验,包括基于半监督训练提升识别效果、流式/非流式语音识别工程部署方案、基于Efficient Conformer和模型量化的推理性能优化方案等。
元宇宙下的应用与实践
人工智能特别是认知智能的发展快慢,直接会影响“元宇宙”的发展节奏。元宇宙世界需要更智能的算法进行处理,以满足元宇宙建设和用户需求,特别是用户感知的人机智能交互能力和元宇宙治理模式的超大规模的数据集处理方面,是元宇宙何时能够实现的关键控制点,而这些方面的突破又要依赖认知智能的发展!
人工智能特别是认知智能的发展快慢,直接会影响“元宇宙”的发展节奏。元宇宙世界需要更智能的算法进行处理,以满足元宇宙建设和用户需求,特别是用户感知的人机智能交互能力和元宇宙治理模式的超大规模的数据集处理方面,是元宇宙何时能够实现的关键控制点,而这些方面的突破又要依赖认知智能的发展!
转型中的智慧金融
数字化、智能化浪潮席卷各行各业,作为现代经济的血脉,金融产业正处于变革的风口浪尖,智慧金融的发展正在全面提速。更多的AI技术应用于金融风控、流程覆盖以及智能应用解决方案。本专题中,金融科技领域的专家将带来新一代智能技术在金融行业中的多场景应用。
数字化、智能化浪潮席卷各行各业,作为现代经济的血脉,金融产业正处于变革的风口浪尖,智慧金融的发展正在全面提速。更多的AI技术应用于金融风控、流程覆盖以及智能应用解决方案。本专题中,金融科技领域的专家将带来新一代智能技术在金融行业中的多场景应用。
算法模型的创新之道
算法与模型是人工智能的灵魂。可解释、自学习、多模态将成为进一步地发展方向。不同算法与模型的有机结合,也成为了实际应用中的主流选择。本专题由资深算法专家就人工智能领域的算法和模型进行深度剖析,探讨人工智能算法和模型的发展趋势。
算法与模型是人工智能的灵魂。可解释、自学习、多模态将成为进一步地发展方向。不同算法与模型的有机结合,也成为了实际应用中的主流选择。本专题由资深算法专家就人工智能领域的算法和模型进行深度剖析,探讨人工智能算法和模型的发展趋势。
人工智能前沿探索
随着深度学习技术应用的不断深化和产业化步伐的逐步加快,AI技术的发展也面临着不少挑战,一方面主流技术依然有较大的探索空间,另一方面下沉场景的业务需求也提出了新的问题。本专题就人工智能领域多应用场景的前沿技术发展进行讨论,多位技术专家以应用为切点进行展开,深入分析人工智能领域的前沿探索。
随着深度学习技术应用的不断深化和产业化步伐的逐步加快,AI技术的发展也面临着不少挑战,一方面主流技术依然有较大的探索空间,另一方面下沉场景的业务需求也提出了新的问题。本专题就人工智能领域多应用场景的前沿技术发展进行讨论,多位技术专家以应用为切点进行展开,深入分析人工智能领域的前沿探索。
AI赋能产业实践
伴随计算机视觉、语音识别、机器学习、算法、模型等技术的优化,以及产业结构的不断完善,人工智能具备了更丰富的应用场景,比如风控评估、工程运维、生物制药、物流货运等领域应用,同时加速了AI产业的结构升级。本专题中,人工智能领域的资深专家将从产业实践的角度,分享人工智能下游应用的技术思考。
伴随计算机视觉、语音识别、机器学习、算法、模型等技术的优化,以及产业结构的不断完善,人工智能具备了更丰富的应用场景,比如风控评估、工程运维、生物制药、物流货运等领域应用,同时加速了AI产业的结构升级。本专题中,人工智能领域的资深专家将从产业实践的角度,分享人工智能下游应用的技术思考。