智谱公司近期推出了一款名为GLM-4-Voice的多模态语音模型,该模型在情感理解方面表现出色,能够模拟高兴、悲伤等多种情绪和语调,实现与用户间的情感共鸣。
GLM-4-Voice在对话中展现出高度的灵活性,用户可以随时打断并调整语音输出的内容和风格。同时,该模型还支持调整语速,以适应不同场景的交流需求。
除了支持中英文语音外,GLM-4-Voice还能识别和表达粤语、重庆话和北京话等中国各地方言。未来,该模型还将结合视频通话功能,为用户提供全方位的交互体验。
目前,GLM-4-Voice已作为智谱公司首个开源的端到端多模态模型,部署在“智谱清言”App上,供用户即时体验。