新闻动态
欧洲杯体育面向大家用户灵通使用-开云(中国大陆) Kaiyun·官方网站
10月24日欧洲杯体育,趣丸科技秘书与香港汉文大学(深圳)荟萃研发的语音大模子“MaskGCT”注意在Amphion系统中开源,面向大家用户灵通使用。分离于传统TTS模子,该模子取舍掩码生成模子与语音表征解耦编码的改进范式,在声息克隆、跨语种合成、语音截止等任务中展现出超卓成果。
尊府表示,MaskGCT(Masked Generative Codec Transformer)是一个大界限的零样本TTS模子,取舍非自总结掩码生成Transformer,无需文本与语音的对皆监督和音素级合手续时间臆想。其技能冲破性在于取舍掩码生成模子与语音表征解耦编码的改进范式。实验标明,MaskGCT在语音质料、通常度和可清醒性方面优于现时开始进的TTS模子,况且在模子界限和锻练数据量增多时发达更佳,同期大要截止生谚语音的总时长。MaskGCT已在香港汉文大学(深圳)与上海东谈主工智能实验室荟萃设备的开源系统Amphion发布。
趣丸科技方面暗示,相较于现存的TTS大模子,MaskGCT在语音的通常度、质料和看法性上进一步冲破,尤其在语音通常度方面处于最初水平。据先容,MaskGCT在三个TTS基准数据集上都达到了SOTA成果,特出现时开始进的同类模子。
现在,MaskGCT在短剧出海、数字东谈主、智能助手、有声读物、扶直西宾等界限领有丰富的运用场景。为了加速落地运用,在安全合规下,趣丸科技打造了多语种速译智能视听平台“趣丸千音”。一键上传视频即可快速翻译成多语种版块,并竣事字幕建筑与翻译、语音翻译、唇音同步等功能。该居品进一步矫正视频翻译制作历程,大幅裁汰过往繁荣的东谈主工翻译资本和冗长的制作周期,成为影视、游戏、短剧等实践出海的理思平台。
南边+记者 叶丹欧洲杯体育