发布日期:2024-11-21 14:27 点击次数:116
(原标题:趣丸齐集张东谈主勇:AI克隆东谈主声,只需3秒样本)
南边财经全媒体记者吴佳霖 广州报谈
“Mask GCT语音大模子大略收场秒级超传神的声息克隆,独一双模子输入3秒把握的声息样本,就不错作念到带情谊、复刻音色的声息输出。”广州趣丸齐集科技有限公司的投资部负责东谈方针东谈主勇在2024年粤港澳大湾区文化产业投资大会(广东·广州)上如斯先容我方的公司家具。
据先容,这家超60%的东谈主员王人在作念研发的“硬核”公司,产学研勾搭,与香港科技大学广州分校以及香港汉文大学区分连合创办趣丸科技两个东谈主工智能的连合实验室,旗下Mask GCT大模子齐集了10万小时数据集,以刷新多项业内标的的优秀获利通过了3个数据集的测试。不久前的10月24日,趣丸科技晓示与香港汉文大学(深圳)连合研发的语音大模子“Mask GCT”致密在Amphion系统中开源,面向公共用户通达使用。
“趣丸科技不是作念通用大模子的,作念这些模子王人是源于咱们在业务发展中捕捉到的用户和行业的需求。咱们作念的这些大模子改日亦然但愿应用在数字东谈主、三维生成、智能音频和音乐生成当中。”现在,趣丸正在作念积极的生意化探索。
天然领有荒谬“硬”的技巧,但趣丸正在作念的软件却荒谬“趣”味盎然。
张东谈主勇在现场示意,趣丸中枢的业务在外交限度,外交方面的应用包括谈话奉陪式聊天。据悉,趣丸旗下主要家具tt语音是国内当先的有趣有趣外交平台,为玩家提供组队开黑、队友匹配、电子竞技等多种文娱互动做事。
另一方面,不错调理长度、语速和情谊的上风得以打造更密致可控的声息输出,Mask GCT语音大模子哄骗到短剧和影视剧优质的声息克隆和翻译上,助力文化出海。据张东谈主勇先容,趣丸参与接洽的《第六只醒狮》微短剧入选了国度广电总局举办的中国影视剧大赛。
在音乐方面,趣丸自研的天谱乐大模子给音乐创作提供了更低的门槛,其音乐APP唱鸭累计注册用户超过4600万东谈主。同期,趣丸旗下Spark.AI是公共首个高价值网漫数字现实出产的AI提效创作平台,以垂类漫画大模子给专科的漫画创作家提供一个快速上手的用具。
“AI for future,”关于to B还是to C的聘请,张东谈主勇回话现场发问时答谈,“公司里面成就了‘X’部门,咱们确信上风的主业汇注发展,对插足无数资金的东谈主工智能行业请托厚望,对B段的尝试也会握续发展。”据悉,趣丸科技正处于港交所的上市流程中。