据媒体报道,微软公司近期成功研发了一款名为VALL-E2的革命性AI语音生成技术。这项技术在AI语音合成领域实现了重大突破,仅需短短三秒钟的音频样本,VALL-E2便能以极高的精确度和自然度复现出说话者的独特声线,其表现几乎达到了以假乱真的人类水准。

科学家表示,这是AI语音首次达到人类水平,但由于其潜在危险性,无法向公众发布。当前,AI语音诈骗案件频发,若VALL-E2技术落入不法分子之手,可能加剧此类犯罪。诈骗者能够轻易克隆他人声音,进行高度逼真的电话诈骗,诱导受害者进行财务交易,造成巨大经济损失。
此外,VALL-E2技术的快速发展对传统声音演员行业也构成了挑战。声音演员们担心,随着AI语音合成技术的日益成熟,他们的声音可能被轻易复制并用于各种场合,而他们应得的经济补偿却难以得到合理保障,这无疑对他们的职业生涯构成了潜在威胁。
尽管VALL-E2 AI语音生成器不会对公众开放,但这项技术的进步证明了AI在语音合成方面的巨大潜力。未来,AI语音技术可以应用于教育学习、娱乐、新闻、聊天机器人等领域,为这些行业带来新的机遇和发展。
科学家和技术公司在开发和应用此类先进技术时需谨慎,以确保技术的安全性和道德性,同时要制定相应的监管措施,防止技术被滥用。这样,才能在享受技术进步带来的便利和效率的同时,最大程度地保护公众的利益。