现今,不少KTV融入了先进的打分评价系统,让人们的演唱体验感得到显著提升。一些演唱者常会对自己得到的分数产生疑虑:“我唱得明明很好,为何分数如此之低?”这促使我们思考K歌与评分如何结为一体,以及背后的工作原理。
近日,深圳的即构科技公司,作为实时互动领域的佼佼者,接受了记者的采访,为我们解答了上述的疑问。
KTV打分系统并非依赖于人工智能,而是一个基于音频信号处理并输出客观数据的系统。当人们歌唱时,系统会实时录制声音并转化为数字信号,再与原唱音轨信号进行对比。系统会分析音准、节奏和音色的相似度,相似度越高,得分也就越高。
这一过程的实现需要三个步骤。系统会预先储存每首歌曲的音轨、歌词以及每个音符的详细信息,建立标准模板库。接着,通过算法提取被评分的干音的旋律特征。将提取的特征与标准模板进行相似度评估,从而得出分数。
值得注意的是,尽管系统能够客观地评估演唱,但所认定的“高分”演唱在人类听感上可能并不一定符合主观审美。有些人总结出获得高分的技巧,如录音清晰、声音平稳等。这也出KTV打分系统的一些局限性——它们主要关注音准、节奏和音色,而无法评价情感、表达和技巧。
随着在线K歌软件的流行,声音修饰等功能使更多人有了展露歌喉的机会。娱乐阵地逐渐从线下转向线上,“打分”成为了提升用户参与感的重要功能。在互联网公司的技术加持下,K歌评分已经进入2.0时代,在功能上有了显著提升。
面对歌曲中复杂的和声等因素带来的挑战,即构科技通过自研的AI模型,在保证人声完整性的前提下,准确提取音高线。其精确率高达99%,为快速生成打分标准提供了有力支持。
即构科技也在努力让算法“读懂感情”,以提供更具人情味的评价标准。他们希望确保唱得好的人能够通过分数得到认可,同时也让初学者能够获得积极的反馈和激励。为此,他们的打分策略算法为不同水平的演唱者提供了度、有弹性的分数,以保护他们的演唱积极性。
即构科技的市场负责人杜晓斌表示,他们将持续丰富功能与玩法,鼓励用户进行个性化表达,守护音乐的情感价值。他们希望用户在K歌过程中发现自我声音的魅力,同时为音乐行业的繁荣发展贡献力量。