单就人类演奏的乐音来说,需要提取与情感表达相关的不同类型特征参数,如音质、韵律、声谱特征等等,大量提取的特征参数,包含部分冗余信息,构成了高维度特征向量,导致机器训练测试的成本过于高昂,于是必须对特征向量集进行选择或降维处理以获得最佳特征子集。
特征选择主要通过wrapper/filter两种算法。降维分为线性/非线性。但在非监督式学习模式下,机器进行筛选时往往错失最佳参数/邻域数,所以结果可能失真,不尽人意。
未来肯定会不断发展完善。ChatGPT对乐音演奏方面的点评很神奇。但我个人对全民的AI音效、机器点评完全不感冒,这本来也不是这公司的专长,估计投入的也远远不够,想模仿ChatGPT结果弄成四不象哈哈哈:)