用机器将人类情感具象化、数据化,全面采集并建模进行有效分析,这是多学科多专业的大工程,撇开面部及语音识别不谈

本帖于 2025-07-26 14:17:01 时间, 由普通用户 摄天音 编辑

单就人类演奏的乐音来说,需要提取与情感表达相关的不同类型特征参数,如音质、韵律、声谱特征等等,大量提取的特征参数,包含部分冗余信息,构成了高维度特征向量,导致机器训练测试的成本过于高昂,于是必须对特征向量集进行选择或降维处理以获得最佳特征子集。

特征选择主要通过wrapper/filter两种算法。降维分为线性/非线性。但在非监督式学习模式下,机器进行筛选时往往错失最佳参数/邻域数,所以结果可能失真,不尽人意。

未来肯定会不断发展完善。ChatGPT对乐音演奏方面的点评很神奇。但我个人对全民的AI音效、机器点评完全不感冒,这本来也不是这公司的专长,估计投入的也远远不够,想模仿ChatGPT结果弄成四不象哈哈哈:) 嘻嘻

 

请您先登陆,再发跟帖!