我最近负责组里predictive scenario 的测试工作。可是手里没有足够的用户数据, 特别是CRM 方面的市场和销售数据。目前排在第一位要测试是logistic regression, 想请问各位大师,怎么样可以找到足够量的好的数据呢。
足够 --- 我想知道如果早测试一个implementation 的 performance, 多少数据叫足够? 好 --- 我想知道对于logistic regression来说, 什么样的数据分布是好的,我又怎么判断呢?
我知道数据还要经过处理,比如说,年龄要变成年龄段, 这个处理我会自己做。我需要原始的市场和销售的数据。 请各位指点于我。 谢谢。