数据分析,分布不均匀的数据应该怎么样处理?

发布网友 发布时间:2022-04-23 16:52

我来回答

2个回答

热心网友 时间:2023-10-09 19:43

根据业务知识,剔除异常值,也不知道你的数据是啥样的,什么领域的?
我们做这种大数据量的,一般都是分出很多段,然后每段的数据取均值,再建回归模型。追问那这样做的话,不就是相当于进行分段的回归,有这样做的吗?请问一下,你们是根据什么方法进行数据的分段?我的数据是由程序提取出来的,而以前也没有相关的研究,现在完全是探索性的,不知道用什么样的模型。

追答其实吧,很简单,每个X值有可能对应不同的Y值,这个时候取Y的均值或中位数,这样每个X就对应一个Y值,然后拟合回归直线,在做预测的时候,预测的值就是均值或中位数,
你的探索估计肯定不完全,数据预处理是建模的关键也是花时间最多的,做不好预处理,做出来的模型没人敢用

热心网友 时间:2023-10-09 19:44

可以使用一些工具辅助分析追问比如呢?

声明声明:本网页内容为用户发布,旨在传播知识,不代表本网认同其观点,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。E-MAIL:11247931@qq.com