如何做数据清理方法研究
老师说这个与数据挖掘可视化有关,还用文本文档列举了一些数据,说用户指定里面的哪些数据为不要的就是垃圾数据,现在要求用VC编程实现将那些垃圾数据去掉,请问我该怎么办呢?我都不知道如何下手?
[解决办法]
需求不明确
数据的类型?
个人感觉主要是垃圾数据的界定
如果是匹配就可以的,可以考虑看看正则表达式
[解决办法]
不是 用户指定么?
只要在交互后确定 垃圾数据,
然后从原始集合中去掉这些数据就可以了~
[解决办法]
比如一个序列,
用户给出其中某些数据是 垃圾,
得到这个信息后,
从序列中去除垃圾数据即可 ~
[解决办法]
楼主,是虫子所说的要求吗?
那样就好办了。比如文本文件。打开,读取。检查,如果是用户所输入数据和正在检查的数据相当。则删除。即可。
[解决办法]
就是要把垃圾数据与正常需要的数据之间的区别找出来,然后就好办了,根据之间的不同,从文件中把垃圾数据删除掉,即可。
[解决办法]
在界定垃圾数据时,可以考虑建立一些字典,然后通过把“垃圾”同“垃圾字典”匹配或把“金子”同“金子字典”匹配来区分。