数据预处理方法总结,spss数据预处理

  

  DT时代,大数据常用的软件工具有哪些?   

  

  首先,对于传统的分析和业务统计,常用的软件工具有Excel、SPSS和SAS。   

  

  Excel是一种电子表格软件。相信很多人在工作学习的过程中都用过这个软件。Excel使用方便,操作简单,功能多样。它为我们提供了许多函数计算方法,因此被广泛应用。但是,它只适用于简单的统计。一旦数据量过大,Excel将无法满足要求。   

  

  SPSS和SAS是只能用于业务统计的软件,它们为我们提供了经典的统计分析和处理,使我们能够更好地处理业务问题。同时,SPSS更简单,但功能相对较少,而SAS的功能会更丰富。   

  

  其次,对于数据挖掘,由于数据挖掘在大数据行业的重要地位,使用的软件工具强调机器学习,常用的软件工具是SPSS Modeler。   

  

  Modeler主要提供商业挖掘的机器学习算法。同时,其数据预处理和结果辅助分析相当方便,特别适合商业环境下的快速挖掘。但是它的处理能力不是很强,一旦面对过大的数据规模就很难使用。   

  

  第三,大数据可视化。在这个领域里,最常用也是目前最好的软件是TableAU。   

  

  TableAU的主要优势是支持多种大数据源,可视化图表类型多,操作使用简单,非常适合研究人员使用。但它不提供机器学习算法的支持,所以取代数据挖掘的软件工具并不困难。   

  

  第四,关系分析。关系分析是大数据环境下新的分析热点,其最常用的工具是一个可视化的轻量级工具——Gephi。   

  

  Gephi可以解决很多网络分析的需求,功能强大,简单易学,所以很受欢迎。但由于是用Java写的,处理性能并没有那么优秀,似乎无法处理大规模数据,所以也有自己的局限性。   

相关文章