进行数据挖掘主要还是使用python的几个库:numpy,scipy,pandas,scikit-learn,statsmodels,matplotlib等等。
为了方便安装,使用pip工具来安装也是很方便的,用
[plain] view plain copy
- pip install +库名
即可
但是博主发现有时在pip上由于各个库的依赖关系处理的不是很好,常常会出现安装报错的情况,因此还是建议大家在安装数据挖掘所需库的时候,使用以下方法安装:
Numpy:
[html] view plain copy
- sudo apt-get install python-numpy
Scipy:
[html] view plain copy
- sudo apt-get install python-scipy
绘图库matplotlib:
[html] view plain copy
- sudo apt-get install python-matplotlib
主力工具pandas:
[html] view plain copy
- sudo apt-get install python-pandas
统计建模分析工具statsModels:
[html] view plain copy
- sudo apt-get install python-statsmodels
机器学习库scikit-learn:
[html] view plain copy
- sudo apt-get install python-sklearn
注意:本文归作者所有,未经作者允许,不得转载