Skip to content

Navigation Menu

Sign in
Appearance settings

Search code, repositories, users, issues, pull requests...

Provide feedback

We read every piece of feedback, and take your input very seriously.

Saved searches

Use saved searches to filter your results more quickly

Sign up
Appearance settings

datahuo/Data-analysis

Folders and files

NameName
Last commit message
Last commit date

Latest commit

History

76 Commits

Repository files navigation

Data-analysis

python数据分析与挖掘建模

常用工具

  • numpy

  • pandas

  • matplotlib

    • seaborn 基于matplotlib,对图像的丰富
  • SciPy 科学计算中包的集合

    • scipy.integrade 数值积分例程和微分方程求解器
    • scipy.linalg 线性代数例程和矩阵分解
    • scipy.optimize 函数优化器和根查找算法
    • scipy.signal 信号处理工具
    • scipy.sparse 稀疏矩阵和稀疏线性系统求解器
    • scipy.special SPECFUN(实现了许多常用数学函数)
    • scipy.stats 标准连续和离散概率分布
    • scipy.weave 利用内敛c++代码加速数组计算的工具
  • scikit-learn 简称sk-learn, 机器学习工具,用于数据分析和数据挖掘,建立在Numpy, SciPy和matplotlib上。

  • Jupyter Notebook的本质是一个Web应用程序,便于创建和共享文学化程序文档,支持实时代码,数学方程,可视化和markdown,kaggle竞赛里资料都是Jupyter格式。用途包括:数据清理和转换,数值模拟,统计建模,机器学习等。

  • TensorFlow 是一个采用数据流图,用于数值计算的开源软件库。最初被Google用于机器学习和深度神经网络方面的研究,但也可广泛用于其他计算领域。

  • Anaconda 包括Conda,Python以及180多安装好的工具包机器依赖,比如:numpy, pandas等。Conda是一个开源的包,环境管理器,可以用于在同一个机器上安装不同版本的软件包及其依赖,并能够在不同的环境之间切换。

jieba分词Demo ciyun

About

主要是爬虫与数据分析项目总结,外加建模与机器学习,模型的评估。

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

Contributors

Languages

  • Jupyter Notebook 94.2%
  • Python 5.8%

AltStyle によって変換されたページ (->オリジナル) /