Skip to content

Navigation Menu

Sign in
Appearance settings

Search code, repositories, users, issues, pull requests...

Provide feedback

We read every piece of feedback, and take your input very seriously.

Saved searches

Use saved searches to filter your results more quickly

Sign up
Appearance settings

hubhack/data-analysis

Folders and files

NameName
Last commit message
Last commit date

Latest commit

History

7 Commits

Repository files navigation

数据分析内容

[TOC]


内容

  • 数据清洗
  • 数据可视化
  • 数据分析, 文本挖掘
  • 建模预测

侧重库

  • Pandas:数据预处理和数据分析库
  • Numpy:数值计算库
  • Matplotlib/PyEcharts:绘图库,数据可视化
  • scikit-learn:机器学习库
  • Keras/Tensorflow:深度学习库

Python派技术栈:

  • 环境和工具:Python原生环境/Anaconda/Miniconda
    • 包和环境管理器:pip和conda
    • 交互式编辑器:Jupyter-Notebook
    • 标记语言:Markdown
    • 文档工具:GitBook
  • 数据分析
    • Pandas:Python数据预处理、可视化和数据分析库(表格容器)
  • 数据可视化
    • Matplotlib:Python底层绘图库(多用于数据可视化)
    • Echarts/PyEcharts:Web数据可视化库,JS库
    • Seaborn:Python上层数据可视化库
    • Plotly/Bokeh:Python交互式可视化库
    • Mayavi:Python 3D绘图库
  • 科学计算
    • Numpy:数值计算库,底层,基础,N维数组容器,(数值计算,计算机求数学问题近似解)
    • SymPy:符号计算库,计算机代数系统,(符号计算,用计算机推导和计算数学公式)
    • SciPy:科学计算函数库,集成大量科学计算用算法
    • statsmodels:统计建模和计量经济学库
  • 文本分析(非格式化数据分析,文本挖掘)
    • Jieba:中文分词
    • WordCloud:词云
    • SnowNLP,TextBlob:情感分析
    • Gensim:主题建模,文本相似度度量,词向量,发现文本语义结构
    • NLTK:自然语言处理工具包
  • 机器学习
    • scikit-learn:Python机器学习库
    • xgboost/lightGBM:集成学习库
  • 深度学习
    • Tensorflow:Python深度学习库,2016
    • Keras:Python深度学习上层库(已被收入Tensorflow)
    • PyTorch:Python深度学习库,2017(2018年4月与caffe2合并)
  • 其他相关
    • 数据获取
      • 爬虫相关
    • 数据库相关
      • 关系型数据库:MySQL
      • 非关系型数据库:MongoDB
      • key-value缓存数据库:Redis
    • 大数据
      • Hadoop,Spark

About

python数据分析指南

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

AltStyle によって変換されたページ (->オリジナル) /