Name	Name	Last commit message	Last commit date
Latest commit History 364 Commits
数据集	数据集
01 matplotlib基础绘图和调整x轴.py	01 matplotlib基础绘图和调整x轴.py
02.01 matplotlib绘制0-12的气温图.py	02.01 matplotlib绘制0-12的气温图.py
02.02 查询matplotlib所有的字体.py	02.02 查询matplotlib所有的字体.py
03 matplotlib绘制两个折线图.py	03 matplotlib绘制两个折线图.py
04 matplotlib绘制散点图.py	04 matplotlib绘制散点图.py
05.01 matplotlib绘制条形图.py	05.01 matplotlib绘制条形图.py
05.02 matplotlib绘制横条形图.py	05.02 matplotlib绘制横条形图.py
05.03 matplotlib绘制多次条形图.py	05.03 matplotlib绘制多次条形图.py
06.01 matplotlib绘制直方图.py	06.01 matplotlib绘制直方图.py
06.02 matplotlib绘制统计好数据的直方图.py	06.02 matplotlib绘制统计好数据的直方图.py
07 numpy创建数组.py	07 numpy创建数组.py
08 numpy数组的形状和计算.py	08 numpy数组的形状和计算.py
09 numpy读取本地数据.py	09 numpy读取本地数据.py
10 numpy切片和索引.py	10 numpy切片和索引.py
11 numpy数组的拼接.py	11 numpy数组的拼接.py
12 numpy中youtub练习.py	12 numpy中youtub练习.py
13 pandas的series了解.py	13 pandas的series了解.py
14 pandas读取外部数据.py	14 pandas读取外部数据.py
15 pandas的DataFrame的创建.py	15 pandas的DataFrame的创建.py
16 pandas的DataFrame练习.py	16 pandas的DataFrame练习.py
17 pandas的DataFrame索引.py	17 pandas的DataFrame索引.py
18 pandas处理电影的直方图.py	18 pandas处理电影的直方图.py
19 pandas常用的统计方法.py	19 pandas常用的统计方法.py
20 pandas字符串离散化.py	20 pandas字符串离散化.py
21 panads数组的合并.py	21 panads数组的合并.py
22 pandas数组的分组和聚合.py	22 pandas数组的分组和聚合.py
23 panads数据的索引.py	23 panads数据的索引.py
24 panads数据的索引项目练习.py	24 panads数据的索引项目练习.py
25 panads数据的索引项目练习.py	25 panads数据的索引项目练习.py
26 panads时间序列练习.py	26 panads时间序列练习.py
27 panads时间序列练习.py	27 panads时间序列练习.py
28 PM2.5案例.py	28 PM2.5案例.py
README.md	README.md
numpy.md	numpy.md
pandas.md	pandas.md

Data-Analysis:数据分析

经上一章节的数据爬虫的学习,本章节开始学习数据分析操作,包括`matplotlib`,`numpy`,`pandas`。本节讲解`matplotlib`用法和实例,`numpy`,`pandas`讲解参见下`numpy.md`文件和`pandas.md`文件

01 `matplotlib`基础绘图和调整x轴

02.01 `matplotlib` 绘制 0-12 的气温图

目标分析:构建一个2小时的气温图。

02.02 查询 `matplotlib` 所有的字体

本节主要是对应上一节,使用相关代码查询机器自带的字体。(也可以从网上下载字体嵌入到Pycharm中)

03 `matplotlib` 绘制两个折线图

目标分析:在一张图片里面绘制2个折线图。

04 `matplotlib` 绘制散点图

目标介绍:根据数据在一张图片里面绘制出2个散点图。

05.01 `matplotlib` 绘制条形图

项目需求:假设你获取到了2017年内地电影票房前20的电影和电影的票房数据,绘制一个适合该数据的图形进行可视化处理。

1.条形图:数据是离散的采用条形图来绘制。

2.条形图:`bar`

 plt.bar(range(len(a)), b, width=0.3) # 首先先画一个图出来,将宽度绘制成0.3,默认情况下是1.

05.02 matplotlib绘制横条形图

目标介绍:紧接上文,对上面的代码进行升级改造。

05.03 matplotlib绘制多次条形图

项目需求:假设知道了三天不同电影的票房记录,绘制一个更加直观的条形图来表示数据。实则是在一个条形图里面绘制不同的数据信息即可。

1.根据x y轴的参数画出简单的图形。

2.发现画出来的图形与x轴对应不上,需要进行相关参数的调节:

 bar_width = 0.2 # 将每个第二个第三个条形图都往右移动0.2个单位即可
 x_14 = list(range(len(a)))
 x_15 = [i + bar_width for i in x_14]
 x_16 = [i + bar_width * 2 for i in x_14]

3.设置x轴的刻度,让电影名字实现居中处理:

 plt.xticks(x_15, a)

06.01 matplotlib绘制直方图

项目需求:假设获取到了250部电影的时长在列表 a 中,希望统计出来电影的时长分布状况(比如时长为100分钟到120分钟的电影的数量,出现的频率等等信息,如何进行呈现)。

一般遇到这种数据量比较大的时候,尽量采用直方图进行呈现。

06.02 matplotlib绘制统计好数据的直方图

07-12 本章节开始介绍`numpy`的相关用法及其项目案例,具体详细信息查看 numpy.md 文件。

13-28 本章节开始介绍`pandas`的相关用法及其项目案例,具体详细信息查看。

li199773/Data-Analysis

Folders and files

Latest commit

History

Repository files navigation

Data-Analysis:数据分析

经上一章节的数据爬虫的学习,本章节开始学习数据分析操作,包括matplotlib,numpy,pandas。本节讲解matplotlib用法和实例,numpy,pandas讲解参见下numpy.md文件和pandas.md文件

01 matplotlib基础绘图和调整x轴

相关介绍:

1.导入 matplotlib 模块

2.通常要通过figsize 设置图片的大小

3.开始绘图

注:1.我们可以使用 _xtick_label _ytick_label 对x轴和y轴进行设置,如果不进行设置的话,通过默认输出的值达不到我们的需求。

02.01 matplotlib 绘制 0-12 的气温图

目标分析:构建一个2小时的气温图。

相关介绍:

1.matplotlib 不显示中文的问题:需要导入包即可,相关的字体见下一节介绍,中文字体不是很多。

2.画出来的图片需要一步一步的去细致的调节。

3.x轴的调节(y轴也是同理)

4.进行稀疏操作,取步长

5.添加描述信息

02.02 查询 matplotlib 所有的字体

本节主要是对应上一节,使用相关代码查询机器自带的字体。(也可以从网上下载字体嵌入到Pycharm中)

03 matplotlib 绘制两个折线图

目标分析:在一张图片里面绘制2个折线图。

相关介绍:

1.跟在一张图片上面绘制1个折线图的思想是一样子的,只不过需要定义2个 y 轴的数据点。

2.为了使两条线看得更直观一些,在后面加上参数。

3.绘制一个网格可以使观看者看得更清晰一点。

4.添加图例(见自己和同桌那一栏 添加参数) 右上角会出现一个小的图例 默认在右上角进行显示 也可以在是左上角。

04 matplotlib 绘制散点图

目标介绍:根据数据在一张图片里面绘制出2个散点图。

相关介绍:

1.主要的思想其实跟在一张图片上绘制一个散点图是一样子的,只不过需要建立2个 y 轴的数据。

2.第二数据的x轴需要像右侧偏移。

3.使用 scatter 来绘制散点图

05.01 matplotlib 绘制条形图

项目需求:假设你获取到了2017年内地电影票房前20的电影和电影的票房数据,绘制一个适合该数据的图形进行可视化处理。

相关介绍:

1.条形图:数据是离散的采用条形图来绘制。

2.条形图:bar

05.02 matplotlib绘制横条形图

目标介绍:紧接上文,对上面的代码进行升级改造。

相关操作:

1.发现使用rotation旋转45度发现店也是显示不太完整,所以画出横条形图,即x y轴的数据进行调换即可。

2.横条形图:barh

05.03 matplotlib绘制多次条形图

项目需求:假设知道了三天不同电影的票房记录,绘制一个更加直观的条形图来表示数据。实则是在一个条形图里面绘制不同的数据信息即可。

1.根据x y轴的参数画出简单的图形。

2.发现画出来的图形与x轴对应不上,需要进行相关参数的调节:

3.设置x轴的刻度,让电影名字实现居中处理:

06.01 matplotlib绘制直方图

项目需求:假设获取到了250部电影的时长在列表 a 中,希望统计出来电影的时长分布状况(比如时长为100分钟到120分钟的电影的数量,出现的频率等等信息,如何进行呈现)。

一般遇到这种数据量比较大的时候,尽量采用直方图进行呈现。

相关操作:

1.一般需要数据量比较大的时候,我们可以进行在指定的区间内随机生成相应的数字。

2.plt.hist方法是那些没有统计过的数据,没有办法绘制直方图。所以要进行相应的处理。

3.计算相应的分组:

4.最后添加描述信息即可。

06.02 matplotlib绘制统计好数据的直方图

相关参数:

相关介绍:

1.可以看出x轴的数据并不是均等分割的,从一开始的每隔5进行分割,到最后的15和30。同样我们可以由组距更直观的看出。

2.条形图与直方图是有区别的。

07-12 本章节开始介绍numpy的相关用法及其项目案例,具体详细信息查看 numpy.md 文件。

13-28 本章节开始介绍pandas的相关用法及其项目案例,具体详细信息查看 。

About

Topics

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Languages

经上一章节的数据爬虫的学习,本章节开始学习数据分析操作,包括`matplotlib`,`numpy`,`pandas`。本节讲解`matplotlib`用法和实例,`numpy`,`pandas`讲解参见下`numpy.md`文件和`pandas.md`文件

01 `matplotlib`基础绘图和调整x轴

1.导入 `matplotlib` 模块

2.通常要通过`figsize` 设置图片的大小

注:1.我们可以使用 `_xtick_label` `_ytick_label` 对x轴和y轴进行设置,如果不进行设置的话,通过默认输出的值达不到我们的需求。

02.01 `matplotlib` 绘制 0-12 的气温图

1.`matplotlib` 不显示中文的问题:需要导入包即可,相关的字体见下一节介绍,中文字体不是很多。

02.02 查询 `matplotlib` 所有的字体

03 `matplotlib` 绘制两个折线图

4.添加图例(见自己和同桌那一栏添加参数) 右上角会出现一个小的图例默认在右上角进行显示也可以在是左上角。

04 `matplotlib` 绘制散点图

3.使用 `scatter` 来绘制散点图

05.01 `matplotlib` 绘制条形图

2.条形图:`bar`

1.发现使用`rotation`旋转45度发现店也是显示不太完整,所以画出横条形图,即x y轴的数据进行调换即可。

07-12 本章节开始介绍`numpy`的相关用法及其项目案例,具体详细信息查看 numpy.md 文件。

13-28 本章节开始介绍`pandas`的相关用法及其项目案例,具体详细信息查看。

Packages