md`# **可视化实验报告**
班级:18.数据
学号:201818130191
姓名:廖承茂
# 前言
<font color=#999AAA > &本次实验选取的数据集是2017年美国每日天气,该数据集包含由NOAA每日全球历史气候学网络提供的2017年美国每日气象数据。</font>
数据详细情况:
- PRCP =降水量(英寸)
- SNOW =降雪量(英寸)
- SNWD =雪深(英寸)
- TMAX =最高温度(F)
- TMIN =最低温度(F)
- TAVG =平均温度(F)
- AWND =日平均风速(英里/小时)
- WSF5 =最快的5秒风速(英里/小时)
- WDF5 =最快5秒风向(度)
# 一、初始调查问题
1. 2017年美国的温度情况
2. 2017年美国各州的降水情况
3. 2017年美国的降雪,风力等情况
4. 该数据集中能发现那些特殊值,通过可视化的方式,我们能发现什么有效的信息
# 二、探索性视觉分析
## 1.初步分析
  由于Tableau这款软件操作简单易学,而且功能强大,计算迅速,而且还兼具文字云,回归分析,时间序列等功能,而且有免费版本,我决定使用Tableau来完成设计。作为一款帮助使用者提升业务分析能力和业务洞察力的工具,能够根据不同的业务需求,选用不同的视图来更好的展现并分析数据,因此在制作每一份分析报表时,布局的设计,视觉编码,都显得极为重要。
  查看本次数据集后发现存在空值,不利于可视化的效果,便利用python对数据进行清洗,后将对美国2017年的温度、降水量、风雪情况进行可视化的分析
## 2.可视化分析
- 温度:
<center>
<figure>
<img src="https://img-blog.csdnimg.cn/20201023201310981.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3FxXzQzNjM2NDQy,size_16,color_FFFFFF,t_70#pic_center" />
<img src="https://img-blog.csdnimg.cn/20201023201332761.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3FxXzQzNjM2NDQy,size_16,color_FFFFFF,t_70#pic_center" />
</figure>
</center>
上图为美国2017年最高温度和最低温度的可视化,通过对美国2017年的相关系数进一步可视化:
<center>
<figure>
<img src="https://img-blog.csdnimg.cn/20201023202428950.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3FxXzQzNjM2NDQy,size_16,color_FFFFFF,t_70#pic_center" />
</figure>
</center>
  通过上面的可视化图片可以看出2017年1~9月份美国各州的平均温差并不大,并且平均温度都很高,通过可视化进一步得出:美国2017年1~9月份的温度很高,平均最高温度出现在七月份。高温地区主要集中在美国南部,由南向北递减,但总体温度都很高。
- 降水量
<center>
<figure>
<img src="https://img-blog.csdnimg.cn/20201023204441894.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3FxXzQzNjM2NDQy,size_16,color_FFFFFF,t_70#pic_center" />
<img src="https://img-blog.csdnimg.cn/20201023204517409.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3FxXzQzNjM2NDQy,size_16,color_FFFFFF,t_70#pic_center" />
</figure>
</center>
  通过上面的两组可视化方案,可以看出,在一月份时,美国加州降水量特别大,恐造成部分地区洪灾。而通过可视化地图的方案可看出总体上美国年降水量的主要分布特征是:大致由东部沿海、西部沿海向内陆减少。
下图为美国各月份的降水量与风力情况的折线图,可进一步得出美国2017年一二月份遭遇了强降雨且和暴风。
<center>
<figure>
<img src="https://img-blog.csdnimg.cn/20201023205832925.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3FxXzQzNjM2NDQy,size_16,color_FFFFFF,t_70#pic_centerr" />
</figure>
</center>
- 降雪与积雪
<center>
<figure>
<img src="https://img-blog.csdnimg.cn/20201023205814215.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3FxXzQzNjM2NDQy,size_16,color_FFFFFF,t_70#pic_center" />
</figure>
</figure>
<img src="https://img-blog.csdnimg.cn/20201023210346274.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3FxXzQzNjM2NDQy,size_16,color_FFFFFF,t_70#pic_center" />
</figure>
</center>
  通过上面两张可视化图片,美国东北部遭遇2017年冬季最严重的暴风雪袭击,新英格兰地带的降雪量高达19英寸。从纽约上州到缅因州北部都被下发了冬季风暴警告,部分地区降雪量介于8英寸到16英寸之间,有些地区还出现暴风雪天气,降雪量将高达2英尺。结合风力情况(后文有可视化)纽约上州到缅因州北部一带还将出现高达50英里/小时的狂风。由于强风,强降雪等因素,2017年的暴风雪异常危险。
- 风
<center>
<figure>
<img src="https://img-blog.csdnimg.cn/20201023211653928.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3FxXzQzNjM2NDQy,size_16,color_FFFFFF,t_70#pic_center" />
</figure>
<figure>
<img src="https://img-blog.csdnimg.cn/20201023211048580.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3FxXzQzNjM2NDQy,size_16,color_FFFFFF,t_70#pic_center" />
</figure>
</center>
  通过对八九月份风力情况的可视化,2017年8月25日风力值极大,可看出出现飓风灾害,飓风以130英里/小时的风速登陆得州,结合降水量可视化图片出现的小高峰,可分析出许多地方遭遇毁灭性洪水和破坏。同年九月份另一个强烈飓风登陆佛州,而这次的飓风甚至比八月份的飓风更强,让这里变成人间地狱,威力强大的飓风会对加勒比海东部许多地区构成威胁。
# 总结
- 综上,可分析出美国的2017年可谓是躲在多难的一年。
- tableau的学习心得:
  与其他的可视化软件相比,功能算不上强大,但是非常实用,数据可视化效果简介明了易于分析,报表清晰易读。基于地图的数据可视化功能也非常强大(地图数据的细节处理尚需进一步明确,如任意地图的导入和使用方法等。)。虽然数据处理功能中没有SPSS强大的数理统计功能,但是在基础的数据分析,如趋势分析,统计预测等功能上做的很到位。可视化效果不华丽但很出色,没有3D或其他立体效果视图。同时因为其易用性,使得使用者在对数据进行相对基础的处理时效率很高。
  其易用性在一定程度上对数据本身产生了一定的限制,亦即软件要求数据表本身是非常规范,清析的。换一种方式来说,如果Tableau的数据可视化处理结果非常理想,也就说明了数据本身的收集和处理工作也很规范。二次开发的拓展性尚不明确。
`