请选择 进入手机版 | 继续访问电脑版

机器学习之“数据可视化”

AI-机器学习  / 只看大图  / 倒序浏览   © 著作权归作者本人所有

#楼主# 2020-1-16

跳转到指定楼层

如果只是单纯的给你一堆庞大的数字让你来进行分析,内心肯定是要崩溃的,尤其是对海量的数据集。如今有很多可视化工具,可以帮助我们从不同的维度来实现数据可视化,如各种BI系统,以及python的matplotlib等。


商业智能.jpeg


数据可视化的目的可以分为2类:一类是直接作为数据分析的过程(如机器学习过程中对数据集的观察),另一类是为了给别的用户呈现概况(数据类的项目,如百度统计)。所以数据可视化至少在以下3个方面达标:

1.数据清晰完整:没有遗漏也没有偏颇;

2.直观明确:图表传递的信息能够直达用户,不会让用户困扰;

3.美观精致:给用户以美感,制作美观、精致,更容易获得用户的信任度;


真正优秀的图表,可以自己说话,如下图所示:为外国图表专家AndrewAbela总结的图表选型指南

tubiao.jpeg


今天我们来解读以下这张图。

数据可视化,主要分为4类图表:比较、分布、构成、联系

第一类,比较:图表最主要的功能是表达出多个实体之间的对比度,能够直观的比较出差异,和优劣。基于时序的周期比较,需要体现出时间周期和类间对比;基于

第二类,分布:此类主要体现出各个突出要素的分布情况,图表中所体现的子类构成的集合可能不是全集,更多情况以数字的形式表示子类的构成情况。;

第三类,构成:更侧重于整体的构成情况,一般情况整体是一个全集,图表主要体现各个子类的占比情况,主要以百分比的形式来表示子类的构成。

第四类,联系:侧重于表达2个或2个以上因素之间的相互关系。





上一篇:机器学习的挑战:“坏数据”、“坏算法”!
下一篇:机器学习之“特征工程”
转播转播 分享淘帖
回复

使用道具

成为第一个回复人

AI产品经理
小黑屋|AI产品经理社 |京ICP备19051683号-1
Powered by 长弓PM   © 2019-2050