数据可视化之美 -- 读笔3
数据可视化之美 - 读书笔记三
搜索和发现是信息检索的两种方式。
搜索背后的系统可以相当复杂,每次动作都会影响之后的行为。复杂性的后果是系统变得难以解释。依赖性能指标来对检索结果进行量化评估。
理解系统行为另一种辅助方法是使用信息可视化。
大规模可视化
本章的可视化基于相似度原则:当两个事物被紧紧放置到一起的时候,人们往往认为他们属于一个组。
所以我们先定义事物之间的相似和不相似。可是是任何有道理的方面的定义。(比如用户对两个东西的打分是差不多的,他们就是相似的)
有了相似度,需要将他们坐标化。把相似度值转化为二维或者三维坐标。有两种方式:
使用一个公式,高维空间映射到二维或者三维空间
把各个事物看成图表节点,相似的连线,坐标化就是连接着的在相邻位置,不连接的放在不相邻位置
该可视化的问题:
不精确比较
人们不熟悉大规模可视化
涉及到高维数据集降维成二维或者三维,你不确定得到的结果是假象还是真实
社会关系图
爆炸的信息促使人们为了解释而更频繁的数据分析。除了使用数据,我们还要理解模式,识别游离点和发现差异。利用一些聚类算法可以得到稍微清晰些的社会关系图。:
统计和可视化结合可以给出优雅的数据分析探索的解决方案。
可视化简化了统计结果,统计学简化了对偶尔混杂的可视化的理解。
历史流
从维基百科的编辑数据中查找他的形成的原因和经过。
有用的是:
获取真实数据
尽早并经常进行可视化
注意更大范围的过程
分类数据:
如何描绘分类数据:
树形图
镶嵌图
并行集
并行集就是下面这个:
如果是两个维度的话,就是交叉表:
多维度就是树形图了:
动画
右图的动画左侧的动画效果好,他一次变化过程只改变了一个维度。
所以对于动画的可视化来说:
分段展示:一次展示太多会分散人们的注意力,应该分解成多个步骤
必要的移动:避免不必要的,没有意义的移动
人们在学会语言之前,先学会了微笑
转载请注明来源,欢迎对文章中的引用来源进行考证,欢迎指出任何有错误或不够清晰的表达。可以在下面评论区评论,也可以邮件至 981909093@qq.com
文章标题:数据可视化之美 -- 读笔3
文章字数:702
本文作者:泽鹿
发布时间:2019-08-28, 16:45:23
最后更新:2019-08-28, 16:45:23
原始链接:http://panyifei.github.io/2019/08/28/读书笔记/数据可视化之美/3/版权声明: "署名-非商用-相同方式共享 4.0" 转载请保留原文链接及作者。