• 欢迎访问搞代码网站,推荐使用最新版火狐浏览器和Chrome浏览器访问本网站!
  • 如果您觉得本站非常有看点,那么赶紧使用Ctrl+D 收藏搞代码吧

Python编程matplotlib绘图挑钻石seaborn小提琴和箱线图

python 搞代码 4年前 (2022-01-09) 32次浏览 已收录 0个评论
文章目录[隐藏]

想不到大家都这么喜欢用python给女朋友挑钻石,所以我又写了个续。

如果看过之前一篇用python给女朋友挑钻石的文章,那么可以直接从箱线图开始读。

seaborn是matplotlib的补充包,提供了一系列高颜值的figure,并且集成了多种在线数据集,通过sns.load_dataset()进行调用,可供学习,如果网络不稳定,可下载到本地,然后在调用的时候使用把cache设为True

其中,diamonds数据集中包含了钻石数据,总计十项,分别是[重量/克拉]carat、切割水平cut、颜色color、透明度clarity、深度depthtable、价格price以及x来&源gao@dai!ma.com搞$代^码%网yz方向的尺寸。

画图第一步就是导入包和数据。

import seaborn as sns
import matplotlib.pyplot as plt
# 本地加载数据集
dia = sns.load_dataset("diamonds",data_home="seaborn-data", cache=True)
# 以上几行代码后面不再重复书写

箱线图

现在我们想知道Premium, Fair, Very Good, Good, Ideal这五种切割方式所对应的价格区间,那么最直接的想法是做一个箱线图,就类似K线那种图。

这个图中,箱和线描述了五个统计量:最小非异常值、第一四分位数(25%)、中位数、第三四分位数(75%)以及非异常最大值。而最大值上面的那些点,则为异常值。可见,超过1.5万刀的钻石属于异类。

>>> sns.boxplot(x="cut",y="price",data=dia,color='lightblue',fliersize=0.25)
>>> plt.show()

其中,fliersize表示异常值的尺寸。

增强箱线图

箱线图尽管已经可以描述一定的分布特性,但是还不够,毕竟只有5个统计量。

sns中提供了增强版的箱线图:boxenplot

在这个图中,将价格区间进行了划分,每个价格区间中,箱子越宽则代表样本越多。

sns.boxenplot(x="cut",y="price",data=dia,
    palette="ch:rot=-.5,d=.3_r")
plt.show()

小提琴图

如果想再细致一点,那么就得用小提琴图了

sns.violinplot(x="cut",y="price",data=dia)
sns.despine(left=True)

这样一看,切割最好的钻石,价格区间竟然以1000左右为主,尽管离谱,但也很真实了。

以上就是Python编程matplotlib绘图挑钻石seaborn小提琴和箱线图的详细内容,更多关于matplotlib挑钻石seaborn小提琴和箱线图的资料请关注搞代码其它相关文章!


搞代码网(gaodaima.com)提供的所有资源部分来自互联网,如果有侵犯您的版权或其他权益,请说明详细缘由并提供版权或权益证明然后发送到邮箱[email protected],我们会在看到邮件的第一时间内为您处理,或直接联系QQ:872152909。本网站采用BY-NC-SA协议进行授权
转载请注明原文链接:Python编程matplotlib绘图挑钻石seaborn小提琴和箱线图

喜欢 (0)
[搞代码]
分享 (0)
发表我的评论
取消评论

表情 贴图 加粗 删除线 居中 斜体 签到

Hi,您需要填写昵称和邮箱!

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址