Python Pandas 如何shuffle（打乱）数据

这篇文章主要介绍了Python Pandas 如何shuffle（打乱）数据，文中通过示例代码介绍的非常详细，对大家的学习或者工作具有一定的参考学习价值，需要的朋友们下面随着小编来一起学习学习吧

在Python里面，使用Pandas里面的DataFrame来存放数据的时候想要把数据集进行shuffle会许多的方法，本文介绍两种比较常用而且简单的方法。

应用情景：

我们有下面以个DataFrame

我们可以看到BuyInter的数值是按照0,-1,-1,2,2,2,3,3,3,3这样排列的，我们希望不保持这个次序，但是同时列属性又不能改变，即如下

实现方法：

最简单的方法就是采用pandas中自带的 sample这个方法。

假设df是这个DataFrame

 df.sample(frac=1)

这样对来源gao@daima#com搞(%代@#码网可以对df进行shuffle。其中参数frac是要返回的比例，比如df中有10行数据，我只想返回其中的30%,那么frac=0.3。

有时候，我们可能需要打混后数据集的index（索引）还是按照正常的排序。我们只需要这样操作

 df.sample(frac=1).reset_index(drop=True)

————————————-分割线————————————————————–

其实，sklearn(机器学习的库）中也有shuffle的方法。

 from sklearn.utils import shuffle df = shuffle(df)

另外，numpy库中也有进行shuffle的方法（不建议）

 df.iloc[np.random.permutation(len(df))]

以上就是Python Pandas 如何shuffle（打乱）数据的详细内容，更多请关注gaodaima搞代码网其它相关文章！

搞代码网（gaodaima.com）提供的所有资源部分来自互联网，如果有侵犯您的版权或其他权益，请说明详细缘由并提供版权或权益证明然后发送到邮箱[email protected]‍，我们会在看到邮件的第一时间内为您处理，或直接联系QQ：872152909。本网站采用BY-NC-SA协议进行授权
转载请注明原文链接：Python Pandas 如何shuffle（打乱）数据

Hi，您需要填写昵称和邮箱！