oracle 删除大表内的重复数据

因为一些原因数据库中的一张表（2kw+数据）没有建立主键，并且随着时间的增加产生了大量的重复数据，我通过以下方式进行数据去重：原理：即使是所有业务字段都一样的两条数据他的rowid也是不一样的。首先按照业务要求找出哪些字段重复的算重复数据，我是这

因为一些原因数据库中的一张表（2kw+数据）没有建立主键，并且随着时间的增加产生了大量的重复数据，我通过以下方式进行数据去重：

原理：即使是所有业务字段都一样的两条数据他的rowid也是不一样的。

首先按照业务要求找出哪些字段重复的算重复数据，我是这样的，以下字段全部一致就认为是重复数据： hphm,hpzl,wfsj,wfxw,jszh
表名：VIOLATION_USE

此表为分区表，查此表分区详情：

SELECT * FROM USER_TAB_PARTITIONS WHERE TABLE_NAME =’VIOLATION_USE’;

查询表使用的分区

可以看到此表有10个分区：SYS_P51 – SYS_P60;

查询重复数据里的最大的rowid，然后删除rowid 在里面的数据，因为是分区表所以可以分区操作，否则时间会非常长（ps我在服务器上操作一晚上也没成功）：

delete from violation_use PARTITION(SYS_P51) where rowid in (select rid from (select max(rowid) rid,count(*)from violation_usegroup by hphm,hpzl,wfsj,wfxw,jszhhaving count(*)>1) );

重复执行直到删除所有重复数据。

本文来源gaodai#ma#com搞@@代~&码网^

原文地址：oracle 删除大表内的重复数据, 感谢原作者分享。

搞代码网（gaodaima.com）提供的所有资源部分来自互联网，如果有侵犯您的版权或其他权益，请说明详细缘由并提供版权或权益证明然后发送到邮箱[email protected]‍，我们会在看到邮件的第一时间内为您处理，或直接联系QQ：872152909。本网站采用BY-NC-SA协议进行授权
转载请注明原文链接：oracle 删除大表内的重复数据

Hi，您需要填写昵称和邮箱！