MySQL社区

 找回密码
 注册

QQ登录

只需一步,快速开始

扫一扫,访问微社区

搜索
查看: 2281|回复: 8
打印 上一主题 下一主题

[SQL类] 大量文本数据查找重复,效率很低,怎么办?

[复制链接]
1#
发表于 2015-7-16 11:01:34 | 显示全部楼层
content不要忘了加上前置索引。
说的这儿,多说两句,mediumtext这样的字段根本不建议去group by? 不就是为了找出重复大于2条以上的数据嘛
2#
发表于 2015-7-16 11:12:39 | 显示全部楼层
试试这个:
select `content` from db_news group by md5(content) having count(1) >= 2;

再不行就新建立个字段,专门放MD5值
还是关键列一定要有索引呀!

点评

牛人!!  发表于 2015-7-16 20:28
您需要登录后才可以回帖 登录 | 注册

本版积分规则

QQ|申请友链|小黑屋|Archiver|手机版|MySQL社区 ( 京ICP备07012489号   
联系人:周生; 联系电话:13911732319

GMT+8, 2024-5-4 10:11 , Processed in 0.065912 second(s), 23 queries , Gzip On.

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.

快速回复 返回顶部 返回列表