csdn泄漏密码分析
csdn密码泄漏,640万用户数据泄漏,对于在小公司的我,从没见过这么大数据量,于是非
常兴奋,迫不及待的想去操作一下如此大的表。
使用mysql,首先建表。
create database csdn; create table csdn( id int not null auto_increment, username varchar(100), passwd varchar(100), email varchar(100), primary key (id) )
接着导入表,由于泄漏的文件不是标准sql,只有三列,使用#隔开,因此使用load data infile方式。
load data local infile '/home/kaka/csdn.sql' into table csdn fields terminated by '#' (username,passwd,email);
导入成功,共有6428632条记录。
这么多条记录,访问起来十分慢,首先建几条索引(index)
create index passwd_index on csdn(passwd) using btree;
时间是
create index email_index on csdn(email) using btree;
用的时间更长,
排名第四的是dearbook,有4.6万人,我不清楚dearbook有何含义,知道的解释下吧。
以ilove**作为密码的共有12031个人。
2、没有重复的密码: