Finding duplicate files | Off Topic

You are not logged in. [Log In] empegbbs.com » Forums » General Discussion » Off Topic » Finding duplicate files

Topic Options

#322390 - 19/05/2009 13:02

Re: Finding duplicate files [Re: mlord]

mlord
carpal tunnel

Registered: 29/08/2000
Posts: 14526
Loc: Canada

Originally Posted By: mlord

Perhaps write a small bash/awk script to do the job?

Like this, perhaps?

Code:

#!/bin/bash
#
# Find all duplicate files within the current directory and subdirectories.
# Requires /bin/bash, find, sort, and gawk.
#

find . -type f -ls | sort -n -k 7 | gawk '

function is_identical(fname1,fname2,fsize) {
        if (fsize == 0)
                return 1
        return ! system("diff -q \"" fname1 "\" \"" fname2 "\" >/dev/null 2>&1")
}

function finddups(line,this_fsize) {
        for (i = 0; i < 10; ++i)
                gsub("^[^ ]*  *","",line)
        this_fname = line

        if (fsize != this_fsize) {
                if (fcount > 1) {
                        for (f1 = 1; f1 < fcount; ++f1) {
                                for (f2 = f1 + 1; f2 <= fcount; ++f2) {
                                        fname1 = fnames[f1]
                                        fname2 = fnames[f2]
                                        if (is_identical(fname1,fname2,fsize))
                                                printf "%s == %s\n", fname1, fname2
                                }
                        }
                }
                fcount = 0;
        }
        fsize = this_fsize
        fnames[++fcount] = this_fname
}

END {
        finddups("",-1)
}

{
        finddups($0,$7)
}'

Top

Previous Topic

Index

Next Topic

Entire topic
Subject	Posted by	Posted
Finding duplicate files	drakino	18/05/2009 00:42
Re: Finding duplicate files	Attack	18/05/2009 01:16
Re: Finding duplicate files	Dignan	18/05/2009 11:56
Re: Finding duplicate files	drakino	18/05/2009 13:37
Re: Finding duplicate files	Dignan	18/05/2009 14:22
Re: Finding duplicate files	Attack	18/05/2009 14:55
Re: Finding duplicate files	drakino	19/05/2009 00:20
Re: Finding duplicate files	mlord	19/05/2009 12:09
Re: Finding duplicate files	mlord	19/05/2009 13:02
Re: Finding duplicate files	mlord	20/05/2009 02:34
Re: Finding duplicate files	drakino	20/05/2009 11:14
Re: Finding duplicate files	peter	20/05/2009 11:40
Re: Finding duplicate files	mlord	20/05/2009 12:17
Re: Finding duplicate files	drakino	20/05/2009 13:42
Re: Finding duplicate files	wfaulk	20/05/2009 18:46