Bug 15188 - Fixes remove_unused_authorities.pl will delete all authorities if zebra...
[koha.git] / misc / migration_tools / remove_unused_authorities.pl
1 #!/usr/bin/perl
2
3 #script to administer Authorities without biblio
4
5 # Copyright 2009 BibLibre
6 # written 2009-05-04 by paul dot poulain at biblibre.com
7 #
8 # This file is part of Koha.
9 #
10 # Koha is free software; you can redistribute it and/or modify it
11 # under the terms of the GNU General Public License as published by
12 # the Free Software Foundation; either version 3 of the License, or
13 # (at your option) any later version.
14 #
15 # Koha is distributed in the hope that it will be useful, but
16 # WITHOUT ANY WARRANTY; without even the implied warranty of
17 # MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE. See the
18 # GNU General Public License for more details.
19 #
20 # You should have received a copy of the GNU General Public License
21 # along with Koha; if not, see <http://www.gnu.org/licenses>.
22
23 use strict;
24 use warnings;
25
26 use C4::Context;
27 use C4::AuthoritiesMarc;
28 use Getopt::Long;
29
30 my @authtypes;
31 my $want_help = 0;
32 my $test = 0;
33 GetOptions(
34     'aut|authtypecode:s' => \@authtypes,
35     't|test'             => \$test,
36     'h|help'             => \$want_help
37 );
38
39 if ($want_help) {
40     print_usage();
41     exit 0;
42 }
43
44 if ($test) {
45     print "testing only, authorities will not be deleted.\n";
46 }
47
48 if (C4::Context->Zconn("biblioserver",0)->errcode() == 10000) {
49     die "Zebra server seems not to be available. This script needs Zebra runs."
50 }
51
52 my $dbh=C4::Context->dbh;
53 my $thresholdmin=0;
54 my $thresholdmax=0;
55 my @results;
56 # prepare the request to retrieve all authorities of the requested types
57 my $rqsql = "SELECT * from auth_header where 1";
58 $rqsql .= " AND authtypecode IN (".join(",",map{$dbh->quote($_)}@authtypes).")" if @authtypes;
59 my $rqselect = $dbh->prepare($rqsql);
60 $|=1;
61
62 $rqselect->execute;
63 my $counter=0;
64 my $totdeleted=0;
65 my $totundeleted=0;
66 while (my $data=$rqselect->fetchrow_hashref){
67     my $query;
68     $query= "an=".$data->{'authid'};
69     # search for biblios mapped
70     my ($err,$res,$used) = C4::Search::SimpleSearch($query,0,10);
71     if (defined $err) {
72         warn "error: $err on search $query\n";
73         next;
74     }
75     print ".";
76     print "$counter\n" unless $counter++ % 100;
77     # if found, delete, otherwise, just count
78     if ($used>=$thresholdmin and $used<=$thresholdmax){
79         DelAuthority($data->{'authid'}) unless $test;
80         $totdeleted++;
81     } else {
82         $totundeleted++;
83     }
84 }
85
86 print "$counter authorities parsed, $totdeleted deleted and $totundeleted unchanged because used\n";
87
88
89 sub print_usage {
90     print <<_USAGE_;
91 $0: Remove unused authority records
92
93 This script removes authority records that do not have any biblio
94 records attached to them.
95
96 If the --aut option is supplied, only authority records of that
97 particular type will be checked for usage.  --aut can be repeated.
98
99 If --aut is not supplied, all authority records will be checked.
100
101 Use --test to perform a test run.  This script does not ask the
102 operator to confirm the deletion of each authority record.
103
104 parameters
105     --aut|authtypecode TYPE       the list of authtypes to check
106     --test or -t                  test mode, don't delete really, just count
107     --help or -h                  show this message.
108
109 _USAGE_
110 }