Allow stage_biblios_file to take matcher id as parameter.
[wip/koha-chris_n.git] / misc / stage_biblios_file.pl
1 #!/usr/bin/perl
2
3 use strict;
4 BEGIN {
5     # find Koha's Perl modules
6     # test carefully before changing this
7     use FindBin;
8     eval { require "$FindBin::Bin/kohalib.pl" };
9 }
10
11 use C4::Context;
12 use C4::ImportBatch;
13 use C4::Matcher;
14 use Getopt::Long;
15
16 $| = 1;
17
18 # command-line parameters
19 my $match_bibs = 0;
20 my $add_items = 0;
21 my $input_file = "";
22 my $batch_comment = "";
23 my $want_help = 0;
24
25 my $result = GetOptions(
26     'file:s'        => \$input_file,
27     'match-bibs:s'    => \$match_bibs,
28     'add-items'     => \$add_items,
29     'comment:s'     => \$batch_comment,
30     'h|help'        => \$want_help
31 );
32
33 if (not $result or $input_file eq "" or $want_help) {
34     print_usage();
35     exit 0;
36 }
37
38 unless (-r $input_file) {
39     die "$0: cannot open input file $input_file: $!\n";
40 }
41
42 my $dbh = C4::Context->dbh;
43 $dbh->{AutoCommit} = 0;
44 process_batch($input_file, $match_bibs, $add_items, $batch_comment);
45 $dbh->commit();
46
47 exit 0;
48
49 sub process_batch {
50     my ($input_file, $match_bibs, $add_items, $batch_comment) = @_;
51
52     open IN, "<$input_file" or die "$0: cannot open input file $input_file: $!\n";
53     my $marc_records = "";
54     $/ = "\035";
55     my $num_input_records = 0;
56     while (<IN>) {
57         $marc_records .= $_; # FIXME - this sort of string concatenation
58                              # is probably rather inefficient
59         $num_input_records++;
60     }
61     close IN;
62
63     my $marc_flavor = C4::Context->preference('marcflavour');
64
65     print "... staging MARC records -- please wait\n";
66     my ($batch_id, $num_valid, $num_items, @import_errors) = 
67         BatchStageMarcRecords($marc_flavor, $marc_records, $input_file, $batch_comment, '', $add_items, 0,
68                               100, \&print_progress_and_commit);
69     print "... finished staging MARC records\n";
70
71     my $num_with_matches = 0;
72     if ($match_bibs) {
73         my $matcher = C4::Matcher->fetch($match_bibs) ;
74         if( ! defined $matcher) {
75                 $matcher = C4::Matcher->new('biblio');
76         $matcher->add_simple_matchpoint('isbn', 1000, '020', 'a', -1, 0, '');
77         $matcher->add_simple_required_check('245', 'a', -1, 0, '', 
78                                             '245', 'a', -1, 0, '');
79      } else {
80                  SetImportBatchMatcher($batch_id, $match_bibs);
81         }
82         print "... looking for matches with records already in database\n";
83         $num_with_matches = BatchFindBibDuplicates($batch_id, $matcher, 10, 100, \&print_progress_and_commit);
84         print "... finished looking for matches\n";
85     }
86
87     my $num_invalid_bibs = scalar(@import_errors);
88     print <<_SUMMARY_;
89
90 MARC record staging report
91 ------------------------------------
92 Input file:              $input_file
93 Number of input bibs:    $num_input_records
94 Number of valid bibs:    $num_valid
95 Number of invalid bibs:  $num_invalid_bibs
96 _SUMMARY_
97     if ($match_bibs) {
98         print "Number of bibs matched:  $num_with_matches\n";
99     } else {
100         print "Incoming bibs not matched against existing bibs (--match-bibs option not supplied)\n";
101     }
102     if ($add_items) {
103         print "Number of items parsed:  $num_items\n";
104     } else {
105         print "No items parsed (--add-items option not supplied)\n";
106     }
107
108     print "\n";
109     print "Batch number assigned:  $batch_id\n";
110     print "\n";
111 }
112
113 sub print_progress_and_commit {
114     my $recs = shift;
115     $dbh->commit();
116     print "... processed $recs records\n";
117 }
118
119 sub print_usage {
120     print <<_USAGE_;
121 $0: stage MARC bib file into reservoir.
122
123 Use this batch job to load a file of MARC bibliographic records
124 (with optional item information) into the Koha reservoir.
125
126 After running this program to stage your file, you can use
127 either the batch job commit_biblios_file.pl or the Koha
128 Tools option "Manage Staged MARC Records" to load the
129 records into the main Koha database.
130
131 Parameters:
132     --file <file_name>      name of input MARC bib file
133     --match-bibs <match_id> use this option to match bibs
134                             in the file with bibs already in 
135                             the database for future overlay.
136                             If <match_id> isn't defined, a default 
137                             MARC21 ISBN & title match rule will be applied.
138     --add-items             use this option to specify that
139                             item data is embedded in the MARC
140                             bibs and should be parsed.
141     --comment <comment>     optional comment to describe
142                             the record batch; if the comment
143                             has spaces in it, surround the
144                             comment with quotation marks.
145     --help or -h            show this message.
146 _USAGE_
147 }