(bug #4020) XSLT unimarc display
[koha.git] / C4 / Search.pm
1 package C4::Search;
2
3 # This file is part of Koha.
4 #
5 # Koha is free software; you can redistribute it and/or modify it under the
6 # terms of the GNU General Public License as published by the Free Software
7 # Foundation; either version 2 of the License, or (at your option) any later
8 # version.
9 #
10 # Koha is distributed in the hope that it will be useful, but WITHOUT ANY
11 # WARRANTY; without even the implied warranty of MERCHANTABILITY or FITNESS FOR
12 # A PARTICULAR PURPOSE.  See the GNU General Public License for more details.
13 #
14 # You should have received a copy of the GNU General Public License along with
15 # Koha; if not, write to the Free Software Foundation, Inc., 59 Temple Place,
16 # Suite 330, Boston, MA  02111-1307 USA
17
18 use strict;
19 # use warnings; # FIXME
20 require Exporter;
21 use C4::Context;
22 use C4::Biblio;    # GetMarcFromKohaField, GetBiblioData
23 use C4::Koha;      # getFacets
24 use Lingua::Stem;
25 use C4::Search::PazPar2;
26 use XML::Simple;
27 use C4::Dates qw(format_date);
28 use C4::XSLT;
29 use C4::Branch;
30 use C4::Debug;
31 use YAML;
32 use URI::Escape;
33
34 use vars qw($VERSION @ISA @EXPORT @EXPORT_OK %EXPORT_TAGS $DEBUG);
35
36 # set the version for version checking
37 BEGIN {
38     $VERSION = 3.01;
39     $DEBUG = ($ENV{DEBUG}) ? 1 : 0;
40 }
41
42 =head1 NAME
43
44 C4::Search - Functions for searching the Koha catalog.
45
46 =head1 SYNOPSIS
47
48 See opac/opac-search.pl or catalogue/search.pl for example of usage
49
50 =head1 DESCRIPTION
51
52 This module provides searching functions for Koha's bibliographic databases
53
54 =head1 FUNCTIONS
55
56 =cut
57
58 @ISA    = qw(Exporter);
59 @EXPORT = qw(
60   &FindDuplicate
61   &SimpleSearch
62   &searchResults
63   &getRecords
64   &buildQuery
65   &NZgetRecords
66   &AddSearchHistory
67   &GetDistinctValues
68   &BiblioAddAuthorities
69 );
70 #FIXME: i had to add BiblioAddAuthorities here because in Biblios.pm it caused circular dependencies (C4::Search uses C4::Biblio, and BiblioAddAuthorities uses SimpleSearch from C4::Search)
71
72 # make all your functions, whether exported or not;
73
74 =head2 FindDuplicate
75
76 ($biblionumber,$biblionumber,$title) = FindDuplicate($record);
77
78 This function attempts to find duplicate records using a hard-coded, fairly simplistic algorithm
79
80 =cut
81
82 sub FindDuplicate {
83     my ($record) = @_;
84     my $dbh = C4::Context->dbh;
85     my $result = TransformMarcToKoha( $dbh, $record, '' );
86     my $sth;
87     my $query;
88     my $search;
89     my $type;
90     my ( $biblionumber, $title );
91
92     # search duplicate on ISBN, easy and fast..
93     # ... normalize first
94     if ( $result->{isbn} ) {
95         $result->{isbn} =~ s/\(.*$//;
96         $result->{isbn} =~ s/\s+$//;
97         $query = "isbn=$result->{isbn}";
98     }
99     else {
100         $result->{title} =~ s /\\//g;
101         $result->{title} =~ s /\"//g;
102         $result->{title} =~ s /\(//g;
103         $result->{title} =~ s /\)//g;
104
105         # FIXME: instead of removing operators, could just do
106         # quotes around the value
107         $result->{title} =~ s/(and|or|not)//g;
108         $query = "ti,ext=$result->{title}";
109         $query .= " and itemtype=$result->{itemtype}"
110           if ( $result->{itemtype} );
111         if   ( $result->{author} ) {
112             $result->{author} =~ s /\\//g;
113             $result->{author} =~ s /\"//g;
114             $result->{author} =~ s /\(//g;
115             $result->{author} =~ s /\)//g;
116
117             # remove valid operators
118             $result->{author} =~ s/(and|or|not)//g;
119             $query .= " and au,ext=$result->{author}";
120         }
121     }
122
123     # FIXME: add error handling
124     my ( $error, $searchresults ) = SimpleSearch($query); # FIXME :: hardcoded !
125     my @results;
126     foreach my $possible_duplicate_record (@$searchresults) {
127         my $marcrecord =
128           MARC::Record->new_from_usmarc($possible_duplicate_record);
129         my $result = TransformMarcToKoha( $dbh, $marcrecord, '' );
130
131         # FIXME :: why 2 $biblionumber ?
132         if ($result) {
133             push @results, $result->{'biblionumber'};
134             push @results, $result->{'title'};
135         }
136     }
137     return @results;
138 }
139
140 =head2 SimpleSearch
141
142 ( $error, $results, $total_hits ) = SimpleSearch( $query, $offset, $max_results, [@servers] );
143
144 This function provides a simple search API on the bibliographic catalog
145
146 =over 2
147
148 =item C<input arg:>
149
150     * $query can be a simple keyword or a complete CCL query
151     * @servers is optional. Defaults to biblioserver as found in koha-conf.xml
152     * $offset - If present, represents the number of records at the beggining to omit. Defaults to 0
153     * $max_results - if present, determines the maximum number of records to fetch. undef is All. defaults to undef.
154
155
156 =item C<Output:>
157
158     * $error is a empty unless an error is detected
159     * \@results is an array of records.
160     * $total_hits is the number of hits that would have been returned with no limit
161
162 =item C<usage in the script:>
163
164 =back
165
166 my ( $error, $marcresults, $total_hits ) = SimpleSearch($query);
167
168 if (defined $error) {
169     $template->param(query_error => $error);
170     warn "error: ".$error;
171     output_html_with_http_headers $input, $cookie, $template->output;
172     exit;
173 }
174
175 my $hits = scalar @$marcresults;
176 my @results;
177
178 for my $i (0..$hits) {
179     my %resultsloop;
180     my $marcrecord = MARC::File::USMARC::decode($marcresults->[$i]);
181     my $biblio = TransformMarcToKoha(C4::Context->dbh,$marcrecord,'');
182
183     #build the hash for the template.
184     $resultsloop{title}           = $biblio->{'title'};
185     $resultsloop{subtitle}        = $biblio->{'subtitle'};
186     $resultsloop{biblionumber}    = $biblio->{'biblionumber'};
187     $resultsloop{author}          = $biblio->{'author'};
188     $resultsloop{publishercode}   = $biblio->{'publishercode'};
189     $resultsloop{publicationyear} = $biblio->{'publicationyear'};
190
191     push @results, \%resultsloop;
192 }
193
194 $template->param(result=>\@results);
195
196 =cut
197
198 sub SimpleSearch {
199     my ( $query, $offset, $max_results, $servers )  = @_;
200
201     if ( C4::Context->preference('NoZebra') ) {
202         my $result = NZorder( NZanalyse($query) )->{'biblioserver'};
203         my $search_result =
204           (      $result->{hits}
205               && $result->{hits} > 0 ? $result->{'RECORDS'} : [] );
206         return ( undef, $search_result, scalar($result->{hits}) );
207     }
208     else {
209         # FIXME hardcoded value. See catalog/search.pl & opac-search.pl too.
210         my @servers = defined ( $servers ) ? @$servers : ( "biblioserver" );
211         my @results;
212         my @zoom_queries;
213         my @tmpresults;
214         my @zconns;
215         my $total_hits;
216         return ( "No query entered", undef, undef ) unless $query;
217
218         # Initialize & Search Zebra
219         for ( my $i = 0 ; $i < @servers ; $i++ ) {
220             eval {
221                 $zconns[$i] = C4::Context->Zconn( $servers[$i], 1 );
222                 $zoom_queries[$i] = new ZOOM::Query::CCL2RPN( $query, $zconns[$i]);
223                 $tmpresults[$i] = $zconns[$i]->search( $zoom_queries[$i] );
224
225                 # error handling
226                 my $error =
227                     $zconns[$i]->errmsg() . " ("
228                   . $zconns[$i]->errcode() . ") "
229                   . $zconns[$i]->addinfo() . " "
230                   . $zconns[$i]->diagset();
231
232                 return ( $error, undef, undef ) if $zconns[$i]->errcode();
233             };
234             if ($@) {
235
236                 # caught a ZOOM::Exception
237                 my $error =
238                     $@->message() . " ("
239                   . $@->code() . ") "
240                   . $@->addinfo() . " "
241                   . $@->diagset();
242                 warn $error;
243                 return ( $error, undef, undef );
244             }
245         }
246         while ( ( my $i = ZOOM::event( \@zconns ) ) != 0 ) {
247             my $event = $zconns[ $i - 1 ]->last_event();
248             if ( $event == ZOOM::Event::ZEND ) {
249
250                 my $first_record = defined( $offset ) ? $offset+1 : 1;
251                 my $hits = $tmpresults[ $i - 1 ]->size();
252                 $total_hits += $hits;
253                 my $last_record = $hits;
254                 if ( defined $max_results && $offset + $max_results < $hits ) {
255                     $last_record  = $offset + $max_results;
256                 }
257
258                 for my $j ( $first_record..$last_record ) {
259                     my $record = $tmpresults[ $i - 1 ]->record( $j-1 )->raw(); # 0 indexed
260                     push @results, $record;
261                 }
262             }
263         }
264
265         foreach my $result (@tmpresults) {
266             $result->destroy();
267         }
268         foreach my $zoom_query (@zoom_queries) {
269             $zoom_query->destroy();
270         }
271
272         return ( undef, \@results, $total_hits );
273     }
274 }
275
276 =head2 getRecords
277
278 ( undef, $results_hashref, \@facets_loop ) = getRecords (
279
280         $koha_query,       $simple_query, $sort_by_ref,    $servers_ref,
281         $results_per_page, $offset,       $expanded_facet, $branches,
282         $query_type,       $scan
283     );
284
285 The all singing, all dancing, multi-server, asynchronous, scanning,
286 searching, record nabbing, facet-building
287
288 See verbse embedded documentation.
289
290 =cut
291
292 sub getRecords {
293     my (
294         $koha_query,       $simple_query, $sort_by_ref,    $servers_ref,
295         $results_per_page, $offset,       $expanded_facet, $branches,
296         $query_type,       $scan
297     ) = @_;
298
299     my @servers = @$servers_ref;
300     my @sort_by = @$sort_by_ref;
301
302     # Initialize variables for the ZOOM connection and results object
303     my $zconn;
304     my @zconns;
305     my @results;
306     my $results_hashref = ();
307
308     # Initialize variables for the faceted results objects
309     my $facets_counter = ();
310     my $facets_info    = ();
311     my $facets         = getFacets();
312
313     my @facets_loop;    # stores the ref to array of hashes for template facets loop
314
315     ### LOOP THROUGH THE SERVERS
316     for ( my $i = 0 ; $i < @servers ; $i++ ) {
317         $zconns[$i] = C4::Context->Zconn( $servers[$i], 1 );
318
319 # perform the search, create the results objects
320 # if this is a local search, use the $koha-query, if it's a federated one, use the federated-query
321         my $query_to_use = ($servers[$i] =~ /biblioserver/) ? $koha_query : $simple_query;
322
323         #$query_to_use = $simple_query if $scan;
324         warn $simple_query if ( $scan and $DEBUG );
325
326         # Check if we've got a query_type defined, if so, use it
327         eval {
328             if ($query_type) {
329                 if ($query_type =~ /^ccl/) {
330                     $query_to_use =~ s/\:/\=/g;    # change : to = last minute (FIXME)
331                     $results[$i] = $zconns[$i]->search(new ZOOM::Query::CCL2RPN($query_to_use, $zconns[$i]));
332                 } elsif ($query_type =~ /^cql/) {
333                     $results[$i] = $zconns[$i]->search(new ZOOM::Query::CQL($query_to_use, $zconns[$i]));
334                 } elsif ($query_type =~ /^pqf/) {
335                     $results[$i] = $zconns[$i]->search(new ZOOM::Query::PQF($query_to_use, $zconns[$i]));
336                 } else {
337                     warn "Unknown query_type '$query_type'.  Results undetermined.";
338                 }
339             } elsif ($scan) {
340                     $results[$i] = $zconns[$i]->scan(  new ZOOM::Query::CCL2RPN($query_to_use, $zconns[$i]));
341             } else {
342                     $results[$i] = $zconns[$i]->search(new ZOOM::Query::CCL2RPN($query_to_use, $zconns[$i]));
343             }
344         };
345         if ($@) {
346             warn "WARNING: query problem with $query_to_use " . $@;
347         }
348
349         # Concatenate the sort_by limits and pass them to the results object
350         # Note: sort will override rank
351         my $sort_by;
352         foreach my $sort (@sort_by) {
353             if ( $sort eq "author_az" ) {
354                 $sort_by .= "1=1003 <i ";
355             }
356             elsif ( $sort eq "author_za" ) {
357                 $sort_by .= "1=1003 >i ";
358             }
359             elsif ( $sort eq "popularity_asc" ) {
360                 $sort_by .= "1=9003 <i ";
361             }
362             elsif ( $sort eq "popularity_dsc" ) {
363                 $sort_by .= "1=9003 >i ";
364             }
365             elsif ( $sort eq "call_number_asc" ) {
366                 $sort_by .= "1=20  <i ";
367             }
368             elsif ( $sort eq "call_number_dsc" ) {
369                 $sort_by .= "1=20 >i ";
370             }
371             elsif ( $sort eq "pubdate_asc" ) {
372                 $sort_by .= "1=31 <i ";
373             }
374             elsif ( $sort eq "pubdate_dsc" ) {
375                 $sort_by .= "1=31 >i ";
376             }
377             elsif ( $sort eq "acqdate_asc" ) {
378                 $sort_by .= "1=32 <i ";
379             }
380             elsif ( $sort eq "acqdate_dsc" ) {
381                 $sort_by .= "1=32 >i ";
382             }
383             elsif ( $sort eq "title_az" ) {
384                 $sort_by .= "1=4 <i ";
385             }
386             elsif ( $sort eq "title_za" ) {
387                 $sort_by .= "1=4 >i ";
388             }
389             else {
390                 warn "Ignoring unrecognized sort '$sort' requested" if $sort_by;
391             }
392         }
393         if ($sort_by) {
394             if ( $results[$i]->sort( "yaz", $sort_by ) < 0 ) {
395                 warn "WARNING sort $sort_by failed";
396             }
397         }
398     }    # finished looping through servers
399
400     # The big moment: asynchronously retrieve results from all servers
401     while ( ( my $i = ZOOM::event( \@zconns ) ) != 0 ) {
402         my $ev = $zconns[ $i - 1 ]->last_event();
403         if ( $ev == ZOOM::Event::ZEND ) {
404             next unless $results[ $i - 1 ];
405             my $size = $results[ $i - 1 ]->size();
406             if ( $size > 0 ) {
407                 my $results_hash;
408
409                 # loop through the results
410                 $results_hash->{'hits'} = $size;
411                 my $times;
412                 if ( $offset + $results_per_page <= $size ) {
413                     $times = $offset + $results_per_page;
414                 }
415                 else {
416                     $times = $size;
417                 }
418                 for ( my $j = $offset ; $j < $times ; $j++ ) {
419                     my $records_hash;
420                     my $record;
421                     my $facet_record;
422
423                     ## Check if it's an index scan
424                     if ($scan) {
425                         my ( $term, $occ ) = $results[ $i - 1 ]->term($j);
426
427                  # here we create a minimal MARC record and hand it off to the
428                  # template just like a normal result ... perhaps not ideal, but
429                  # it works for now
430                         my $tmprecord = MARC::Record->new();
431                         $tmprecord->encoding('UTF-8');
432                         my $tmptitle;
433                         my $tmpauthor;
434
435                 # the minimal record in author/title (depending on MARC flavour)
436                         if (C4::Context->preference("marcflavour") eq "UNIMARC") {
437                             $tmptitle = MARC::Field->new('200',' ',' ', a => $term, f => $occ);
438                             $tmprecord->append_fields($tmptitle);
439                         } else {
440                             $tmptitle  = MARC::Field->new('245',' ',' ', a => $term,);
441                             $tmpauthor = MARC::Field->new('100',' ',' ', a => $occ,);
442                             $tmprecord->append_fields($tmptitle);
443                             $tmprecord->append_fields($tmpauthor);
444                         }
445                         $results_hash->{'RECORDS'}[$j] = $tmprecord->as_usmarc();
446                     }
447
448                     # not an index scan
449                     else {
450                         $record = $results[ $i - 1 ]->record($j)->raw();
451                         warn $results[$i-1]->record($j)->render() ;
452
453                         # warn "RECORD $j:".$record;
454                         $results_hash->{'RECORDS'}[$j] = $record;
455
456             # Fill the facets while we're looping, but only for the biblioserver
457                         $facet_record = MARC::Record->new_from_usmarc($record)
458                           if $servers[ $i - 1 ] =~ /biblioserver/;
459
460                     #warn $servers[$i-1]."\n".$record; #.$facet_record->title();
461                         if ($facet_record) {
462                             for ( my $k = 0 ; $k <= @$facets ; $k++ ) {
463                                 ($facets->[$k]) or next;
464                                 my @fields = map {$facet_record->field($_)} @{$facets->[$k]->{'tags'}} ;
465                                 for my $field (@fields) {
466                                     my @subfields = $field->subfields();
467                                     for my $subfield (@subfields) {
468                                         my ( $code, $data ) = @$subfield;
469                                         ($code eq $facets->[$k]->{'subfield'}) or next;
470                                         $facets_counter->{ $facets->[$k]->{'link_value'} }->{$data}++;
471                                     }
472                                 }
473                                 $facets_info->{ $facets->[$k]->{'link_value'} }->{'label_value'} =
474                                     $facets->[$k]->{'label_value'};
475                                 $facets_info->{ $facets->[$k]->{'link_value'} }->{'expanded'} =
476                                     $facets->[$k]->{'expanded'};
477                             }
478                         }
479                     }
480                 }
481                 $results_hashref->{ $servers[ $i - 1 ] } = $results_hash;
482             }
483
484             # warn "connection ", $i-1, ": $size hits";
485             # warn $results[$i-1]->record(0)->render() if $size > 0;
486
487             # BUILD FACETS
488             if ( $servers[ $i - 1 ] =~ /biblioserver/ ) {
489                 for my $link_value (
490                     sort { $facets_counter->{$b} <=> $facets_counter->{$a} }
491                         keys %$facets_counter )
492                 {
493                     my $expandable;
494                     my $number_of_facets;
495                     my @this_facets_array;
496                     for my $one_facet (
497                         sort {
498                              $facets_counter->{$link_value}->{$b}
499                          <=> $facets_counter->{$link_value}->{$a}
500                         } keys %{ $facets_counter->{$link_value} }
501                       )
502                     {
503                         $number_of_facets++;
504                         if (   ( $number_of_facets < 6 )
505                             || ( $expanded_facet eq $link_value )
506                             || ( $facets_info->{$link_value}->{'expanded'} ) )
507                         {
508
509                       # Sanitize the link value ), ( will cause errors with CCL,
510                             my $facet_link_value = $one_facet;
511                             $facet_link_value =~ s/(\(|\))/ /g;
512
513                             # fix the length that will display in the label,
514                             my $facet_label_value = $one_facet;
515                             $facet_label_value =
516                               substr( $one_facet, 0, 20 ) . "..."
517                               unless length($facet_label_value) <= 20;
518
519                             # if it's a branch, label by the name, not the code,
520                             if ( $link_value =~ /branch/ ) {
521                                                                 if (defined $branches
522                                                                         && ref($branches) eq "HASH"
523                                                                         && defined $branches->{$one_facet}
524                                                                         && ref ($branches->{$one_facet}) eq "HASH")
525                                                                 {
526                                         $facet_label_value =
527                                                 $branches->{$one_facet}->{'branchname'};
528                                                                 }
529                                                                 else {
530                                                                         $facet_label_value = "*";
531                                                                 }
532                             }
533
534                             # but we're down with the whole label being in the link's title.
535                             push @this_facets_array, {
536                                 facet_count       => $facets_counter->{$link_value}->{$one_facet},
537                                 facet_label_value => $facet_label_value,
538                                 facet_title_value => $one_facet,
539                                 facet_link_value  => $facet_link_value,
540                                 type_link_value   => $link_value,
541                             };
542                         }
543                     }
544
545                     # handle expanded option
546                     unless ( $facets_info->{$link_value}->{'expanded'} ) {
547                         $expandable = 1
548                           if ( ( $number_of_facets > 6 )
549                             && ( $expanded_facet ne $link_value ) );
550                     }
551                     push @facets_loop, {
552                         type_link_value => $link_value,
553                         type_id         => $link_value . "_id",
554                         "type_label_" . $facets_info->{$link_value}->{'label_value'} => 1,
555                         facets     => \@this_facets_array,
556                         expandable => $expandable,
557                         expand     => $link_value,
558                     } unless ( ($facets_info->{$link_value}->{'label_value'} =~ /Libraries/) and (C4::Context->preference('singleBranchMode')) );
559                 }
560             }
561         }
562     }
563     return ( undef, $results_hashref, \@facets_loop );
564 }
565
566 sub pazGetRecords {
567     my (
568         $koha_query,       $simple_query, $sort_by_ref,    $servers_ref,
569         $results_per_page, $offset,       $expanded_facet, $branches,
570         $query_type,       $scan
571     ) = @_;
572
573     my $paz = C4::Search::PazPar2->new(C4::Context->config('pazpar2url'));
574     $paz->init();
575     $paz->search($simple_query);
576     sleep 1;   # FIXME: WHY?
577
578     # do results
579     my $results_hashref = {};
580     my $stats = XMLin($paz->stat);
581     my $results = XMLin($paz->show($offset, $results_per_page, 'work-title:1'), forcearray => 1);
582
583     # for a grouped search result, the number of hits
584     # is the number of groups returned; 'bib_hits' will have
585     # the total number of bibs.
586     $results_hashref->{'biblioserver'}->{'hits'} = $results->{'merged'}->[0];
587     $results_hashref->{'biblioserver'}->{'bib_hits'} = $stats->{'hits'};
588
589     HIT: foreach my $hit (@{ $results->{'hit'} }) {
590         my $recid = $hit->{recid}->[0];
591
592         my $work_title = $hit->{'md-work-title'}->[0];
593         my $work_author;
594         if (exists $hit->{'md-work-author'}) {
595             $work_author = $hit->{'md-work-author'}->[0];
596         }
597         my $group_label = (defined $work_author) ? "$work_title / $work_author" : $work_title;
598
599         my $result_group = {};
600         $result_group->{'group_label'} = $group_label;
601         $result_group->{'group_merge_key'} = $recid;
602
603         my $count = 1;
604         if (exists $hit->{count}) {
605             $count = $hit->{count}->[0];
606         }
607         $result_group->{'group_count'} = $count;
608
609         for (my $i = 0; $i < $count; $i++) {
610             # FIXME -- may need to worry about diacritics here
611             my $rec = $paz->record($recid, $i);
612             push @{ $result_group->{'RECORDS'} }, $rec;
613         }
614
615         push @{ $results_hashref->{'biblioserver'}->{'GROUPS'} }, $result_group;
616     }
617
618     # pass through facets
619     my $termlist_xml = $paz->termlist('author,subject');
620     my $terms = XMLin($termlist_xml, forcearray => 1);
621     my @facets_loop = ();
622     #die Dumper($results);
623 #    foreach my $list (sort keys %{ $terms->{'list'} }) {
624 #        my @facets = ();
625 #        foreach my $facet (sort @{ $terms->{'list'}->{$list}->{'term'} } ) {
626 #            push @facets, {
627 #                facet_label_value => $facet->{'name'}->[0],
628 #            };
629 #        }
630 #        push @facets_loop, ( {
631 #            type_label => $list,
632 #            facets => \@facets,
633 #        } );
634 #    }
635
636     return ( undef, $results_hashref, \@facets_loop );
637 }
638
639 # STOPWORDS
640 sub _remove_stopwords {
641     my ( $operand, $index ) = @_;
642     my @stopwords_removed;
643
644     # phrase and exact-qualified indexes shouldn't have stopwords removed
645     if ( $index !~ m/phr|ext/ ) {
646
647 # remove stopwords from operand : parse all stopwords & remove them (case insensitive)
648 #       we use IsAlpha unicode definition, to deal correctly with diacritics.
649 #       otherwise, a French word like "leçon" woudl be split into "le" "çon", "le"
650 #       is a stopword, we'd get "çon" and wouldn't find anything...
651 #
652                 foreach ( keys %{ C4::Context->stopwords } ) {
653                         next if ( $_ =~ /(and|or|not)/ );    # don't remove operators
654                         $debug && warn "$_ Dump($operand)";
655                         if ( my ($matched) = ($operand =~
656                                 /([^\X\p{isAlnum}]\Q$_\E[^\X\p{isAlnum}]|[^\X\p{isAlnum}]\Q$_\E$|^\Q$_\E[^\X\p{isAlnum}])/gi))
657                         {
658                                 $operand =~ s/\Q$matched\E/ /gi;
659                                 push @stopwords_removed, $_;
660                         }
661                 }
662         }
663     return ( $operand, \@stopwords_removed );
664 }
665
666 # TRUNCATION
667 sub _detect_truncation {
668     my ( $operand, $index ) = @_;
669     my ( @nontruncated, @righttruncated, @lefttruncated, @rightlefttruncated,
670         @regexpr );
671     $operand =~ s/^ //g;
672     my @wordlist = split( /\s/, $operand );
673     foreach my $word (@wordlist) {
674         if ( $word =~ s/^\*([^\*]+)\*$/$1/ ) {
675             push @rightlefttruncated, $word;
676         }
677         elsif ( $word =~ s/^\*([^\*]+)$/$1/ ) {
678             push @lefttruncated, $word;
679         }
680         elsif ( $word =~ s/^([^\*]+)\*$/$1/ ) {
681             push @righttruncated, $word;
682         }
683         elsif ( index( $word, "*" ) < 0 ) {
684             push @nontruncated, $word;
685         }
686         else {
687             push @regexpr, $word;
688         }
689     }
690     return (
691         \@nontruncated,       \@righttruncated, \@lefttruncated,
692         \@rightlefttruncated, \@regexpr
693     );
694 }
695
696 # STEMMING
697 sub _build_stemmed_operand {
698     my ($operand,$lang) = @_;
699     require Lingua::Stem::Snowball ;
700     my $stemmed_operand;
701
702     # If operand contains a digit, it is almost certainly an identifier, and should
703     # not be stemmed.  This is particularly relevant for ISBNs and ISSNs, which
704     # can contain the letter "X" - for example, _build_stemmend_operand would reduce
705     # "014100018X" to "x ", which for a MARC21 database would bring up irrelevant
706     # results (e.g., "23 x 29 cm." from the 300$c).  Bug 2098.
707     return $operand if $operand =~ /\d/;
708
709 # FIXME: the locale should be set based on the user's language and/or search choice
710     #warn "$lang";
711     my $stemmer = Lingua::Stem::Snowball->new( lang => $lang,
712                                                encoding => "UTF-8" );
713
714     my @words = split( / /, $operand );
715     my @stems = $stemmer->stem(\@words);
716     for my $stem (@stems) {
717         $stemmed_operand .= "$stem";
718         $stemmed_operand .= "?"
719           unless ( $stem =~ /(and$|or$|not$)/ ) || ( length($stem) < 3 );
720         $stemmed_operand .= " ";
721     }
722     warn "STEMMED OPERAND: $stemmed_operand" if $DEBUG;
723     return $stemmed_operand;
724 }
725
726 # FIELD WEIGHTING
727 sub _build_weighted_query {
728
729 # FIELD WEIGHTING - This is largely experimental stuff. What I'm committing works
730 # pretty well but could work much better if we had a smarter query parser
731     my ( $operand, $stemmed_operand, $index ) = @_;
732     my $stemming      = C4::Context->preference("QueryStemming")     || 0;
733     my $weight_fields = C4::Context->preference("QueryWeightFields") || 0;
734     my $fuzzy_enabled = C4::Context->preference("QueryFuzzy")        || 0;
735
736     my $weighted_query .= "(rk=(";    # Specifies that we're applying rank
737
738     # Keyword, or, no index specified
739     if ( ( $index eq 'kw' ) || ( !$index ) ) {
740         $weighted_query .=
741           "Title-cover,ext,r1=\"$operand\"";    # exact title-cover
742         $weighted_query .= " or ti,ext,r2=\"$operand\"";    # exact title
743         $weighted_query .= " or ti,phr,r3=\"$operand\"";    # phrase title
744           #$weighted_query .= " or any,ext,r4=$operand";               # exact any
745           #$weighted_query .=" or kw,wrdl,r5=\"$operand\"";            # word list any
746         $weighted_query .= " or wrdl,fuzzy,r8=\"$operand\""
747           if $fuzzy_enabled;    # add fuzzy, word list
748         $weighted_query .= " or wrdl,right-Truncation,r9=\"$stemmed_operand\""
749           if ( $stemming and $stemmed_operand )
750           ;                     # add stemming, right truncation
751         $weighted_query .= " or wrdl,r9=\"$operand\"";
752
753         # embedded sorting: 0 a-z; 1 z-a
754         # $weighted_query .= ") or (sort1,aut=1";
755     }
756
757     # Barcode searches should skip this process
758     elsif ( $index eq 'bc' ) {
759         $weighted_query .= "bc=\"$operand\"";
760     }
761
762     # Authority-number searches should skip this process
763     elsif ( $index eq 'an' ) {
764         $weighted_query .= "an=\"$operand\"";
765     }
766
767     # If the index already has more than one qualifier, wrap the operand
768     # in quotes and pass it back (assumption is that the user knows what they
769     # are doing and won't appreciate us mucking up their query
770     elsif ( $index =~ ',' ) {
771         $weighted_query .= " $index=\"$operand\"";
772     }
773
774     #TODO: build better cases based on specific search indexes
775     else {
776         $weighted_query .= " $index,ext,r1=\"$operand\"";    # exact index
777           #$weighted_query .= " or (title-sort-az=0 or $index,startswithnt,st-word,r3=$operand #)";
778         $weighted_query .= " or $index,phr,r3=\"$operand\"";    # phrase index
779         $weighted_query .=
780           " or $index,rt,wrdl,r3=\"$operand\"";    # word list index
781     }
782
783     $weighted_query .= "))";                       # close rank specification
784     return $weighted_query;
785 }
786
787 =head2 getIndexes
788
789 Return an array with available indexes.
790
791 =cut
792
793 sub getIndexes{
794     my @indexes = (
795                     # biblio indexes
796                     'ab',
797                     'Abstract',
798                     'acqdate',
799                     'allrecords',
800                     'an',
801                     'Any',
802                     'at',
803                     'au',
804                     'aub',
805                     'aud',
806                     'audience',
807                     'auo',
808                     'aut',
809                     'Author',
810                     'Author-in-order ',
811                     'Author-personal-bibliography',
812                     'Authority-Number',
813                     'authtype',
814                     'bc',
815                     'biblionumber',
816                     'bio',
817                     'biography',
818                     'callnum',          
819                     'cfn',
820                     'Chronological-subdivision',
821                     'cn-bib-source',
822                     'cn-bib-sort',
823                     'cn-class',
824                     'cn-item',
825                     'cn-prefix',
826                     'cn-suffix',
827                     'cpn',
828                     'Code-institution',
829                     'Conference-name',
830                     'Conference-name-heading',
831                     'Conference-name-see',
832                     'Conference-name-seealso',
833                     'Content-type',
834                     'Control-number',
835                     'copydate',
836                     'Corporate-name',
837                     'Corporate-name-heading',
838                     'Corporate-name-see',
839                     'Corporate-name-seealso',
840                     'ctype',
841                     'date-entered-on-file',
842                     'Date-of-acquisition',
843                     'Date-of-publication',
844                     'Dewey-classification',
845                     'extent',
846                     'fic',
847                     'fiction',
848                     'Form-subdivision',
849                     'format',
850                     'Geographic-subdivision',
851                     'he',
852                     'Heading',
853                     'Heading-use-main-or-added-entry',
854                     'Heading-use-series-added-entry ',
855                     'Heading-use-subject-added-entry',
856                     'Host-item',
857                     'id-other',
858                     'Illustration-code',
859                     'ISBN',
860                     'ISSN',
861                     'itemtype',
862                     'kw',
863                     'Koha-Auth-Number',
864                     'l-format',
865                     'language',
866                     'lc-card',
867                     'LC-card-number',
868                     'lcn',
869                     'llength',
870                     'ln',
871                     'Local-classification',
872                     'Local-number',
873                     'Match-heading',
874                     'Match-heading-see-from',
875                     'Material-type',
876                     'mc-itemtype',
877                     'mc-rtype',
878                     'mus',
879                     'Name-geographic',
880                     'Name-geographic-heading',
881                     'Name-geographic-see',
882                     'Name-geographic-seealso',
883                     'nb',
884                     'Note',
885                     'ns',
886                     'nt',
887                     'pb',
888                     'Personal-name',
889                     'Personal-name-heading',
890                     'Personal-name-see',
891                     'Personal-name-seealso',
892                     'pl',
893                     'Place-publication',
894                     'pn',
895                     'popularity',
896                     'pubdate',
897                     'Publisher',
898                     'Record-type',
899                     'rtype',
900                     'se',
901                     'See',
902                     'See-also',
903                     'sn',
904                     'Stock-number',
905                     'su',
906                     'Subject',
907                     'Subject-heading-thesaurus',
908                     'Subject-name-personal',
909                     'Subject-subdivision',
910                     'Summary',
911                     'Suppress',
912                     'su-geo',
913                     'su-na',
914                     'su-to',
915                     'su-ut',
916                     'ut',
917                     'Term-genre-form',
918                     'Term-genre-form-heading',
919                     'Term-genre-form-see',
920                     'Term-genre-form-seealso',
921                     'ti',
922                     'Title',
923                     'Title-cover',
924                     'Title-series',
925                     'Title-uniform',
926                     'Title-uniform-heading',
927                     'Title-uniform-see',
928                     'Title-uniform-seealso',
929                     'totalissues',
930                     'yr',
931                     
932                     # items indexes
933                     'acqsource',
934                     'barcode',
935                     'bc',
936                     'branch',
937                     'ccode',
938                     'classification-source',
939                     'cn-sort',
940                     'coded-location-qualifier',
941                     'copynumber',
942                     'damaged',
943                     'datelastborrowed',
944                     'datelastseen',
945                     'holdingbranch',
946                     'homebranch',
947                     'issues',
948                     'itemnumber',
949                     'itype',
950                     'Local-classification',
951                     'location',
952                     'lost',
953                     'materials-specified',
954                     'mc-ccode',
955                     'mc-itype',
956                     'mc-loc',
957                     'notforloan',
958                     'onloan',
959                     'price',
960                     'renewals',
961                     'replacementprice',
962                     'replacementpricedate',
963                     'reserves',
964                     'restricted',
965                     'stack',
966                     'uri',
967                     'withdrawn',
968                     
969                     # subject related
970                   );
971                   
972     return \@indexes;
973 }
974
975 =head2 buildQuery
976
977 ( $error, $query,
978 $simple_query, $query_cgi,
979 $query_desc, $limit,
980 $limit_cgi, $limit_desc,
981 $stopwords_removed, $query_type ) = buildQuery ( $operators, $operands, $indexes, $limits, $sort_by, $scan, $lang);
982
983 Build queries and limits in CCL, CGI, Human,
984 handle truncation, stemming, field weighting, stopwords, fuzziness, etc.
985
986 See verbose embedded documentation.
987
988
989 =cut
990
991 sub buildQuery {
992     my ( $operators, $operands, $indexes, $limits, $sort_by, $scan, $lang) = @_;
993
994     warn "---------\nEnter buildQuery\n---------" if $DEBUG;
995
996     # dereference
997     my @operators = $operators ? @$operators : ();
998     my @indexes   = $indexes   ? @$indexes   : ();
999     my @operands  = $operands  ? @$operands  : ();
1000     my @limits    = $limits    ? @$limits    : ();
1001     my @sort_by   = $sort_by   ? @$sort_by   : ();
1002
1003     my $stemming         = C4::Context->preference("QueryStemming")        || 0;
1004     my $auto_truncation  = C4::Context->preference("QueryAutoTruncate")    || 0;
1005     my $weight_fields    = C4::Context->preference("QueryWeightFields")    || 0;
1006     my $fuzzy_enabled    = C4::Context->preference("QueryFuzzy")           || 0;
1007     my $remove_stopwords = C4::Context->preference("QueryRemoveStopwords") || 0;
1008
1009     # no stemming/weight/fuzzy in NoZebra
1010     if ( C4::Context->preference("NoZebra") ) {
1011         $stemming         = 0;
1012         $weight_fields    = 0;
1013         $fuzzy_enabled    = 0;
1014         $auto_truncation  = 0;
1015     }
1016
1017     my $query        = $operands[0];
1018     my $simple_query = $operands[0];
1019
1020     # initialize the variables we're passing back
1021     my $query_cgi;
1022     my $query_desc;
1023     my $query_type;
1024
1025     my $limit;
1026     my $limit_cgi;
1027     my $limit_desc;
1028
1029     my $stopwords_removed;    # flag to determine if stopwords have been removed
1030
1031     my $cclq;
1032     my $cclindexes = getIndexes();
1033     if( $query !~ /\s*ccl=/ ){
1034         for my $index (@$cclindexes){
1035             if($query =~ /($index)(,?\w)*[:=]/){
1036                 $cclq = 1;
1037             }
1038         }
1039         $query = "ccl=$query" if($cclq);
1040     }
1041
1042 # for handling ccl, cql, pqf queries in diagnostic mode, skip the rest of the steps
1043 # DIAGNOSTIC ONLY!!
1044     if ( $query =~ /^ccl=/ ) {
1045         return ( undef, $', $', "q=ccl=$'", $', '', '', '', '', 'ccl' );
1046     }
1047     if ( $query =~ /^cql=/ ) {
1048         return ( undef, $', $', "q=cql=$'", $', '', '', '', '', 'cql' );
1049     }
1050     if ( $query =~ /^pqf=/ ) {
1051         return ( undef, $', $', "q=pqf=$'", $', '', '', '', '', 'pqf' );
1052     }
1053
1054     # pass nested queries directly
1055     # FIXME: need better handling of some of these variables in this case
1056     # Nested queries aren't handled well and this implementation is flawed and causes users to be
1057     # unable to search for anything containing () commenting out, will be rewritten for 3.4.0
1058 #    if ( $query =~ /(\(|\))/ ) {
1059 #        return (
1060 #            undef,              $query, $simple_query, $query_cgi,
1061 #            $query,             $limit, $limit_cgi,    $limit_desc,
1062 #            $stopwords_removed, 'ccl'
1063 #        );
1064 #    }
1065
1066 # Form-based queries are non-nested and fixed depth, so we can easily modify the incoming
1067 # query operands and indexes and add stemming, truncation, field weighting, etc.
1068 # Once we do so, we'll end up with a value in $query, just like if we had an
1069 # incoming $query from the user
1070     else {
1071         $query = ""
1072           ; # clear it out so we can populate properly with field-weighted, stemmed, etc. query
1073         my $previous_operand
1074           ;    # a flag used to keep track if there was a previous query
1075                # if there was, we can apply the current operator
1076                # for every operand
1077         for ( my $i = 0 ; $i <= @operands ; $i++ ) {
1078
1079             # COMBINE OPERANDS, INDEXES AND OPERATORS
1080             if ( $operands[$i] ) {
1081
1082               # A flag to determine whether or not to add the index to the query
1083                 my $indexes_set;
1084
1085 # If the user is sophisticated enough to specify an index, turn off field weighting, stemming, and stopword handling
1086                 if ( $operands[$i] =~ /(:|=)/ || $scan ) {
1087                     $weight_fields    = 0;
1088                     $stemming         = 0;
1089                     $remove_stopwords = 0;
1090                 }
1091                 my $operand = $operands[$i];
1092                 my $index   = $indexes[$i];
1093
1094                 # Add index-specific attributes
1095                 # Date of Publication
1096                 if ( $index eq 'yr' ) {
1097                     $index .= ",st-numeric";
1098                     $indexes_set++;
1099                                         $stemming = $auto_truncation = $weight_fields = $fuzzy_enabled = $remove_stopwords = 0;
1100                 }
1101
1102                 # Date of Acquisition
1103                 elsif ( $index eq 'acqdate' ) {
1104                     $index .= ",st-date-normalized";
1105                     $indexes_set++;
1106                                         $stemming = $auto_truncation = $weight_fields = $fuzzy_enabled = $remove_stopwords = 0;
1107                 }
1108                 # ISBN,ISSN,Standard Number, don't need special treatment
1109                 elsif ( $index eq 'nb' || $index eq 'ns' ) {
1110                     $indexes_set++;
1111                     (
1112                         $stemming,      $auto_truncation,
1113                         $weight_fields, $fuzzy_enabled,
1114                         $remove_stopwords
1115                     ) = ( 0, 0, 0, 0, 0 );
1116
1117                 }
1118                 
1119                 if(not $index){
1120                     $index = 'kw';
1121                 }
1122                 
1123                 # Set default structure attribute (word list)
1124                 my $struct_attr;
1125                 unless ( $indexes_set || !$index || $index =~ /(st-|phr|ext|wrdl)/ ) {
1126                     $struct_attr = ",wrdl";
1127                 }
1128
1129                 # Some helpful index variants
1130                 my $index_plus       = $index . $struct_attr . ":" if $index;
1131                 my $index_plus_comma = $index . $struct_attr . "," if $index;
1132
1133                 # Remove Stopwords
1134                 if ($remove_stopwords) {
1135                     ( $operand, $stopwords_removed ) =
1136                       _remove_stopwords( $operand, $index );
1137                     warn "OPERAND w/out STOPWORDS: >$operand<" if $DEBUG;
1138                     warn "REMOVED STOPWORDS: @$stopwords_removed"
1139                       if ( $stopwords_removed && $DEBUG );
1140                 }
1141
1142                 if ($auto_truncation){
1143                                         unless ( $index =~ /(st-|phr|ext)/ ) {
1144                                                 #FIXME only valid with LTR scripts
1145                                                 $operand=join(" ",map{ 
1146                                                                                         (index($_,"*")>0?"$_":"$_*")
1147                                                                                          }split (/\s+/,$operand));
1148                                                 warn $operand if $DEBUG;
1149                                         }
1150                                 }
1151
1152                 # Detect Truncation
1153                 my $truncated_operand;
1154                 my( $nontruncated, $righttruncated, $lefttruncated,
1155                     $rightlefttruncated, $regexpr
1156                 ) = _detect_truncation( $operand, $index );
1157                 warn
1158 "TRUNCATION: NON:>@$nontruncated< RIGHT:>@$righttruncated< LEFT:>@$lefttruncated< RIGHTLEFT:>@$rightlefttruncated< REGEX:>@$regexpr<"
1159                   if $DEBUG;
1160
1161                 # Apply Truncation
1162                 if (
1163                     scalar(@$righttruncated) + scalar(@$lefttruncated) +
1164                     scalar(@$rightlefttruncated) > 0 )
1165                 {
1166
1167                # Don't field weight or add the index to the query, we do it here
1168                     $indexes_set = 1;
1169                     undef $weight_fields;
1170                     my $previous_truncation_operand;
1171                     if (scalar @$nontruncated) {
1172                         $truncated_operand .= "$index_plus @$nontruncated ";
1173                         $previous_truncation_operand = 1;
1174                     }
1175                     if (scalar @$righttruncated) {
1176                         $truncated_operand .= "and " if $previous_truncation_operand;
1177                         $truncated_operand .= $index_plus_comma . "rtrn:@$righttruncated ";
1178                         $previous_truncation_operand = 1;
1179                     }
1180                     if (scalar @$lefttruncated) {
1181                         $truncated_operand .= "and " if $previous_truncation_operand;
1182                         $truncated_operand .= $index_plus_comma . "ltrn:@$lefttruncated ";
1183                         $previous_truncation_operand = 1;
1184                     }
1185                     if (scalar @$rightlefttruncated) {
1186                         $truncated_operand .= "and " if $previous_truncation_operand;
1187                         $truncated_operand .= $index_plus_comma . "rltrn:@$rightlefttruncated ";
1188                         $previous_truncation_operand = 1;
1189                     }
1190                 }
1191                 $operand = $truncated_operand if $truncated_operand;
1192                 warn "TRUNCATED OPERAND: >$truncated_operand<" if $DEBUG;
1193
1194                 # Handle Stemming
1195                 my $stemmed_operand;
1196                 $stemmed_operand = _build_stemmed_operand($operand, $lang)
1197                                                                                 if $stemming;
1198
1199                 warn "STEMMED OPERAND: >$stemmed_operand<" if $DEBUG;
1200
1201                 # Handle Field Weighting
1202                 my $weighted_operand;
1203                 if ($weight_fields) {
1204                     $weighted_operand = _build_weighted_query( $operand, $stemmed_operand, $index );
1205                     $operand = $weighted_operand;
1206                     $indexes_set = 1;
1207                 }
1208
1209                 warn "FIELD WEIGHTED OPERAND: >$weighted_operand<" if $DEBUG;
1210
1211                 # If there's a previous operand, we need to add an operator
1212                 if ($previous_operand) {
1213
1214                     # User-specified operator
1215                     if ( $operators[ $i - 1 ] ) {
1216                         $query     .= " $operators[$i-1] ";
1217                         $query     .= " $index_plus " unless $indexes_set;
1218                         $query     .= " $operand";
1219                         $query_cgi .= "&op=$operators[$i-1]";
1220                         $query_cgi .= "&idx=$index" if $index;
1221                         $query_cgi .= "&q=$operands[$i]" if $operands[$i];
1222                         $query_desc .=
1223                           " $operators[$i-1] $index_plus $operands[$i]";
1224                     }
1225
1226                     # Default operator is and
1227                     else {
1228                         $query      .= " and ";
1229                         $query      .= "$index_plus " unless $indexes_set;
1230                         $query      .= "$operand";
1231                         $query_cgi  .= "&op=and&idx=$index" if $index;
1232                         $query_cgi  .= "&q=$operands[$i]" if $operands[$i];
1233                         $query_desc .= " and $index_plus $operands[$i]";
1234                     }
1235                 }
1236
1237                 # There isn't a pervious operand, don't need an operator
1238                 else {
1239
1240                     # Field-weighted queries already have indexes set
1241                     $query .= " $index_plus " unless $indexes_set;
1242                     $query .= $operand;
1243                     $query_desc .= " $index_plus $operands[$i]";
1244                     $query_cgi  .= "&idx=$index" if $index;
1245                     $query_cgi  .= "&q=$operands[$i]" if $operands[$i];
1246                     $previous_operand = 1;
1247                 }
1248             }    #/if $operands
1249         }    # /for
1250     }
1251     warn "QUERY BEFORE LIMITS: >$query<" if $DEBUG;
1252
1253     # add limits
1254     my $group_OR_limits;
1255     my $availability_limit;
1256     foreach my $this_limit (@limits) {
1257 #        if ( $this_limit =~ /available/ ) {
1258 #
1259 ## 'available' is defined as (items.onloan is NULL) and (items.itemlost = 0)
1260 ## In English:
1261 ## all records not indexed in the onloan register (zebra) and all records with a value of lost equal to 0
1262 #            $availability_limit .=
1263 #"( ( allrecords,AlwaysMatches='' not onloan,AlwaysMatches='') and (lost,st-numeric=0) )"; #or ( allrecords,AlwaysMatches='' not lost,AlwaysMatches='')) )";
1264 #            $limit_cgi  .= "&limit=available";
1265 #            $limit_desc .= "";
1266 #        }
1267 #
1268         # group_OR_limits, prefixed by mc-
1269         # OR every member of the group
1270 #        elsif ( $this_limit =~ /mc/ ) {
1271         if ( $this_limit =~ /mc/ ) {
1272             $group_OR_limits .= " or " if $group_OR_limits;
1273             $limit_desc      .= " or " if $group_OR_limits;
1274             $group_OR_limits .= "$this_limit";
1275             $limit_cgi       .= "&limit=$this_limit";
1276             $limit_desc      .= " $this_limit";
1277         }
1278
1279         # Regular old limits
1280         else {
1281             $limit .= " and " if $limit || $query;
1282             $limit      .= "$this_limit";
1283             $limit_cgi  .= "&limit=$this_limit";
1284             if ($this_limit =~ /^branch:(.+)/) {
1285                 my $branchcode = $1;
1286                 my $branchname = GetBranchName($branchcode);
1287                 if (defined $branchname) {
1288                     $limit_desc .= " branch:$branchname";
1289                 } else {
1290                     $limit_desc .= " $this_limit";
1291                 }
1292             } else {
1293                 $limit_desc .= " $this_limit";
1294             }
1295         }
1296     }
1297     if ($group_OR_limits) {
1298         $limit .= " and " if ( $query || $limit );
1299         $limit .= "($group_OR_limits)";
1300     }
1301     if ($availability_limit) {
1302         $limit .= " and " if ( $query || $limit );
1303         $limit .= "($availability_limit)";
1304     }
1305
1306     # Normalize the query and limit strings
1307     # This is flawed , means we can't search anything with : in it
1308     # if user wants to do ccl or cql, start the query with that
1309     $query =~ s/:/=/g;
1310     $limit =~ s/:/=/g;
1311     for ( $query, $query_desc, $limit, $limit_desc ) {
1312         s/  / /g;    # remove extra spaces
1313         s/^ //g;     # remove any beginning spaces
1314         s/ $//g;     # remove any ending spaces
1315         s/==/=/g;    # remove double == from query
1316     }
1317     $query_cgi =~ s/^&//; # remove unnecessary & from beginning of the query cgi
1318
1319     for ($query_cgi,$simple_query) {
1320         s/"//g;
1321     }
1322     # append the limit to the query
1323     $query .= " " . $limit;
1324
1325     # Warnings if DEBUG
1326     if ($DEBUG) {
1327         warn "QUERY:" . $query;
1328         warn "QUERY CGI:" . $query_cgi;
1329         warn "QUERY DESC:" . $query_desc;
1330         warn "LIMIT:" . $limit;
1331         warn "LIMIT CGI:" . $limit_cgi;
1332         warn "LIMIT DESC:" . $limit_desc;
1333         warn "---------\nLeave buildQuery\n---------";
1334     }
1335     return (
1336         undef,              $query, $simple_query, $query_cgi,
1337         $query_desc,        $limit, $limit_cgi,    $limit_desc,
1338         $stopwords_removed, $query_type
1339     );
1340 }
1341
1342 =head2 searchResults
1343
1344 Format results in a form suitable for passing to the template
1345
1346 =cut
1347
1348 # IMO this subroutine is pretty messy still -- it's responsible for
1349 # building the HTML output for the template
1350 sub searchResults {
1351     my ( $searchdesc, $hits, $results_per_page, $offset, $scan, @marcresults, $hidelostitems ) = @_;
1352     my $dbh = C4::Context->dbh;
1353     my @newresults;
1354
1355     #Build branchnames hash
1356     #find branchname
1357     #get branch information.....
1358     my %branches;
1359     my $bsth =$dbh->prepare("SELECT branchcode,branchname FROM branches"); # FIXME : use C4::Branch::GetBranches
1360     $bsth->execute();
1361     while ( my $bdata = $bsth->fetchrow_hashref ) {
1362         $branches{ $bdata->{'branchcode'} } = $bdata->{'branchname'};
1363     }
1364 # FIXME - We build an authorised values hash here, using the default framework
1365 # though it is possible to have different authvals for different fws.
1366
1367     my $shelflocations =GetKohaAuthorisedValues('items.location','');
1368
1369     # get notforloan authorised value list (see $shelflocations  FIXME)
1370     my $notforloan_authorised_value = GetAuthValCode('items.notforloan','');
1371
1372     #Build itemtype hash
1373     #find itemtype & itemtype image
1374     my %itemtypes;
1375     $bsth =
1376       $dbh->prepare(
1377         "SELECT itemtype,description,imageurl,summary,notforloan FROM itemtypes"
1378       );
1379     $bsth->execute();
1380     while ( my $bdata = $bsth->fetchrow_hashref ) {
1381                 foreach (qw(description imageurl summary notforloan)) {
1382                 $itemtypes{ $bdata->{'itemtype'} }->{$_} = $bdata->{$_};
1383                 }
1384     }
1385
1386     #search item field code
1387     my $sth =
1388       $dbh->prepare(
1389 "SELECT tagfield FROM marc_subfield_structure WHERE kohafield LIKE 'items.itemnumber'"
1390       );
1391     $sth->execute;
1392     my ($itemtag) = $sth->fetchrow;
1393
1394     ## find column names of items related to MARC
1395     my $sth2 = $dbh->prepare("SHOW COLUMNS FROM items");
1396     $sth2->execute;
1397     my %subfieldstosearch;
1398     while ( ( my $column ) = $sth2->fetchrow ) {
1399         my ( $tagfield, $tagsubfield ) =
1400           &GetMarcFromKohaField( "items." . $column, "" );
1401         $subfieldstosearch{$column} = $tagsubfield;
1402     }
1403
1404     # handle which records to actually retrieve
1405     my $times;
1406     if ( $hits && $offset + $results_per_page <= $hits ) {
1407         $times = $offset + $results_per_page;
1408     }
1409     else {
1410         $times = $hits;  # FIXME: if $hits is undefined, why do we want to equal it?
1411     }
1412
1413         my $marcflavour = C4::Context->preference("marcflavour");
1414     # We get the biblionumber position in MARC
1415     my ($bibliotag,$bibliosubf)=GetMarcFromKohaField('biblio.biblionumber','');
1416     my $fw;
1417
1418     # loop through all of the records we've retrieved
1419     for ( my $i = $offset ; $i <= $times - 1 ; $i++ ) {
1420         my $marcrecord = MARC::File::USMARC::decode( $marcresults[$i] );
1421         if ($bibliotag<10){
1422             $fw = GetFrameworkCode($marcrecord->field($bibliotag)->data);
1423         }else{
1424             $fw = GetFrameworkCode($marcrecord->subfield($bibliotag,$bibliosubf));
1425         }
1426
1427         my $oldbiblio = TransformMarcToKoha( $dbh, $marcrecord, $fw );
1428         $oldbiblio->{subtitle} = GetRecordValue('subtitle', $marcrecord, $fw);
1429         $oldbiblio->{result_number} = $i + 1;
1430
1431         # add imageurl to itemtype if there is one
1432         $oldbiblio->{imageurl} = getitemtypeimagelocation( 'opac', $itemtypes{ $oldbiblio->{itemtype} }->{imageurl} );
1433
1434         $oldbiblio->{'authorised_value_images'}  = C4::Items::get_authorised_value_images( C4::Biblio::get_biblio_authorised_values( $oldbiblio->{'biblionumber'}, $marcrecord ) );
1435                 $oldbiblio->{normalized_upc}  = GetNormalizedUPC(       $marcrecord,$marcflavour);
1436                 $oldbiblio->{normalized_ean}  = GetNormalizedEAN(       $marcrecord,$marcflavour);
1437                 $oldbiblio->{normalized_oclc} = GetNormalizedOCLCNumber($marcrecord,$marcflavour);
1438                 $oldbiblio->{normalized_isbn} = GetNormalizedISBN(undef,$marcrecord,$marcflavour);
1439                 $oldbiblio->{content_identifier_exists} = 1 if ($oldbiblio->{normalized_isbn} or $oldbiblio->{normalized_oclc} or $oldbiblio->{normalized_ean} or $oldbiblio->{normalized_upc});
1440
1441                 # edition information, if any
1442         $oldbiblio->{edition} = $oldbiblio->{editionstatement};
1443                 $oldbiblio->{description} = $itemtypes{ $oldbiblio->{itemtype} }->{description};
1444  # Build summary if there is one (the summary is defined in the itemtypes table)
1445  # FIXME: is this used anywhere, I think it can be commented out? -- JF
1446         if ( $itemtypes{ $oldbiblio->{itemtype} }->{summary} ) {
1447             my $summary = $itemtypes{ $oldbiblio->{itemtype} }->{summary};
1448             my @fields  = $marcrecord->fields();
1449
1450             my $newsummary;
1451             foreach my $line ( "$summary\n" =~ /(.*)\n/g ){
1452                 my $tags = {};
1453                 foreach my $tag ( $line =~ /\[(\d{3}[\w|\d])\]/ ) {
1454                     $tag =~ /(.{3})(.)/;
1455                     if($marcrecord->field($1)){
1456                         my @abc = $marcrecord->field($1)->subfield($2);
1457                         $tags->{$tag} = $#abc + 1 ;
1458                     }
1459                 }
1460
1461                 # We catch how many times to repeat this line
1462                 my $max = 0;
1463                 foreach my $tag (keys(%$tags)){
1464                     $max = $tags->{$tag} if($tags->{$tag} > $max);
1465                  }
1466
1467                 # we replace, and repeat each line
1468                 for (my $i = 0 ; $i < $max ; $i++){
1469                     my $newline = $line;
1470
1471                     foreach my $tag ( $newline =~ /\[(\d{3}[\w|\d])\]/g ) {
1472                         $tag =~ /(.{3})(.)/;
1473
1474                         if($marcrecord->field($1)){
1475                             my @repl = $marcrecord->field($1)->subfield($2);
1476                             my $subfieldvalue = $repl[$i];
1477
1478                             if (! utf8::is_utf8($subfieldvalue)) {
1479                                 utf8::decode($subfieldvalue);
1480                             }
1481
1482                              $newline =~ s/\[$tag\]/$subfieldvalue/g;
1483                         }
1484                     }
1485                     $newsummary .= "$newline\n";
1486                 }
1487             }
1488
1489             $newsummary =~ s/\[(.*?)]//g;
1490             $newsummary =~ s/\n/<br\/>/g;
1491             $oldbiblio->{summary} = $newsummary;
1492         }
1493
1494         # Pull out the items fields
1495         my @fields = $marcrecord->field($itemtag);
1496
1497         # Setting item statuses for display
1498         my @available_items_loop;
1499         my @onloan_items_loop;
1500         my @other_items_loop;
1501
1502         my $available_items;
1503         my $onloan_items;
1504         my $other_items;
1505
1506         my $ordered_count         = 0;
1507         my $available_count       = 0;
1508         my $onloan_count          = 0;
1509         my $longoverdue_count     = 0;
1510         my $other_count           = 0;
1511         my $wthdrawn_count        = 0;
1512         my $itemlost_count        = 0;
1513         my $itembinding_count     = 0;
1514         my $itemdamaged_count     = 0;
1515         my $item_in_transit_count = 0;
1516         my $can_place_holds       = 0;
1517         my $items_count           = scalar(@fields);
1518         my $maxitems =
1519           ( C4::Context->preference('maxItemsinSearchResults') )
1520           ? C4::Context->preference('maxItemsinSearchResults') - 1
1521           : 1;
1522
1523         # loop through every item
1524         foreach my $field (@fields) {
1525             my $item;
1526
1527             # populate the items hash
1528             foreach my $code ( keys %subfieldstosearch ) {
1529                 $item->{$code} = $field->subfield( $subfieldstosearch{$code} );
1530             }
1531
1532                         my $hbranch     = C4::Context->preference('HomeOrHoldingBranch') eq 'homebranch' ? 'homebranch'    : 'holdingbranch';
1533                         my $otherbranch = C4::Context->preference('HomeOrHoldingBranch') eq 'homebranch' ? 'holdingbranch' : 'homebranch';
1534             # set item's branch name, use HomeOrHoldingBranch syspref first, fall back to the other one
1535             if ($item->{$hbranch}) {
1536                 $item->{'branchname'} = $branches{$item->{$hbranch}};
1537             }
1538             elsif ($item->{$otherbranch}) {     # Last resort
1539                 $item->{'branchname'} = $branches{$item->{$otherbranch}};
1540             }
1541
1542                         my $prefix = $item->{$hbranch} . '--' . $item->{location} . $item->{itype} . $item->{itemcallnumber};
1543 # For each grouping of items (onloan, available, unavailable), we build a key to store relevant info about that item
1544             if ( $item->{onloan} ) {
1545                 $onloan_count++;
1546                                 my $key = $prefix . $item->{onloan} . $item->{barcode};
1547                                 $onloan_items->{$key}->{due_date} = format_date($item->{onloan});
1548                                 $onloan_items->{$key}->{count}++ if $item->{$hbranch};
1549                                 $onloan_items->{$key}->{branchname} = $item->{branchname};
1550                                 $onloan_items->{$key}->{location} = $shelflocations->{ $item->{location} };
1551                                 $onloan_items->{$key}->{itemcallnumber} = $item->{itemcallnumber};
1552                                 $onloan_items->{$key}->{imageurl} = getitemtypeimagelocation( 'opac', $itemtypes{ $item->{itype} }->{imageurl} );
1553                 # if something's checked out and lost, mark it as 'long overdue'
1554                 if ( $item->{itemlost} ) {
1555                     $onloan_items->{$prefix}->{longoverdue}++;
1556                     $longoverdue_count++;
1557                 } else {        # can place holds as long as item isn't lost
1558                     $can_place_holds = 1;
1559                 }
1560             }
1561
1562          # items not on loan, but still unavailable ( lost, withdrawn, damaged )
1563             else {
1564
1565                 # item is on order
1566                 if ( $item->{notforloan} == -1 ) {
1567                     $ordered_count++;
1568                 }
1569
1570                 # is item in transit?
1571                 my $transfertwhen = '';
1572                 my ($transfertfrom, $transfertto);
1573
1574                 unless ($item->{wthdrawn}
1575                         || $item->{itemlost}
1576                         || $item->{damaged}
1577                         || $item->{notforloan}
1578                         || $items_count > 20) {
1579
1580                     # A couple heuristics to limit how many times
1581                     # we query the database for item transfer information, sacrificing
1582                     # accuracy in some cases for speed;
1583                     #
1584                     # 1. don't query if item has one of the other statuses
1585                     # 2. don't check transit status if the bib has
1586                     #    more than 20 items
1587                     #
1588                     # FIXME: to avoid having the query the database like this, and to make
1589                     #        the in transit status count as unavailable for search limiting,
1590                     #        should map transit status to record indexed in Zebra.
1591                     #
1592                     ($transfertwhen, $transfertfrom, $transfertto) = C4::Circulation::GetTransfers($item->{itemnumber});
1593                 }
1594
1595                 # item is withdrawn, lost or damaged
1596                 if (   $item->{wthdrawn}
1597                     || $item->{itemlost}
1598                     || $item->{damaged}
1599                     || $item->{notforloan}
1600                     || ($transfertwhen ne ''))
1601                 {
1602                     $wthdrawn_count++        if $item->{wthdrawn};
1603                     $itemlost_count++        if $item->{itemlost};
1604                     $itemdamaged_count++     if $item->{damaged};
1605                     $item_in_transit_count++ if $transfertwhen ne '';
1606                     $item->{status} = $item->{wthdrawn} . "-" . $item->{itemlost} . "-" . $item->{damaged} . "-" . $item->{notforloan};
1607                     $other_count++;
1608
1609                                         my $key = $prefix . $item->{status};
1610                                         foreach (qw(wthdrawn itemlost damaged branchname itemcallnumber)) {
1611                         $other_items->{$key}->{$_} = $item->{$_};
1612                                         }
1613                     $other_items->{$key}->{intransit} = ($transfertwhen ne '') ? 1 : 0;
1614                                         $other_items->{$key}->{notforloan} = GetAuthorisedValueDesc('','',$item->{notforloan},'','',$notforloan_authorised_value) if $notforloan_authorised_value;
1615                                         $other_items->{$key}->{count}++ if $item->{$hbranch};
1616                                         $other_items->{$key}->{location} = $shelflocations->{ $item->{location} };
1617                                         $other_items->{$key}->{imageurl} = getitemtypeimagelocation( 'opac', $itemtypes{ $item->{itype} }->{imageurl} );
1618                 }
1619                 # item is available
1620                 else {
1621                     $can_place_holds = 1;
1622                     $available_count++;
1623                                         $available_items->{$prefix}->{count}++ if $item->{$hbranch};
1624                                         foreach (qw(branchname itemcallnumber)) {
1625                         $available_items->{$prefix}->{$_} = $item->{$_};
1626                                         }
1627                                         $available_items->{$prefix}->{location} = $shelflocations->{ $item->{location} };
1628                                         $available_items->{$prefix}->{imageurl} = getitemtypeimagelocation( 'opac', $itemtypes{ $item->{itype} }->{imageurl} );
1629                 }
1630             }
1631         }    # notforloan, item level and biblioitem level
1632         my ( $availableitemscount, $onloanitemscount, $otheritemscount );
1633         $maxitems =
1634           ( C4::Context->preference('maxItemsinSearchResults') )
1635           ? C4::Context->preference('maxItemsinSearchResults') - 1
1636           : 1;
1637         for my $key ( sort keys %$onloan_items ) {
1638             (++$onloanitemscount > $maxitems) and last;
1639             push @onloan_items_loop, $onloan_items->{$key};
1640         }
1641         for my $key ( sort keys %$other_items ) {
1642             (++$otheritemscount > $maxitems) and last;
1643             push @other_items_loop, $other_items->{$key};
1644         }
1645         for my $key ( sort keys %$available_items ) {
1646             (++$availableitemscount > $maxitems) and last;
1647             push @available_items_loop, $available_items->{$key}
1648         }
1649
1650         # XSLT processing of some stuff
1651         my $debug=1;
1652         use C4::Charset;
1653         SetUTF8Flag($marcrecord);
1654         $debug && warn $marcrecord->as_formatted;
1655         if (C4::Context->preference("XSLTResultsDisplay") && !$scan) {
1656             $oldbiblio->{XSLTResultsRecord} = XSLTParse4Display(
1657                 $oldbiblio->{biblionumber}, $marcrecord, 'Results' );
1658         }
1659
1660         # last check for norequest : if itemtype is notforloan, it can't be reserved either, whatever the items
1661         $can_place_holds = 0
1662           if $itemtypes{ $oldbiblio->{itemtype} }->{notforloan};
1663         $oldbiblio->{norequests} = 1 unless $can_place_holds;
1664         $oldbiblio->{itemsplural}          = 1 if $items_count > 1;
1665         $oldbiblio->{items_count}          = $items_count;
1666         $oldbiblio->{available_items_loop} = \@available_items_loop;
1667         $oldbiblio->{onloan_items_loop}    = \@onloan_items_loop;
1668         $oldbiblio->{other_items_loop}     = \@other_items_loop;
1669         $oldbiblio->{availablecount}       = $available_count;
1670         $oldbiblio->{availableplural}      = 1 if $available_count > 1;
1671         $oldbiblio->{onloancount}          = $onloan_count;
1672         $oldbiblio->{onloanplural}         = 1 if $onloan_count > 1;
1673         $oldbiblio->{othercount}           = $other_count;
1674         $oldbiblio->{otherplural}          = 1 if $other_count > 1;
1675         $oldbiblio->{wthdrawncount}        = $wthdrawn_count;
1676         $oldbiblio->{itemlostcount}        = $itemlost_count;
1677         $oldbiblio->{damagedcount}         = $itemdamaged_count;
1678         $oldbiblio->{intransitcount}       = $item_in_transit_count;
1679         $oldbiblio->{orderedcount}         = $ordered_count;
1680         $oldbiblio->{isbn} =~
1681           s/-//g;    # deleting - in isbn to enable amazon content
1682         push( @newresults, $oldbiblio )
1683             if(not $hidelostitems
1684                or (($items_count > $itemlost_count )
1685                     && $hidelostitems));
1686     }
1687
1688     return @newresults;
1689 }
1690
1691 =head2 SearchAcquisitions
1692     Search for acquisitions
1693 =cut
1694
1695 sub SearchAcquisitions{
1696     my ($datebegin, $dateend, $itemtypes,$criteria, $orderby) = @_;
1697
1698     my $dbh=C4::Context->dbh;
1699     # Variable initialization
1700     my $str=qq|
1701     SELECT marcxml
1702     FROM biblio
1703     LEFT JOIN biblioitems ON biblioitems.biblionumber=biblio.biblionumber
1704     LEFT JOIN items ON items.biblionumber=biblio.biblionumber
1705     WHERE dateaccessioned BETWEEN ? AND ?
1706     |;
1707
1708     my (@params,@loopcriteria);
1709
1710     push @params, $datebegin->output("iso");
1711     push @params, $dateend->output("iso");
1712
1713     if (scalar(@$itemtypes)>0 and $criteria ne "itemtype" ){
1714         if(C4::Context->preference("item-level_itypes")){
1715             $str .= "AND items.itype IN (?".( ',?' x scalar @$itemtypes - 1 ).") ";
1716         }else{
1717             $str .= "AND biblioitems.itemtype IN (?".( ',?' x scalar @$itemtypes - 1 ).") ";
1718         }
1719         push @params, @$itemtypes;
1720     }
1721
1722     if ($criteria =~/itemtype/){
1723         if(C4::Context->preference("item-level_itypes")){
1724             $str .= "AND items.itype=? ";
1725         }else{
1726             $str .= "AND biblioitems.itemtype=? ";
1727         }
1728
1729         if(scalar(@$itemtypes) == 0){
1730             my $itypes = GetItemTypes();
1731             for my $key (keys %$itypes){
1732                 push @$itemtypes, $key;
1733             }
1734         }
1735
1736         @loopcriteria= @$itemtypes;
1737     }elsif ($criteria=~/itemcallnumber/){
1738         $str .= "AND (items.itemcallnumber LIKE CONCAT(?,'%')
1739                  OR items.itemcallnumber is NULL
1740                  OR items.itemcallnumber = '')";
1741
1742         @loopcriteria = ("AA".."ZZ", "") unless (scalar(@loopcriteria)>0);
1743     }else {
1744         $str .= "AND biblio.title LIKE CONCAT(?,'%') ";
1745         @loopcriteria = ("A".."z") unless (scalar(@loopcriteria)>0);
1746     }
1747
1748     if ($orderby =~ /date_desc/){
1749         $str.=" ORDER BY dateaccessioned DESC";
1750     } else {
1751         $str.=" ORDER BY title";
1752     }
1753
1754     my $qdataacquisitions=$dbh->prepare($str);
1755
1756     my @loopacquisitions;
1757     foreach my $value(@loopcriteria){
1758         push @params,$value;
1759         my %cell;
1760         $cell{"title"}=$value;
1761         $cell{"titlecode"}=$value;
1762
1763         eval{$qdataacquisitions->execute(@params);};
1764
1765         if ($@){ warn "recentacquisitions Error :$@";}
1766         else {
1767             my @loopdata;
1768             while (my $data=$qdataacquisitions->fetchrow_hashref){
1769                 push @loopdata, {"summary"=>GetBiblioSummary( $data->{'marcxml'} ) };
1770             }
1771             $cell{"loopdata"}=\@loopdata;
1772         }
1773         push @loopacquisitions,\%cell if (scalar(@{$cell{loopdata}})>0);
1774         pop @params;
1775     }
1776     $qdataacquisitions->finish;
1777     return \@loopacquisitions;
1778 }
1779 #----------------------------------------------------------------------
1780 #
1781 # Non-Zebra GetRecords#
1782 #----------------------------------------------------------------------
1783
1784 =head2 NZgetRecords
1785
1786   NZgetRecords has the same API as zera getRecords, even if some parameters are not managed
1787
1788 =cut
1789
1790 sub NZgetRecords {
1791     my (
1792         $query,            $simple_query, $sort_by_ref,    $servers_ref,
1793         $results_per_page, $offset,       $expanded_facet, $branches,
1794         $query_type,       $scan
1795     ) = @_;
1796     warn "query =$query" if $DEBUG;
1797     my $result = NZanalyse($query);
1798     warn "results =$result" if $DEBUG;
1799     return ( undef,
1800         NZorder( $result, @$sort_by_ref[0], $results_per_page, $offset ),
1801         undef );
1802 }
1803
1804 =head2 NZanalyse
1805
1806   NZanalyse : get a CQL string as parameter, and returns a list of biblionumber;title,biblionumber;title,...
1807   the list is built from an inverted index in the nozebra SQL table
1808   note that title is here only for convenience : the sorting will be very fast when requested on title
1809   if the sorting is requested on something else, we will have to reread all results, and that may be longer.
1810
1811 =cut
1812
1813 sub NZanalyse {
1814     my ( $string, $server ) = @_;
1815 #     warn "---------"       if $DEBUG;
1816     warn " NZanalyse" if $DEBUG;
1817 #     warn "---------"       if $DEBUG;
1818
1819  # $server contains biblioserver or authorities, depending on what we search on.
1820  #warn "querying : $string on $server";
1821     $server = 'biblioserver' unless $server;
1822
1823 # if we have a ", replace the content to discard temporarily any and/or/not inside
1824     my $commacontent;
1825     if ( $string =~ /"/ ) {
1826         $string =~ s/"(.*?)"/__X__/;
1827         $commacontent = $1;
1828         warn "commacontent : $commacontent" if $DEBUG;
1829     }
1830
1831 # split the query string in 3 parts : X AND Y means : $left="X", $operand="AND" and $right="Y"
1832 # then, call again NZanalyse with $left and $right
1833 # (recursive until we find a leaf (=> something without and/or/not)
1834 # delete repeated operator... Would then go in infinite loop
1835     while ( $string =~ s/( and| or| not| AND| OR| NOT)\1/$1/g ) {
1836     }
1837
1838     #process parenthesis before.
1839     if ( $string =~ /^\s*\((.*)\)(( and | or | not | AND | OR | NOT )(.*))?/ ) {
1840         my $left     = $1;
1841         my $right    = $4;
1842         my $operator = lc($3);   # FIXME: and/or/not are operators, not operands
1843         warn
1844 "dealing w/parenthesis before recursive sub call. left :$left operator:$operator right:$right"
1845           if $DEBUG;
1846         my $leftresult = NZanalyse( $left, $server );
1847         if ($operator) {
1848             my $rightresult = NZanalyse( $right, $server );
1849
1850             # OK, we have the results for right and left part of the query
1851             # depending of operand, intersect, union or exclude both lists
1852             # to get a result list
1853             if ( $operator eq ' and ' ) {
1854                 return NZoperatorAND($leftresult,$rightresult);
1855             }
1856             elsif ( $operator eq ' or ' ) {
1857
1858                 # just merge the 2 strings
1859                 return $leftresult . $rightresult;
1860             }
1861             elsif ( $operator eq ' not ' ) {
1862                 return NZoperatorNOT($leftresult,$rightresult);
1863             }
1864         }
1865         else {
1866 # this error is impossible, because of the regexp that isolate the operand, but just in case...
1867             return $leftresult;
1868         }
1869     }
1870     warn "string :" . $string if $DEBUG;
1871     my $left = "";
1872     my $right = "";
1873     my $operator = "";
1874     if ($string =~ /(.*?)( and | or | not | AND | OR | NOT )(.*)/) {
1875         $left     = $1;
1876         $right    = $3;
1877         $operator = lc($2);    # FIXME: and/or/not are operators, not operands
1878     }
1879     warn "no parenthesis. left : $left operator: $operator right: $right"
1880       if $DEBUG;
1881
1882     # it's not a leaf, we have a and/or/not
1883     if ($operator) {
1884
1885         # reintroduce comma content if needed
1886         $right =~ s/__X__/"$commacontent"/ if $commacontent;
1887         $left  =~ s/__X__/"$commacontent"/ if $commacontent;
1888         warn "node : $left / $operator / $right\n" if $DEBUG;
1889         my $leftresult  = NZanalyse( $left,  $server );
1890         my $rightresult = NZanalyse( $right, $server );
1891         warn " leftresult : $leftresult" if $DEBUG;
1892         warn " rightresult : $rightresult" if $DEBUG;
1893         # OK, we have the results for right and left part of the query
1894         # depending of operand, intersect, union or exclude both lists
1895         # to get a result list
1896         if ( $operator eq ' and ' ) {
1897             warn "NZAND";
1898             return NZoperatorAND($leftresult,$rightresult);
1899         }
1900         elsif ( $operator eq ' or ' ) {
1901
1902             # just merge the 2 strings
1903             return $leftresult . $rightresult;
1904         }
1905         elsif ( $operator eq ' not ' ) {
1906             return NZoperatorNOT($leftresult,$rightresult);
1907         }
1908         else {
1909
1910 # this error is impossible, because of the regexp that isolate the operand, but just in case...
1911             die "error : operand unknown : $operator for $string";
1912         }
1913
1914         # it's a leaf, do the real SQL query and return the result
1915     }
1916     else {
1917         $string =~ s/__X__/"$commacontent"/ if $commacontent;
1918         $string =~ s/-|\.|\?|,|;|!|'|\(|\)|\[|\]|{|}|"|&|\+|\*|\// /g;
1919         #remove trailing blank at the beginning
1920         $string =~ s/^ //g;
1921         warn "leaf:$string" if $DEBUG;
1922
1923         # parse the string in in operator/operand/value again
1924         my $left = "";
1925         my $operator = "";
1926         my $right = "";
1927         if ($string =~ /(.*)(>=|<=)(.*)/) {
1928             $left     = $1;
1929             $operator = $2;
1930             $right    = $3;
1931         } else {
1932             $left = $string;
1933         }
1934 #         warn "handling leaf... left:$left operator:$operator right:$right"
1935 #           if $DEBUG;
1936         unless ($operator) {
1937             if ($string =~ /(.*)(>|<|=)(.*)/) {
1938                 $left     = $1;
1939                 $operator = $2;
1940                 $right    = $3;
1941                 warn
1942     "handling unless (operator)... left:$left operator:$operator right:$right"
1943                 if $DEBUG;
1944             } else {
1945                 $left = $string;
1946             }
1947         }
1948         my $results;
1949
1950 # strip adv, zebra keywords, currently not handled in nozebra: wrdl, ext, phr...
1951         $left =~ s/ .*$//;
1952
1953         # automatic replace for short operators
1954         $left = 'title'            if $left =~ '^ti$';
1955         $left = 'author'           if $left =~ '^au$';
1956         $left = 'publisher'        if $left =~ '^pb$';
1957         $left = 'subject'          if $left =~ '^su$';
1958         $left = 'koha-Auth-Number' if $left =~ '^an$';
1959         $left = 'keyword'          if $left =~ '^kw$';
1960         $left = 'itemtype'         if $left =~ '^mc$'; # Fix for Bug 2599 - Search limits not working for NoZebra
1961         warn "handling leaf... left:$left operator:$operator right:$right" if $DEBUG;
1962         my $dbh = C4::Context->dbh;
1963         if ( $operator && $left ne 'keyword' ) {
1964             #do a specific search
1965             $operator = 'LIKE' if $operator eq '=' and $right =~ /%/;
1966             my $sth = $dbh->prepare(
1967 "SELECT biblionumbers,value FROM nozebra WHERE server=? AND indexname=? AND value $operator ?"
1968             );
1969             warn "$left / $operator / $right\n" if $DEBUG;
1970
1971             # split each word, query the DB and build the biblionumbers result
1972             #sanitizing leftpart
1973             $left =~ s/^\s+|\s+$//;
1974             foreach ( split / /, $right ) {
1975                 my $biblionumbers;
1976                 $_ =~ s/^\s+|\s+$//;
1977                 next unless $_;
1978                 warn "EXECUTE : $server, $left, $_" if $DEBUG;
1979                 $sth->execute( $server, $left, $_ )
1980                   or warn "execute failed: $!";
1981                 while ( my ( $line, $value ) = $sth->fetchrow ) {
1982
1983 # if we are dealing with a numeric value, use only numeric results (in case of >=, <=, > or <)
1984 # otherwise, fill the result
1985                     $biblionumbers .= $line
1986                       unless ( $right =~ /^\d+$/ && $value =~ /\D/ );
1987                     warn "result : $value "
1988                       . ( $right  =~ /\d/ ) . "=="
1989                       . ( $value =~ /\D/?$line:"" ) if $DEBUG;         #= $line";
1990                 }
1991
1992 # do a AND with existing list if there is one, otherwise, use the biblionumbers list as 1st result list
1993                 if ($results) {
1994                     warn "NZAND" if $DEBUG;
1995                     $results = NZoperatorAND($biblionumbers,$results);
1996                 } else {
1997                     $results = $biblionumbers;
1998                 }
1999             }
2000         }
2001         else {
2002       #do a complete search (all indexes), if index='kw' do complete search too.
2003             my $sth = $dbh->prepare(
2004 "SELECT biblionumbers FROM nozebra WHERE server=? AND value LIKE ?"
2005             );
2006
2007             # split each word, query the DB and build the biblionumbers result
2008             foreach ( split / /, $string ) {
2009                 next if C4::Context->stopwords->{ uc($_) };   # skip if stopword
2010                 warn "search on all indexes on $_" if $DEBUG;
2011                 my $biblionumbers;
2012                 next unless $_;
2013                 $sth->execute( $server, $_ );
2014                 while ( my $line = $sth->fetchrow ) {
2015                     $biblionumbers .= $line;
2016                 }
2017
2018 # do a AND with existing list if there is one, otherwise, use the biblionumbers list as 1st result list
2019                 if ($results) {
2020                     $results = NZoperatorAND($biblionumbers,$results);
2021                 }
2022                 else {
2023                     warn "NEW RES for $_ = $biblionumbers" if $DEBUG;
2024                     $results = $biblionumbers;
2025                 }
2026             }
2027         }
2028         warn "return : $results for LEAF : $string" if $DEBUG;
2029         return $results;
2030     }
2031     warn "---------\nLeave NZanalyse\n---------" if $DEBUG;
2032 }
2033
2034 sub NZoperatorAND{
2035     my ($rightresult, $leftresult)=@_;
2036
2037     my @leftresult = split /;/, $leftresult;
2038     warn " @leftresult / $rightresult \n" if $DEBUG;
2039
2040     #             my @rightresult = split /;/,$leftresult;
2041     my $finalresult;
2042
2043 # parse the left results, and if the biblionumber exist in the right result, save it in finalresult
2044 # the result is stored twice, to have the same weight for AND than OR.
2045 # example : TWO : 61,61,64,121 (two is twice in the biblio #61) / TOWER : 61,64,130
2046 # result : 61,61,61,61,64,64 for two AND tower : 61 has more weight than 64
2047     foreach (@leftresult) {
2048         my $value = $_;
2049         my $countvalue;
2050         ( $value, $countvalue ) = ( $1, $2 ) if ($value=~/(.*)-(\d+)$/);
2051         if ( $rightresult =~ /\Q$value\E-(\d+);/ ) {
2052             $countvalue = ( $1 > $countvalue ? $countvalue : $1 );
2053             $finalresult .=
2054                 "$value-$countvalue;$value-$countvalue;";
2055         }
2056     }
2057     warn "NZAND DONE : $finalresult \n" if $DEBUG;
2058     return $finalresult;
2059 }
2060
2061 sub NZoperatorOR{
2062     my ($rightresult, $leftresult)=@_;
2063     return $rightresult.$leftresult;
2064 }
2065
2066 sub NZoperatorNOT{
2067     my ($leftresult, $rightresult)=@_;
2068
2069     my @leftresult = split /;/, $leftresult;
2070
2071     #             my @rightresult = split /;/,$leftresult;
2072     my $finalresult;
2073     foreach (@leftresult) {
2074         my $value=$_;
2075         $value=$1 if $value=~m/(.*)-\d+$/;
2076         unless ($rightresult =~ "$value-") {
2077             $finalresult .= "$_;";
2078         }
2079     }
2080     return $finalresult;
2081 }
2082
2083 =head2 NZorder
2084
2085   $finalresult = NZorder($biblionumbers, $ordering,$results_per_page,$offset);
2086
2087   TODO :: Description
2088
2089 =cut
2090
2091 sub NZorder {
2092     my ( $biblionumbers, $ordering, $results_per_page, $offset ) = @_;
2093     warn "biblionumbers = $biblionumbers and ordering = $ordering\n" if $DEBUG;
2094
2095     # order title asc by default
2096     #     $ordering = '1=36 <i' unless $ordering;
2097     $results_per_page = 20 unless $results_per_page;
2098     $offset           = 0  unless $offset;
2099     my $dbh = C4::Context->dbh;
2100
2101     #
2102     # order by POPULARITY
2103     #
2104     if ( $ordering =~ /popularity/ ) {
2105         my %result;
2106         my %popularity;
2107
2108         # popularity is not in MARC record, it's builded from a specific query
2109         my $sth =
2110           $dbh->prepare("select sum(issues) from items where biblionumber=?");
2111         foreach ( split /;/, $biblionumbers ) {
2112             my ( $biblionumber, $title ) = split /,/, $_;
2113             $result{$biblionumber} = GetMarcBiblio($biblionumber);
2114             $sth->execute($biblionumber);
2115             my $popularity = $sth->fetchrow || 0;
2116
2117 # hint : the key is popularity.title because we can have
2118 # many results with the same popularity. In this case, sub-ordering is done by title
2119 # we also have biblionumber to avoid bug for 2 biblios with the same title & popularity
2120 # (un-frequent, I agree, but we won't forget anything that way ;-)
2121             $popularity{ sprintf( "%10d", $popularity ) . $title
2122                   . $biblionumber } = $biblionumber;
2123         }
2124
2125     # sort the hash and return the same structure as GetRecords (Zebra querying)
2126         my $result_hash;
2127         my $numbers = 0;
2128         if ( $ordering eq 'popularity_dsc' ) {    # sort popularity DESC
2129             foreach my $key ( sort { $b cmp $a } ( keys %popularity ) ) {
2130                 $result_hash->{'RECORDS'}[ $numbers++ ] =
2131                   $result{ $popularity{$key} }->as_usmarc();
2132             }
2133         }
2134         else {                                    # sort popularity ASC
2135             foreach my $key ( sort ( keys %popularity ) ) {
2136                 $result_hash->{'RECORDS'}[ $numbers++ ] =
2137                   $result{ $popularity{$key} }->as_usmarc();
2138             }
2139         }
2140         my $finalresult = ();
2141         $result_hash->{'hits'}         = $numbers;
2142         $finalresult->{'biblioserver'} = $result_hash;
2143         return $finalresult;
2144
2145         #
2146         # ORDER BY author
2147         #
2148     }
2149     elsif ( $ordering =~ /author/ ) {
2150         my %result;
2151         foreach ( split /;/, $biblionumbers ) {
2152             my ( $biblionumber, $title ) = split /,/, $_;
2153             my $record = GetMarcBiblio($biblionumber);
2154             my $author;
2155             if ( C4::Context->preference('marcflavour') eq 'UNIMARC' ) {
2156                 $author = $record->subfield( '200', 'f' );
2157                 $author = $record->subfield( '700', 'a' ) unless $author;
2158             }
2159             else {
2160                 $author = $record->subfield( '100', 'a' );
2161             }
2162
2163 # hint : the result is sorted by title.biblionumber because we can have X biblios with the same title
2164 # and we don't want to get only 1 result for each of them !!!
2165             $result{ $author . $biblionumber } = $record;
2166         }
2167
2168     # sort the hash and return the same structure as GetRecords (Zebra querying)
2169         my $result_hash;
2170         my $numbers = 0;
2171         if ( $ordering eq 'author_za' ) {    # sort by author desc
2172             foreach my $key ( sort { $b cmp $a } ( keys %result ) ) {
2173                 $result_hash->{'RECORDS'}[ $numbers++ ] =
2174                   $result{$key}->as_usmarc();
2175             }
2176         }
2177         else {                               # sort by author ASC
2178             foreach my $key ( sort ( keys %result ) ) {
2179                 $result_hash->{'RECORDS'}[ $numbers++ ] =
2180                   $result{$key}->as_usmarc();
2181             }
2182         }
2183         my $finalresult = ();
2184         $result_hash->{'hits'}         = $numbers;
2185         $finalresult->{'biblioserver'} = $result_hash;
2186         return $finalresult;
2187
2188         #
2189         # ORDER BY callnumber
2190         #
2191     }
2192     elsif ( $ordering =~ /callnumber/ ) {
2193         my %result;
2194         foreach ( split /;/, $biblionumbers ) {
2195             my ( $biblionumber, $title ) = split /,/, $_;
2196             my $record = GetMarcBiblio($biblionumber);
2197             my $callnumber;
2198             my $frameworkcode = GetFrameworkCode($biblionumber);
2199             my ( $callnumber_tag, $callnumber_subfield ) = GetMarcFromKohaField(  'items.itemcallnumber', $frameworkcode);
2200                ( $callnumber_tag, $callnumber_subfield ) = GetMarcFromKohaField('biblioitems.callnumber', $frameworkcode)
2201                 unless $callnumber_tag;
2202             if ( C4::Context->preference('marcflavour') eq 'UNIMARC' ) {
2203                 $callnumber = $record->subfield( '200', 'f' );
2204             } else {
2205                 $callnumber = $record->subfield( '100', 'a' );
2206             }
2207
2208 # hint : the result is sorted by title.biblionumber because we can have X biblios with the same title
2209 # and we don't want to get only 1 result for each of them !!!
2210             $result{ $callnumber . $biblionumber } = $record;
2211         }
2212
2213     # sort the hash and return the same structure as GetRecords (Zebra querying)
2214         my $result_hash;
2215         my $numbers = 0;
2216         if ( $ordering eq 'call_number_dsc' ) {    # sort by title desc
2217             foreach my $key ( sort { $b cmp $a } ( keys %result ) ) {
2218                 $result_hash->{'RECORDS'}[ $numbers++ ] =
2219                   $result{$key}->as_usmarc();
2220             }
2221         }
2222         else {                                     # sort by title ASC
2223             foreach my $key ( sort { $a cmp $b } ( keys %result ) ) {
2224                 $result_hash->{'RECORDS'}[ $numbers++ ] =
2225                   $result{$key}->as_usmarc();
2226             }
2227         }
2228         my $finalresult = ();
2229         $result_hash->{'hits'}         = $numbers;
2230         $finalresult->{'biblioserver'} = $result_hash;
2231         return $finalresult;
2232     }
2233     elsif ( $ordering =~ /pubdate/ ) {             #pub year
2234         my %result;
2235         foreach ( split /;/, $biblionumbers ) {
2236             my ( $biblionumber, $title ) = split /,/, $_;
2237             my $record = GetMarcBiblio($biblionumber);
2238             my ( $publicationyear_tag, $publicationyear_subfield ) =
2239               GetMarcFromKohaField( 'biblioitems.publicationyear', '' );
2240             my $publicationyear =
2241               $record->subfield( $publicationyear_tag,
2242                 $publicationyear_subfield );
2243
2244 # hint : the result is sorted by title.biblionumber because we can have X biblios with the same title
2245 # and we don't want to get only 1 result for each of them !!!
2246             $result{ $publicationyear . $biblionumber } = $record;
2247         }
2248
2249     # sort the hash and return the same structure as GetRecords (Zebra querying)
2250         my $result_hash;
2251         my $numbers = 0;
2252         if ( $ordering eq 'pubdate_dsc' ) {    # sort by pubyear desc
2253             foreach my $key ( sort { $b cmp $a } ( keys %result ) ) {
2254                 $result_hash->{'RECORDS'}[ $numbers++ ] =
2255                   $result{$key}->as_usmarc();
2256             }
2257         }
2258         else {                                 # sort by pub year ASC
2259             foreach my $key ( sort ( keys %result ) ) {
2260                 $result_hash->{'RECORDS'}[ $numbers++ ] =
2261                   $result{$key}->as_usmarc();
2262             }
2263         }
2264         my $finalresult = ();
2265         $result_hash->{'hits'}         = $numbers;
2266         $finalresult->{'biblioserver'} = $result_hash;
2267         return $finalresult;
2268
2269         #
2270         # ORDER BY title
2271         #
2272     }
2273     elsif ( $ordering =~ /title/ ) {
2274
2275 # the title is in the biblionumbers string, so we just need to build a hash, sort it and return
2276         my %result;
2277         foreach ( split /;/, $biblionumbers ) {
2278             my ( $biblionumber, $title ) = split /,/, $_;
2279
2280 # hint : the result is sorted by title.biblionumber because we can have X biblios with the same title
2281 # and we don't want to get only 1 result for each of them !!!
2282 # hint & speed improvement : we can order without reading the record
2283 # so order, and read records only for the requested page !
2284             $result{ $title . $biblionumber } = $biblionumber;
2285         }
2286
2287     # sort the hash and return the same structure as GetRecords (Zebra querying)
2288         my $result_hash;
2289         my $numbers = 0;
2290         if ( $ordering eq 'title_az' ) {    # sort by title desc
2291             foreach my $key ( sort ( keys %result ) ) {
2292                 $result_hash->{'RECORDS'}[ $numbers++ ] = $result{$key};
2293             }
2294         }
2295         else {                              # sort by title ASC
2296             foreach my $key ( sort { $b cmp $a } ( keys %result ) ) {
2297                 $result_hash->{'RECORDS'}[ $numbers++ ] = $result{$key};
2298             }
2299         }
2300
2301         # limit the $results_per_page to result size if it's more
2302         $results_per_page = $numbers - 1 if $numbers < $results_per_page;
2303
2304         # for the requested page, replace biblionumber by the complete record
2305         # speed improvement : avoid reading too much things
2306         for (
2307             my $counter = $offset ;
2308             $counter <= $offset + $results_per_page ;
2309             $counter++
2310           )
2311         {
2312             $result_hash->{'RECORDS'}[$counter] =
2313               GetMarcBiblio( $result_hash->{'RECORDS'}[$counter] )->as_usmarc;
2314         }
2315         my $finalresult = ();
2316         $result_hash->{'hits'}         = $numbers;
2317         $finalresult->{'biblioserver'} = $result_hash;
2318         return $finalresult;
2319     }
2320     else {
2321
2322 #
2323 # order by ranking
2324 #
2325 # we need 2 hashes to order by ranking : the 1st one to count the ranking, the 2nd to order by ranking
2326         my %result;
2327         my %count_ranking;
2328         foreach ( split /;/, $biblionumbers ) {
2329             my ( $biblionumber, $title ) = split /,/, $_;
2330             $title =~ /(.*)-(\d)/;
2331
2332             # get weight
2333             my $ranking = $2;
2334
2335 # note that we + the ranking because ranking is calculated on weight of EACH term requested.
2336 # if we ask for "two towers", and "two" has weight 2 in biblio N, and "towers" has weight 4 in biblio N
2337 # biblio N has ranking = 6
2338             $count_ranking{$biblionumber} += $ranking;
2339         }
2340
2341 # build the result by "inverting" the count_ranking hash
2342 # hing : as usual, we don't order by ranking only, to avoid having only 1 result for each rank. We build an hash on concat(ranking,biblionumber) instead
2343 #         warn "counting";
2344         foreach ( keys %count_ranking ) {
2345             $result{ sprintf( "%10d", $count_ranking{$_} ) . '-' . $_ } = $_;
2346         }
2347
2348     # sort the hash and return the same structure as GetRecords (Zebra querying)
2349         my $result_hash;
2350         my $numbers = 0;
2351         foreach my $key ( sort { $b cmp $a } ( keys %result ) ) {
2352             $result_hash->{'RECORDS'}[ $numbers++ ] = $result{$key};
2353         }
2354
2355         # limit the $results_per_page to result size if it's more
2356         $results_per_page = $numbers - 1 if $numbers < $results_per_page;
2357
2358         # for the requested page, replace biblionumber by the complete record
2359         # speed improvement : avoid reading too much things
2360         for (
2361             my $counter = $offset ;
2362             $counter <= $offset + $results_per_page ;
2363             $counter++
2364           )
2365         {
2366             $result_hash->{'RECORDS'}[$counter] =
2367               GetMarcBiblio( $result_hash->{'RECORDS'}[$counter] )->as_usmarc
2368               if $result_hash->{'RECORDS'}[$counter];
2369         }
2370         my $finalresult = ();
2371         $result_hash->{'hits'}         = $numbers;
2372         $finalresult->{'biblioserver'} = $result_hash;
2373         return $finalresult;
2374     }
2375 }
2376
2377 =head2 enabled_staff_search_views
2378
2379 %hash = enabled_staff_search_views()
2380
2381 This function returns a hash that contains three flags obtained from the system
2382 preferences, used to determine whether a particular staff search results view
2383 is enabled.
2384
2385 =over 2
2386
2387 =item C<Output arg:>
2388
2389     * $hash{can_view_MARC} is true only if the MARC view is enabled
2390     * $hash{can_view_ISBD} is true only if the ISBD view is enabled
2391     * $hash{can_view_labeledMARC} is true only if the Labeled MARC view is enabled
2392
2393 =item C<usage in the script:>
2394
2395 =back
2396
2397 $template->param ( C4::Search::enabled_staff_search_views );
2398
2399 =cut
2400
2401 sub enabled_staff_search_views
2402 {
2403         return (
2404                 can_view_MARC                   => C4::Context->preference('viewMARC'),                 # 1 if the staff search allows the MARC view
2405                 can_view_ISBD                   => C4::Context->preference('viewISBD'),                 # 1 if the staff search allows the ISBD view
2406                 can_view_labeledMARC    => C4::Context->preference('viewLabeledMARC'),  # 1 if the staff search allows the Labeled MARC view
2407         );
2408 }
2409
2410 sub AddSearchHistory{
2411         my ($borrowernumber,$session,$query_desc,$query_cgi, $total)=@_;
2412     my $dbh = C4::Context->dbh;
2413
2414     # Add the request the user just made
2415     my $sql = "INSERT INTO search_history(userid, sessionid, query_desc, query_cgi, total, time) VALUES(?, ?, ?, ?, ?, NOW())";
2416     my $sth   = $dbh->prepare($sql);
2417     $sth->execute($borrowernumber, $session, $query_desc, $query_cgi, $total);
2418         return $dbh->last_insert_id(undef, 'search_history', undef,undef,undef);
2419 }
2420
2421 sub GetSearchHistory{
2422         my ($borrowernumber,$session)=@_;
2423     my $dbh = C4::Context->dbh;
2424
2425     # Add the request the user just made
2426     my $query = "SELECT FROM search_history WHERE (userid=? OR sessionid=?)";
2427     my $sth   = $dbh->prepare($query);
2428         $sth->execute($borrowernumber, $session);
2429     return  $sth->fetchall_hashref({});
2430 }
2431
2432 =head2 z3950_search_args
2433
2434 $arrayref = z3950_search_args($matchpoints)
2435
2436 This function returns an array reference that contains the search parameters to be
2437 passed to the Z39.50 search script (z3950_search.pl). The array elements
2438 are hash refs whose keys are name, value and encvalue, and whose values are the
2439 name of a search parameter, the value of that search parameter and the URL encoded
2440 value of that parameter.
2441
2442 The search parameter names are lccn, isbn, issn, title, author, dewey and subject.
2443
2444 The search parameter values are obtained from the bibliographic record whose
2445 data is in a hash reference in $matchpoints, as returned by Biblio::GetBiblioData().
2446
2447 If $matchpoints is a scalar, it is assumed to be an unnamed query descriptor, e.g.
2448 a general purpose search argument. In this case, the returned array contains only
2449 entry: the key is 'title' and the value and encvalue are derived from $matchpoints.
2450
2451 If a search parameter value is undefined or empty, it is not included in the returned
2452 array.
2453
2454 The returned array reference may be passed directly to the template parameters.
2455
2456 =over 2
2457
2458 =item C<Output arg:>
2459
2460     * $array containing hash refs as described above
2461
2462 =item C<usage in the script:>
2463
2464 =back
2465
2466 $data = Biblio::GetBiblioData($bibno);
2467 $template->param ( MYLOOP => C4::Search::z3950_search_args($data) )
2468
2469 *OR*
2470
2471 $template->param ( MYLOOP => C4::Search::z3950_search_args($searchscalar) )
2472
2473 =cut
2474
2475 sub z3950_search_args {
2476     my $bibrec = shift;
2477     $bibrec = { title => $bibrec } if !ref $bibrec;
2478     my $array = [];
2479     for my $field (qw/ lccn isbn issn title author dewey subject /)
2480     {
2481         my $encvalue = URI::Escape::uri_escape_utf8($bibrec->{$field});
2482         push @$array, { name=>$field, value=>$bibrec->{$field}, encvalue=>$encvalue } if defined $bibrec->{$field};
2483     }
2484     return $array;
2485 }
2486
2487 =head2 BiblioAddAuthorities
2488
2489 ( $countlinked, $countcreated ) = BiblioAddAuthorities($record, $frameworkcode);
2490
2491 this function finds the authorities linked to the biblio
2492     * search in the authority DB for the same authid (in $9 of the biblio)
2493     * search in the authority DB for the same 001 (in $3 of the biblio in UNIMARC)
2494     * search in the authority DB for the same values (exactly) (in all subfields of the biblio)
2495 OR adds a new authority record
2496
2497 =over 2
2498
2499 =item C<input arg:>
2500
2501     * $record is the MARC record in question (marc blob)
2502     * $frameworkcode is the bibliographic framework to use (if it is "" it uses the default framework)
2503
2504 =item C<Output arg:>
2505
2506     * $countlinked is the number of authorities records that are linked to this authority
2507     * $countcreated
2508
2509 =item C<BUGS>
2510     * I had to add this to Search.pm (instead of the logical Biblio.pm) because of a circular dependency (this sub uses SimpleSearch, and Search.pm uses Biblio.pm)
2511 =back
2512
2513 =cut
2514
2515
2516 sub BiblioAddAuthorities{
2517   my ( $record, $frameworkcode ) = @_;
2518   my $dbh=C4::Context->dbh;
2519   my $query=$dbh->prepare(qq|
2520 SELECT authtypecode,tagfield
2521 FROM marc_subfield_structure
2522 WHERE frameworkcode=?
2523 AND (authtypecode IS NOT NULL AND authtypecode<>\"\")|);
2524 # SELECT authtypecode,tagfield
2525 # FROM marc_subfield_structure
2526 # WHERE frameworkcode=?
2527 # AND (authtypecode IS NOT NULL OR authtypecode<>\"\")|);
2528   $query->execute($frameworkcode);
2529   my ($countcreated,$countlinked);
2530   while (my $data=$query->fetchrow_hashref){
2531     foreach my $field ($record->field($data->{tagfield})){
2532       next if ($field->subfield('3')||$field->subfield('9'));
2533       # No authorities id in the tag.
2534       # Search if there is any authorities to link to.
2535       my $query='at='.$data->{authtypecode}.' ';
2536       map {$query.= ' and he,ext="'.$_->[1].'"' if ($_->[0]=~/[A-z]/)}  $field->subfields();
2537       my ($error, $results, $total_hits)=SimpleSearch( $query, undef, undef, [ "authorityserver" ] );
2538     # there is only 1 result
2539           if ( $error ) {
2540         warn "BIBLIOADDSAUTHORITIES: $error";
2541             return (0,0) ;
2542           }
2543       if ($results && scalar(@$results)==1) {
2544         my $marcrecord = MARC::File::USMARC::decode($results->[0]);
2545         $field->add_subfields('9'=>$marcrecord->field('001')->data);
2546         $countlinked++;
2547       } elsif (scalar(@$results)>1) {
2548    #More than One result
2549    #This can comes out of a lack of a subfield.
2550 #         my $marcrecord = MARC::File::USMARC::decode($results->[0]);
2551 #         $record->field($data->{tagfield})->add_subfields('9'=>$marcrecord->field('001')->data);
2552   $countlinked++;
2553       } else {
2554   #There are no results, build authority record, add it to Authorities, get authid and add it to 9
2555   ###NOTICE : This is only valid if a subfield is linked to one and only one authtypecode
2556   ###NOTICE : This can be a problem. We should also look into other types and rejected forms.
2557          my $authtypedata=C4::AuthoritiesMarc->GetAuthType($data->{authtypecode});
2558          next unless $authtypedata;
2559          my $marcrecordauth=MARC::Record->new();
2560          my $authfield=MARC::Field->new($authtypedata->{auth_tag_to_report},'','',"a"=>"".$field->subfield('a'));
2561          map { $authfield->add_subfields($_->[0]=>$_->[1]) if ($_->[0]=~/[A-z]/ && $_->[0] ne "a" )}  $field->subfields();
2562          $marcrecordauth->insert_fields_ordered($authfield);
2563
2564          # bug 2317: ensure new authority knows it's using UTF-8; currently
2565          # only need to do this for MARC21, as MARC::Record->as_xml_record() handles
2566          # automatically for UNIMARC (by not transcoding)
2567          # FIXME: AddAuthority() instead should simply explicitly require that the MARC::Record
2568          # use UTF-8, but as of 2008-08-05, did not want to introduce that kind
2569          # of change to a core API just before the 3.0 release.
2570          if (C4::Context->preference('marcflavour') eq 'MARC21') {
2571             SetMarcUnicodeFlag($marcrecordauth, 'MARC21');
2572          }
2573
2574 #          warn "AUTH RECORD ADDED : ".$marcrecordauth->as_formatted;
2575
2576          my $authid=AddAuthority($marcrecordauth,'',$data->{authtypecode});
2577          $countcreated++;
2578          $field->add_subfields('9'=>$authid);
2579       }
2580     }
2581   }
2582   return ($countlinked,$countcreated);
2583 }
2584
2585 =head2 GetDistinctValues($field);
2586
2587 C<$field> is a reference to the fields array
2588
2589 =cut
2590
2591 sub GetDistinctValues {
2592     my ($fieldname,$string)=@_;
2593     # returns a reference to a hash of references to branches...
2594     if ($fieldname=~/\./){
2595                         my ($table,$column)=split /\./, $fieldname;
2596                         my $dbh = C4::Context->dbh;
2597                         warn "select DISTINCT($column) as value, count(*) as cnt from $table group by lib order by $column ";
2598                         my $sth = $dbh->prepare("select DISTINCT($column) as value, count(*) as cnt from $table ".($string?" where $column like \"$string%\"":"")."group by value order by $column ");
2599                         $sth->execute;
2600                         my $elements=$sth->fetchall_arrayref({});
2601                         return $elements;
2602    }
2603    else {
2604                 $string||= qq("");
2605                 my @servers=qw<biblioserver authorityserver>;
2606                 my (@zconns,@results);
2607         for ( my $i = 0 ; $i < @servers ; $i++ ) {
2608                 $zconns[$i] = C4::Context->Zconn( $servers[$i], 1 );
2609                         $results[$i] =
2610                       $zconns[$i]->scan(
2611                         ZOOM::Query::CCL2RPN->new( qq"$fieldname $string", $zconns[$i])
2612                       );
2613                 }
2614                 # The big moment: asynchronously retrieve results from all servers
2615                 my @elements;
2616                 while ( ( my $i = ZOOM::event( \@zconns ) ) != 0 ) {
2617                         my $ev = $zconns[ $i - 1 ]->last_event();
2618                         if ( $ev == ZOOM::Event::ZEND ) {
2619                                 next unless $results[ $i - 1 ];
2620                                 my $size = $results[ $i - 1 ]->size();
2621                                 if ( $size > 0 ) {
2622                       for (my $j=0;$j<$size;$j++){
2623                                                 my %hashscan;
2624                                                 @hashscan{qw(value cnt)}=$results[ $i - 1 ]->display_term($j);
2625                                                 push @elements, \%hashscan;
2626                                           }
2627                                 }
2628                         }
2629                 }
2630                 return \@elements;
2631    }
2632 }
2633
2634
2635 END { }    # module clean-up code here (global destructor)
2636
2637 1;
2638 __END__
2639
2640 =head1 AUTHOR
2641
2642 Koha Developement team <info@koha.org>
2643
2644 =cut