Configured build for Ubuntu and added Stempel polish analyzer
[pylucene.git] / lucene-java-3.4.0 / lucene / contrib / benchmark / scripts / collation.bm2jira.pl
1 #!/usr/bin/perl
2 #
3 # Licensed to the Apache Software Foundation (ASF) under one or more
4 # contributor license agreements.  See the NOTICE file distributed with
5 # this work for additional information regarding copyright ownership.
6 # The ASF licenses this file to You under the Apache License, Version 2.0
7 # (the "License"); you may not use this file except in compliance with
8 # the License.  You may obtain a copy of the License at
9
10 #     http://www.apache.org/licenses/LICENSE-2.0
11 #
12 # Unless required by applicable law or agreed to in writing, software
13 # distributed under the License is distributed on an "AS IS" BASIS,
14 # WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
15 # See the License for the specific language governing permissions and
16 # limitations under the License.
17 #
18 # ----------
19 # bm2jira.pl
20 #
21 # Converts Lucene contrib-benchmark output produced using the 
22 # benchmark.collation.alg file into a JIRA-formatted table.
23 #
24
25 use strict;
26 use warnings;
27
28 my %min_elapsed = ();
29
30 while (<>) {
31   if (/(\S+)(Keyword|JDK|ICU)_\d+\s*([^\s{].*)/) {
32     my $lang = $1;
33     my $analyzer = $2;
34     my $stats = $3;
35     my ($elapsed) = $stats =~ /(?:[\d,.]+[-\s]*){4}([.\d]+)/;
36     $min_elapsed{$analyzer}{$lang} = $elapsed
37       unless (defined($min_elapsed{$analyzer}{$lang})
38               && $elapsed >= $min_elapsed{$analyzer}{$lang});
39   }
40 }
41
42 # Print out platform info
43 print "JAVA:\n", `java -version 2>&1`, "\nOS:\n";
44 if ($^O =~ /win/i) {
45   print "$^O\n";
46   eval {
47     require Win32;
48     print Win32::GetOSName(), "\n", Win32::GetOSVersion(), "\n";
49   };
50   die "Error loading Win32: $@" if ($@);
51 } else {
52   print `uname -a 2>&1`;
53 }
54
55 print "\n||Language||java.text||ICU4J||KeywordAnalyzer||ICU4J Improvement||\n";
56
57 for my $lang (sort keys %{$min_elapsed{ICU}}) {
58   my $ICU = $min_elapsed{ICU}{$lang};
59   my $JDK = $min_elapsed{JDK}{$lang};
60   my $keyword = $min_elapsed{Keyword}{$lang};
61   my $improved = int(100 * ($JDK - $ICU) / ($ICU - $keyword) + 0.5);
62   printf "|$lang|${JDK}s|${ICU}s|${keyword}s|\%d%%|\n", $improved;
63 }