PyLucene 3.4.0-1 import
[pylucene.git] / samples / LuceneInAction / lia / tools / HighlightTest.py
1 # ====================================================================
2 #   Licensed under the Apache License, Version 2.0 (the "License");
3 #   you may not use this file except in compliance with the License.
4 #   You may obtain a copy of the License at
5 #
6 #       http://www.apache.org/licenses/LICENSE-2.0
7 #
8 #   Unless required by applicable law or agreed to in writing, software
9 #   distributed under the License is distributed on an "AS IS" BASIS,
10 #   WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
11 #   See the License for the specific language governing permissions and
12 #   limitations under the License.
13 # ====================================================================
14
15 from lia.common.LiaTestCase import LiaTestCase
16
17 from lucene import \
18      SimpleAnalyzer, Term, IndexSearcher, TermQuery, \
19      Highlighter, QueryScorer, StringReader, Version
20
21
22 class HighlightTest(LiaTestCase):
23
24     def testHighlighting(self):
25
26         text = "The quick brown fox jumps over the lazy dog"
27
28         query = TermQuery(Term("field", "fox"))
29         scorer = QueryScorer(query)
30         highlighter = Highlighter(scorer)
31
32         tokenStream = SimpleAnalyzer(Version.LUCENE_CURRENT).tokenStream("field", StringReader(text))
33
34         self.assertEqual("The quick brown <B>fox</B> jumps over the lazy dog",
35                          highlighter.getBestFragment(tokenStream, text))
36
37     def testHits(self):
38
39         searcher = IndexSearcher(self.directory, True)
40         query = TermQuery(Term("title", "action"))
41         scoreDocs = searcher.search(query, 50).scoreDocs
42
43         scorer = QueryScorer(query)
44         highlighter = Highlighter(scorer)
45
46         for scoreDoc in scoreDocs:
47             doc = searcher.doc(scoreDoc.doc)
48             title = doc["title"]
49             stream = SimpleAnalyzer(Version.LUCENE_CURRENT).tokenStream("title", StringReader(title))
50             fragment = highlighter.getBestFragment(stream, title)
51     
52             print fragment