Apache Solr på Svenska

timbrandin's picture

Hej,
finns det någon som satt upp en Apache Solr på svenska förut?

I så fall, vad har du/ni för erfarenhet, vad bör man tänka på?
Några tips kanske?

// Tim

Comments

Om man bortser från själva

Cristobal Wetzig's picture

Om man bortser från själva applikationen (fonetiskt sök? språkigenkänning? etc etc) så skulle jag nog säga 3 "hygieninställningar".

  1. Om du kör tomcat, se till att den är inställd att klara åäö som get-parametrar (utf-8)
  2. Se till att tomcat klarar av att leverera utf8 i requestet.
  3. Ändra ASCIIFoldingFilterFactory så solr förstår frågor med ÅÄÖ genom att ta bort ISOLatin1Accent i schemat. Se nedan

<analyzer type="query">
    <!--  AVKOMMENTERA DENNA!
    <filter class="solr.ASCIIFoldingFilterFactory"/>
    <charFilter class="solr.MappingCharFilterFactory" mapping="mapping-ISOLatin1Accent.txt"/>
    -->
    <tokenizer class="solr.WhitespaceTokenizerFactory"/>
    <filter class="solr.SynonymFilterFactory" synonyms="synonyms.txt" ignoreCase="true" expand="true"/>
    <filter class="solr.StopFilterFactory"
            ignoreCase="true"
            words="stopwords.txt"
            enablePositionIncrements="true"
            />
    <filter class="solr.WordDelimiterFilterFactory"
            protected="protwords.txt"
            generateWordParts="1"
            generateNumberParts="1"
            catenateWords="0"
            catenateNumbers="0"
            catenateAll="0"
            splitOnCaseChange="1"
            preserveOriginal="1"/>
    <filter class="solr.LowerCaseFilterFactory"/>
    <filter class="solr.SnowballPorterFilterFactory" language="English" protected="protwords.txt"/>
    <filter class="solr.RemoveDuplicatesTokenFilterFactory"/>
  </analyzer>
</fieldType>

Grymt. Ska prova detta! Stort

timbrandin's picture

Grymt. Ska prova detta!
Stort tack för din tid! // Tim

Gött

Cristobal Wetzig's picture

Fint! Dela gärna med dig av dina erfarenheter!