Added word ICU config for da (Danish).
authorAdam Dickmeiss <adam@indexdata.dk>
Mon, 17 Dec 2007 12:22:05 +0000 (12:22 +0000)
committerAdam Dickmeiss <adam@indexdata.dk>
Mon, 17 Dec 2007 12:22:05 +0000 (12:22 +0000)
tab/Makefile.am
tab/words-icu-da.xml [new file with mode: 0644]
tab/words-icu.xml

index f882707..900efd3 100644 (file)
@@ -1,4 +1,4 @@
-## $Id: Makefile.am,v 1.10 2007-12-13 18:10:35 adam Exp $
+## $Id: Makefile.am,v 1.11 2007-12-17 12:22:05 adam Exp $
 
 tabdatadir = $(datadir)/$(PACKAGE)$(PACKAGE_SUFFIX)/tab
 tabdata_DATA = bib1.att dan1.att danmarc.abs danmarc.mar \
@@ -9,7 +9,8 @@ tabdata_DATA = bib1.att dan1.att danmarc.abs danmarc.mar \
  nwi.flt refer.flt scan.chr sgml.flt soif.flt string.chr summary.abs \
  summary.tag tagsetg.tag tagsetm.tag urx.chr usmarc.abs usmarc-b.est \
  usmarc.flt usmarc.mar usmarc.tag var1.var wais.abs wais-b.est \
- wais-variant.est marc21.abs words-icu.xml phrases-icu.xml icu.idx
+ wais-variant.est marc21.abs words-icu.xml phrases-icu.xml words-icu-da.xml \
+ icu.idx
 
 EXTRA_DIST = $(tabdata_DATA)
 
diff --git a/tab/words-icu-da.xml b/tab/words-icu-da.xml
new file mode 100644 (file)
index 0000000..60677d0
--- /dev/null
@@ -0,0 +1,7 @@
+<icu_chain locale="da_DK">
+  <transform rule="[:Control:] Any-Remove"/>
+  <tokenize rule="l"/>
+  <transform rule="[[:WhiteSpace:][:Punctuation:]] Remove"/>
+  <display/>
+  <casemap rule="l"/>
+</icu_chain>
index 1b0e9e2..537cc9b 100644 (file)
@@ -1,4 +1,4 @@
-<icu_chain id="en:word" locale="en">
+<icu_chain locale="en">
   <transform rule="[:Control:] Any-Remove"/>
   <tokenize rule="l"/>
   <transform rule="[[:WhiteSpace:][:Punctuation:]] Remove"/>