XML reader for data1 (EXPAT)
[idzebra-moved-to-github.git] / CHANGELOG
1
2 --- 1.2.0 2002/MM/DD
3
4 XML filter (-t grs.xml).
5
6 Multiple registers. New setting in resource 'root' that holds base
7 directory for register(s). A group a databases may be put in separate
8 register in directory root/reg by using db name 'reg/db1' ... 'reg/dbN'.
9
10 --- 1.1.1 2002/03/21
11
12 Fixes for Digital Unix
13
14 Implemented hits per term using USR:SearchResult-1.
15
16 New Zebra API. Locking system re-implemented.
17
18 --- 1.1.stable 2002/02/20
19
20 Rank weight can be controlled with attribute type 9. Default
21 value is 34. Recommended values between 1-36.
22
23 --- 1.1 2001/10/25
24
25 Updated for YAZ version 1.8.
26
27 Added support for termsets - a result set of terms matching
28 a given query. For @attr 8=<set> creates termset named <set>.
29
30 Added support for raw retrieval. Element Set Name R forces the
31 text filter which returns the record in its original form.
32
33 Added numerical sort - triggered by structure=numeric (4=109).
34
35 Remote record import using Z39.50 Extended Services and Segments.
36
37 Fixed bug where updating a database with user-defined attributes
38 could corrupt the register (bad storeKeys).
39
40 Multi-threaded version.
41
42 Fixed bug regarding proximity.
43
44 Documentation updates.
45
46 Fixed bug in record retrieval module that occured on 64-bit OSF 
47 architectures.
48
49 --- 1.0.1 2000/2/10
50
51 Fixed bug in makefile for WIN32.
52
53 Fixed bug in configure script - used bash-specific features.
54
55 --- 1.0 1999/12/10
56
57 The software was split in two products Zebra (for testing,
58 non-profit use) and the commercial product Z'mbol. Zebra no
59 longer supports INDEX UPDATES, i.e. zebraidx should be invoked only
60 once for each register. Refer to LICENSE.zebra for more info.
61
62 Added support for multiple records in one file for filter grs.sgml.
63
64 Changed record index structure. New layout is incompatible with
65 previous releases. Added setting "recordcompression" to control
66 compression of records. Possible values are "none" (no
67 compression) and bzip2 (compression using libbz2).
68
69 Added XML transfer syntax support for retrieval of structured records.
70 Schema in CompSpec is recognised in retrieval of structured records.
71
72 Changed Tcl record filter so that it attemps to read  <filt>.tflt. If
73 that fails, the filter reads the file <filt>.flt (regx style filter).
74
75 Implemented new Tcl record filter -  use grs.tcl.<filter> to enable it.
76 Zebra's configure script automatically attempts to locate Tcl. For
77 manual Tcl configuration use option --with-tclconfig=<path> to specify
78 where Tcl's library files are located.
79
80 Implemented "compression" of Dictionary and ISAM system. Dictionary
81 format HAS changed.
82
83 Added "tagsysno" directive to zebra.cfg to control under which tag the
84 system ID is placed. Use tagsysno: 0 to disable Zebra's system number
85 entirely.
86
87 Added "tagrank" as above.
88
89 Changed file naming scheme for register files from <name>.mf.<no> to
90 <name>-<no>.mf.
91
92 Implemented "position"-flag for register type (as defined in
93 default.idx). When set to zero no position (or seqence number) is
94 saved in register for each word occurrence, thus saving some register
95 space.
96
97 Implemented database mapping. Using mapdb one can specify a database
98 to be mapped to one or more physical databases. Usage:
99 mapdb <fromdb> <todb> ..
100
101 Added SOIF-filter. Thanks to Peter Valkenburg.
102
103 For the regx-filter "end element -record" may trigger a mark-of-record
104 if outer level is reached.
105
106 Tag sets may be typed in the reference to it. From the .abs-file the
107 "tagset" directive takes a third optional integer type for the tag set
108 referenced. From a .tag-file the "include" directive takes a third
109 optional type as well. The old "type" directive in the tag set itself
110 is still recognized but acts as the default type for the tag set.
111  
112 Zebra supports the specification of arbitrary attributes sets, schemas
113 and tag sets, because of the change in YAZ' OID management system.
114
115 Fixed bug in Sort that caused it NOT to use character mapping as it
116 should.
117
118 Zebra now uses GNU configure to generate Makefile(s).
119
120 Added un-optimised support for left and left/right truncation attributes.
121
122 Added support for relational operators on text when using RPN queries.
123
124 Added support for sort specifications in RPN queries. Type 7 specifies
125 'sort' where value 1=ascending, value 2=descending. The use attribute
126 specifies the field criteria as usual.  The term specifies priority
127 where 0=first, 1=second, ...
128
129 Changed the way use attributes are specified in the recordId
130 specification.
131
132 Maximum number of databases in one Zebra register increased.
133
134 New setting, databasePath, which specifies that first directory during
135 update traversal is the database name (instead of a fixed one).
136
137 New setting, explainDatabase, which specifies that databases are
138 EXPLAIN aware.
139
140 Modified Zebra so that it works with ASN.1 compiled code for YAZ.
141
142 Implemented EXPLAIN database maintenance. Zebra automatically
143 generate - and update CategoryList, TargetInfo, DatabaseInfo,
144 AttributeSetInfo and AttributeDetails records at this stage. The
145 records may be transferred as GRS-1, SUTRS or Explain.
146
147 Fixed register spec so that colon isn't treated as size separator
148 unless followed by [0-9+-] in order to allow DOS drive specifications.
149
150 Fixed two bugs in ISAMC system.
151
152 Changed the way Zebra keeps its maintenance information about attribute
153 sets, available attributes, etc.. Records in "SGML" notation using an
154 EXPLAIN schema is now used when appropriate.
155
156 Bug fix: Index didn't handle update/insert/delete of the same record
157 (i.e. same recordId) in one run (one invocation of zebraidx). Only the
158 first occurence of a record is considered.
159
160 Most searches now return correct number of hits.
161
162 New modular ranking system. Interested programmers are encouraged to
163 inspect rank1.c and improve the algorithm.
164
165 Bug fix: Lock files weren't removed as they should on NT.
166
167 Implemented Z39.50 Sort. Zebra's sort handler uses use attributes to
168 specify a "sort register". Refer to the gils sample records which refer
169 to index type "s" which is specified as "sort" in the default.idx file.
170 Each sort criteria can either be Ascending or Descending and at most
171 three sort elements can be specified.  
172
173 Bug fix: Character mapping didn't work for text files.
174
175 --- 1.0b1 1998/1/29
176
177 Simple ranked searches now return correct number of hits.
178
179 The test option (-s) only makes a read-lock on the index as well
180 as using read-only operations anywhere.
181
182 Moved towards generic character mapping. Configuration file default.idx
183 specifies character map files for register types w, p, u, etc.
184
185 Implemented "begin variant" for the sgml.regx - filter.
186
187 Fixed a few memory leaks.
188
189 Added support for C++, headers uses extern "C" for public definitions.
190
191 Bug fix: The show records facility (-s) only displayed information for
192 the first record in a file (and not for every record in the file).
193
194 Added option "-f <n>" to limit the logging of record operations. After
195 <n> records has been processed no logging is performed (unless errors
196 occur).
197
198 Bug fix: the compressed ISAM system didn't handle update operations
199 correctly.
200
201 Added setting, "maxResultSetSize", to hold the number of records to 
202 save in a result set.
203
204 Bug fix: Complete phrase did't work for search operations.
205
206 Bug fix: temporary result sets weren't deleted.
207
208 Reduced disk space for saved keys (storeKeys = 1).
209
210 Added optional, physical ANY (key replication)
211
212 Implemented proximity operator in search.
213
214 Bug fix: the path name buffers used by file match traversal routines
215 have been extended to support long file names.
216
217 New C(ompressed) ISAM system. To enable it, specify "isam: c" in the
218 configuration file. The resulting register without "storeKeys" is about
219 half the size, and the memory used by zebraidx during phase 2 (merge) is
220 reduced to a minimum.
221
222 Reworked the way Regexp-2 queries with error tolerance are handled and
223 specified. The documentation has been updated accordingly.
224
225 Bug fix: Zebrasrv didn't search correctly when queries contained masking
226 characters. This bug was introduced in 1.0a8.
227
228 Zebrasrv now tag records with the proper database name.
229
230 New settings, memMax and keyTmpDir.
231
232 Changed name of setting lockDir (previously called lockPath) and
233 setTmpDir (previously called tempSetPath).
234
235 Generalized and changed record type specifications. In short, there are:
236        text                plain SUTRS
237        grs.sgml            structured, "SGML-like" syntax
238        grs.regx.<filter>   structured, Regular expression filter
239        grs.marc.<abs>      Reads *MARC records in the ISO2709 format. <abs>
240                            is the name of an abstract syntax file.                           
241 Bug fix: Result sets weren't sorted in operations involving boolean
242 operations with "ranked" operands.
243
244 --- 1.0a8 1996/6/6
245
246 Added national character-handling subsystem.
247
248 Various fixes.
249
250 Small modifications to input filters and profiles.
251
252 Added support for SOIF syntax (with private OID).
253
254 --- 1.0a7 1996/5/16
255
256 Fixed buffer-size problem in indexing.
257
258 Added compression to temporary files for updating.
259
260 Added phrase registers.
261
262 Added dynamic mapping of search attribute to multiple termlists (ANY).
263
264 Scan support in multiple databases/registers.
265
266 Configuration settings are case-insensitive and single dash (-)
267 characters are ignored in comparisons.
268
269 The index processing ignores empty files - warning given.
270
271 New option to zebraidx (-V) displays version information.
272
273 --- 1.0a6 1996/2/24
274
275 Fixed problem in file-update system.
276
277 Fixed problem in shadow system; register was sometimes corrupted after
278 a commit operation.
279
280 --- 1.0a5 1996/2/10
281
282 Fixed problems in the ISAM subsystem. Caused difficulties when updating
283 existing registers.
284
285 Fixed small problem in SUTRS-filter. A newline was sometimes inserted before
286 the rank and record number.
287
288 Fixed bug in the isam subsystem - caused a malfunction when accessing
289 words which occurred more than 10000 times.
290
291 Distribution should now include YAZ (Z39.50 protocol stack) to simplify
292 installation.
293
294 Server can now run under inetd. Use option -i, and -w <directory> to
295 set working directory to desired location.
296
297 New zebraidx command: clean - removes temporary shadow files.
298
299 Fixed bug in ISAM system. Occurred rarely during register updates.
300
301 Logging during index merge phase is improved. The remaining running
302 time is estimated.
303
304 Temporary files generated by zebraidx are removed after each run.
305
306 Bug fix: Dictionary didn't handle 8-bit characters correctly; was obvious
307 when doing scan operations in dictionaries with European characters.
308
309 --- 1.0a4 1996/01/11
310
311 A whole slew of updates, to make the first publicized release. Get the doc
312 and check it out.
313
314 --- 1.0a3 1995/12/06
315
316 Memory-problems in ISAM fixed. More blocktypes added to the default setup
317 to increase performance on larger databases.
318
319 Various minor changes in data management system.
320
321 --- 1.0a2 1995/12/05
322
323 A couple of portability-problems resolved.
324
325 Changed some malloc() to xmalloc().
326
327 --- 1.0a1 1995/11/28
328
329 First release.