[Reddes.bvs-tech] [bvstech] Problema con indizacion por palabra
Francisco J D M Lopes Santos
francisco.lopes at bireme.org
Tue Jul 26 12:59:31 BRST 2011
Hola, Hello, Olá,
[es]
El problema ocurre en realidad y no sólo en la versión 5.x, pero en las anteriores también, de acuerdo con las pruebas realizadas aquí.
Yo sugiero utilizar, por defecto, las cláusulas de "actab =" y "uctab =" con las tablas que se muestran, cuando se usan caracteres (ANSI o ISO-8859-1).
Otras tablas se pueden obtener en la página web de BIREME (dirección 'http://bvsmodelo.bvsalud.org/php/level.php?lang=es&component=28&item=1 ") en "Tablas disponibles", donde se pueden encontrar los archivos "acans.tab" y "ucans.tab", además de variaciones útiles.
----------------
[en]
The problem actually occurs and not only in version 5.x, but in the old versions too, according to tests carried out here.
I suggest using, by default, the clauses "actab =" and "uctab =" with the tables shown, when using ANSI (or ISO-8859-1) characters.
Other tables can be obtained at the BIREME website (address ' http://bvsmodelo.bvsalud.org/php/level.php?lang=en&component=31&item=1') in "Available tables", where the files "acans.tab" and "ucans.tab" will be found, and useful variations additionally.
----------------
[pt-BR]
O problema, realmente, ocorre e não apenas na versão 5.x, mas também nas anteriores, segundo os testes realizados por aqui.
Eu sugiro utilizar, por padrão, as cláusulas "actab=" e "uctab=" com as tabelas indicadas, quando forem utilizados caracteres ANSI (ou ISO-8859-1).
Outras tabelas podem ser obtidas no website da BIREME (endereço 'http://bvsmodelo.bvsalud.org/php/level.php?lang=pt&component=28&item=1') no item "Tabelas disponíveis", onde serão encontrados os arquivos "acans.tab" e "ucans.tab" além de variações úteis.
Sinceramente, con los deseos para el éxito continuo,
Sincerely, with wishes for continued success,
Atenciosamente, com votos de sucesso continuado,
Francisco José Lopes
---
Analista de Sistemas
BIREME / OPS / OMS
http://www.bireme.org
De: "spinaker" <spinaker at adinet.com.uy>
Para: "reddes bvs-tech" <reddes.bvs-tech at listas.bireme.br>
Enviadas: Segunda-feira, 25 de Julho de 2011 17:20:39
Assunto: [bvstech] [Reddes.bvs-tech] Problema con indizacion por palabra
Prezados
Tengo un problema con la indización palabra por palabra usando MX 5.x en todas sus versiones
He indizado una base de ejemplo de 1.000 registros con las siguientes FSTs, tanto en ASCII como en ANSI
las indicé usando mx 1030, 1660, y LIND con los siguientes resultados
FST word1.fst
12 4 v12
18 4 v18
72 4 v72
FST word2.fst
12 8 '/TW_/',v12
18 8 '/TW_/',v18
72 8 '/TW_/',v72
La base wtest está en ascii, y la wtest2 es la misma en ansi
1) mx wtest fst=@word1.fst fullinv=word1 no da problemas ni 1030, 1660, lind, sea ascii y ansi
Pero si uso
2) mx wtest2 fst=@word1.fst fullinv/ansi=word2
entonces encuentro que indiza también números y palabras con "trailing special chars" como la lista parcial abajo
1|0
3|000
1|02:
1|1151?
1|2A
4|2O
1|ABIERTAS
1|ABIERTAS:
5|ABUSIVAS
1|ABUSIVAS:
1|ACCION:
3|ADJUDICACION
1|ADJUDICACION:
1|ADJUDICACIONES
7|ADQUISICION
1|ADQUISICION:
2|ADQUISITIVA
3|ANTIJURIDICIDAD
1|ANTIJURIDICIDAD;
6|AUTORIDAD
1|AUTORIDAD?
27|BANCARIA
1|BANCARIA?
27|VIGENTE
2|VIGENTE?
1|VII:
2|VIII
1|VIII:
En cambio si uso la siguiente línea no hay problema (isisuc y isisac son las distribuidas en ABCD)
mx wtest fst=@word1.fst uctab=isisuc.tab actab=isisac.tab fullinv=word1
¿Es posible que hay un bug en mx donde el parámetro fullinv/ansi causa ese error?
cual tabla isisuc y actab tiene built-in el mx?
Si precisan los datos de prueba, puedo enviarlo en un archivo .rar que pesa 500Kb
abc
Ernesto Spinak
--
.^. .^.
( ) ( )
=== ===
=[=]================================[=]=
| | Ernesto Spinak | |
| | spinaker at adinet.com.uy | |
| | Montevideo, Uruguay | |
| | tel/fax (598) 2622-3352 | |
| | celular (598) 99612238 | |
=[=]================================[=]=
=== ===
( ) ( )
V V
_______________________________________________
Reddes.bvs-tech mailing list
Reddes.bvs-tech at listas.bireme.br
http://listas.bireme.br/mailman/listinfo/reddes.bvs-tech
-------------- next part --------------
An HTML attachment was scrubbed...
URL: http://listas.bireme.br/pipermail/reddes.bvs-tech/attachments/20110726/45a354f7/attachment.html
More information about the Reddes.bvs-tech
mailing list