[Reddes.bvs-tech] [bvstech] Problema con indizacion por palabra

Francisco J D M Lopes Santos francisco.lopes at bireme.org
Tue Jul 26 12:59:31 BRST 2011


Hola, Hello, Olá, 

[es] 
El problema ocurre en realidad y no sólo en la versión 5.x, pero en las anteriores también, de acuerdo con las pruebas realizadas aquí. 

Yo sugiero utilizar, por defecto, las cláusulas de "actab =" y "uctab =" con las tablas que se muestran, cuando se usan caracteres (ANSI o ISO-8859-1). 

Otras tablas se pueden obtener en la página web de BIREME (dirección 'http://bvsmodelo.bvsalud.org/php/level.php?lang=es&component=28&item=1 ") en "Tablas disponibles", donde se pueden encontrar los archivos "acans.tab" y "ucans.tab", además de variaciones útiles. 

---------------- 
[en] 
The problem actually occurs and not only in version 5.x, but in the old versions too, according to tests carried out here. 

I suggest using, by default, the clauses "actab =" and "uctab =" with the tables shown, when using ANSI (or ISO-8859-1) characters. 

Other tables can be obtained at the BIREME website (address ' http://bvsmodelo.bvsalud.org/php/level.php?lang=en&component=31&item=1') in "Available tables", where the files "acans.tab" and "ucans.tab" will be found, and useful variations additionally. 

---------------- 

[pt-BR] 
O problema, realmente, ocorre e não apenas na versão 5.x, mas também nas anteriores, segundo os testes realizados por aqui. 

Eu sugiro utilizar, por padrão, as cláusulas "actab=" e "uctab=" com as tabelas indicadas, quando forem utilizados caracteres ANSI (ou ISO-8859-1). 

Outras tabelas podem ser obtidas no website da BIREME (endereço 'http://bvsmodelo.bvsalud.org/php/level.php?lang=pt&component=28&item=1') no item "Tabelas disponíveis", onde serão encontrados os arquivos "acans.tab" e "ucans.tab" além de variações úteis. 



Sinceramente, con los deseos para el éxito continuo, 


Sincerely, with wishes for continued success, 
Atenciosamente, com votos de sucesso continuado, 



Francisco José Lopes 
--- 
Analista de Sistemas 
BIREME / OPS / OMS 
http://www.bireme.org 



De: "spinaker" <spinaker at adinet.com.uy> 
Para: "reddes bvs-tech" <reddes.bvs-tech at listas.bireme.br> 
Enviadas: Segunda-feira, 25 de Julho de 2011 17:20:39 
Assunto: [bvstech] [Reddes.bvs-tech] Problema con indizacion por palabra 

Prezados 

Tengo un problema con la indización palabra por palabra usando MX 5.x en todas sus versiones 
He indizado una base de ejemplo de 1.000 registros con las siguientes FSTs, tanto en ASCII como en ANSI 
las indicé usando mx 1030, 1660, y LIND con los siguientes resultados 

FST word1.fst 
12 4 v12 
18 4 v18 
72 4 v72 

FST word2.fst 
12 8 '/TW_/',v12 
18 8 '/TW_/',v18 
72 8 '/TW_/',v72 

La base wtest está en ascii, y la wtest2 es la misma en ansi 
1) mx wtest fst=@word1.fst fullinv=word1 no da problemas ni 1030, 1660, lind, sea ascii y ansi 

Pero si uso 
2) mx wtest2 fst=@word1.fst fullinv/ansi=word2 
entonces encuentro que indiza también números y palabras con "trailing special chars" como la lista parcial abajo 
1|0 
3|000 
1|02: 
1|1151? 
1|2A 
4|2O 
1|ABIERTAS 
1|ABIERTAS: 
5|ABUSIVAS 
1|ABUSIVAS: 
1|ACCION: 
3|ADJUDICACION 
1|ADJUDICACION: 
1|ADJUDICACIONES 
7|ADQUISICION 
1|ADQUISICION: 
2|ADQUISITIVA 
3|ANTIJURIDICIDAD 
1|ANTIJURIDICIDAD; 
6|AUTORIDAD 
1|AUTORIDAD? 
27|BANCARIA 
1|BANCARIA? 
27|VIGENTE 
2|VIGENTE? 
1|VII: 
2|VIII 
1|VIII: 

En cambio si uso la siguiente línea no hay problema (isisuc y isisac son las distribuidas en ABCD) 
mx wtest fst=@word1.fst uctab=isisuc.tab actab=isisac.tab fullinv=word1 

¿Es posible que hay un bug en mx donde el parámetro fullinv/ansi causa ese error? 
cual tabla isisuc y actab tiene built-in el mx? 
Si precisan los datos de prueba, puedo enviarlo en un archivo .rar que pesa 500Kb 

abc 
Ernesto Spinak 
-- 
  .^.                                .^.
  ( )                                ( )
  ===                                ===
 =[=]================================[=]=
  | |  Ernesto Spinak                | |
  | | spinaker at adinet.com.uy | |
  | |  Montevideo, Uruguay           | |
  | |  tel/fax  (598) 2622-3352      | |
  | |  celular  (598) 99612238      | |
 =[=]================================[=]=
  ===                                ===
  ( )                                ( )
   V                                  V 
_______________________________________________ 
Reddes.bvs-tech mailing list 
Reddes.bvs-tech at listas.bireme.br 
http://listas.bireme.br/mailman/listinfo/reddes.bvs-tech 
-------------- next part --------------
An HTML attachment was scrubbed...
URL: http://listas.bireme.br/pipermail/reddes.bvs-tech/attachments/20110726/45a354f7/attachment.html 


More information about the Reddes.bvs-tech mailing list