<html><head><style type='text/css'>p { margin: 0; }</style></head><body><div style='font-family: Arial; font-size: 12pt; color: #000000'><b>De: </b>"Francisco J D M Lopes Santos" <francisco.lopes@bireme.org><br><b>Para: </b>"reddes bvs-tech" <reddes.bvs-tech@listas.bireme.br><br><b>Enviadas: </b>Terça-feira, 26 de Julho de 2011 10:59:31<br><b>Assunto: </b>Re: [Reddes.bvs-tech] [bvstech] Problema con indizacion por palabra<br><br><style>p { margin: 0; }</style><div style="font-family: Arial; font-size: 12pt; color: rgb(0, 0, 0);"><span>Hola, Hello, Olá,<br><br>[es]<br>El problema ocurre en realidad y no sólo en la versión 5.x, pero en las anteriores también, de acuerdo con las pruebas realizadas aquí.<br><br>Yo sugiero utilizar, por defecto, las cláusulas de "actab =" y "uctab =" con las tablas que se muestran, cuando se usan caracteres (ANSI o ISO-8859-1).<br><br>Otras tablas se pueden obtener en la página web de BIREME (dirección 'http://bvsmodelo.bvsalud.org/php/level.php?lang=es&component=28&item=1 ") en "Tablas disponibles", donde se pueden encontrar los archivos "acans.tab" y "ucans.tab", además de variaciones útiles.<br><br></span><span id="0b348432-6776-4165-9653-078698292799">----------------<br>
</span>[en]<br><span id="0b348432-6776-4165-9653-078698292799">The problem actually occurs and not only in version 5.x, but in the old versions too, according to tests carried out here.<br><br>I suggest using, by default, the clauses "actab =" and "uctab =" with the tables shown, when using ANSI (or ISO-8859-1) characters.<br><br>Other tables can be obtained at the BIREME website (address ' http://bvsmodelo.bvsalud.org/php/level.php?lang=en&component=31&item=1') in "Available tables", where the files "acans.tab" and "ucans.tab" will be found, and useful variations additionally.<br></span><br><span id="0b348432-6776-4165-9653-078698292799">----------------<br>
</span><br><span id="0b348432-6776-4165-9653-078698292799">[pt-BR]<br>
O problema, realmente, ocorre e não apenas na versão 5.x, mas também nas anteriores, segundo os testes realizados por aqui.<br>
<br>
Eu sugiro utilizar, por padrão, as cláusulas "actab=" e "uctab=" com as
tabelas indicadas, quando forem utilizados caracteres ANSI (ou
ISO-8859-1).<br>
<br>
Outras tabelas podem ser obtidas no website da BIREME (endereço
'http://bvsmodelo.bvsalud.org/php/level.php?lang=pt&component=28&item=1')
no item "Tabelas disponíveis", onde serão encontrados os arquivos
"acans.tab" e "ucans.tab" além de variações úteis.<br>
<br>
</span><span id="0b348432-6776-4165-9653-078698292799"><br></span><div style="" dir="ltr"><span id="result_box" lang="es"><span class="hps" title="Clique para mostrar traduções alternativas">Sinceramente,</span> <span class="hps" title="Clique para mostrar traduções alternativas">con
los deseos</span> <span class="hps" title="Clique para mostrar traduções alternativas">para el éxito continuo,</span></span><br></div>
<div id="gt-res-content" class="almost_half_cell">
<div style="" dir="ltr"><span id="result_box" class="short_text" lang="en"><span class="hps" title="Clique para mostrar traduções alternativas">Sincerely,</span> <span class="hps" title="Clique para mostrar traduções alternativas">with wishes for</span> <span class="hps" title="Clique para mostrar traduções alternativas">continued success,</span></span><br></div></div><span id="0b348432-6776-4165-9653-078698292799">Atenciosamente, com votos de sucesso continuado,<br>
</span>
<div id="gt-res-content" class="almost_half_cell">
<div style="" dir="ltr"><span id="result_box" lang="es"><span class="hps" title="Clique para mostrar traduções alternativas"></span></span></div></div>
<br><span id="0b348432-6776-4165-9653-078698292799">Francisco José Lopes<br>---<br>Analista de Sistemas<br>BIREME / OPS / OMS<br>http://www.bireme.org<br><span></span></span><br><div style="font-family: Verdana; font-size: 12pt; color: rgb(0, 0, 0);"><hr id="zwchr"><b>De: </b>"spinaker" <spinaker@adinet.com.uy><br><b>Para: </b>"reddes bvs-tech" <reddes.bvs-tech@listas.bireme.br><br><b>Enviadas: </b>Segunda-feira, 25 de Julho de 2011 17:20:39<br><b>Assunto: </b>[bvstech] [Reddes.bvs-tech] Problema con indizacion por palabra<br><br>
<big>Prezados<br>
<br>
Tengo un problema con la indización palabra por palabra usando MX
5.x en todas sus versiones<br>
He indizado una base de ejemplo de 1.000 registros con las
siguientes FSTs, tanto en ASCII como en ANSI<br>
las indicé usando mx 1030, 1660, y LIND con los siguientes
resultados</big><br>
<u><b><br>
FST word1.fst</b></u><br>
<b><font face="Courier New, Courier, monospace">12 4 v12<br>
18 4 v18<br>
72 4 v72</font></b><br>
<br>
<u><b>FST word2.fst</b></u><br>
<font face="Courier New, Courier, monospace"><b>12 8 '/TW_/',v12<br>
18 8 '/TW_/',v18<br>
72 8 '/TW_/',v72</b></font><br>
<big><br>
La base wtest está en ascii, y la wtest2 es la misma en ansi</big><br>
1) <font face="Courier New, Courier, monospace"><b>mx wtest
<a class="moz-txt-link-abbreviated" href="mailto:fst=@word1.fst" target="_blank">fst=@word1.fst</a> fullinv=word1 </b></font> no da problemas ni
1030, 1660, lind, sea ascii y ansi<br>
<br>
<big>Pero si uso</big><br>
2) <font face="Courier New, Courier, monospace"><b>mx wtest2
<a class="moz-txt-link-abbreviated" href="mailto:fst=@word1.fst" target="_blank">fst=@word1.fst</a> fullinv/ansi=word2</b></font><br>
<big>entonces encuentro que indiza también números y palabras con
"trailing special chars" como la lista parcial abajo</big><br>
<big><tt> 1|0<br>
3|000<br>
1|02:<br>
1|1151?<br>
1|2A<br>
4|2O<br>
1|ABIERTAS<br>
1|ABIERTAS:<br>
5|ABUSIVAS<br>
1|ABUSIVAS:<br>
1|ACCION:<br>
3|ADJUDICACION<br>
1|ADJUDICACION:<br>
1|ADJUDICACIONES<br>
7|ADQUISICION<br>
1|ADQUISICION:<br>
2|ADQUISITIVA<br>
3|ANTIJURIDICIDAD<br>
1|ANTIJURIDICIDAD;<br>
6|AUTORIDAD<br>
1|AUTORIDAD?<br>
27|BANCARIA<br>
1|BANCARIA?<br>
27|VIGENTE<br>
2|VIGENTE?<br>
1|VII:<br>
2|VIII<br>
1|VIII:</tt></big><br>
<br>
<big>En cambio si uso la siguiente línea no hay problema (isisuc y
isisac son las distribuidas en ABCD)<br>
<b><font face="Courier New, Courier, monospace">mx wtest
<a class="moz-txt-link-abbreviated" href="mailto:fst=@word1.fst" target="_blank">fst=@word1.fst</a> uctab=isisuc.tab actab=isisac.tab fullinv=word1</font></b></big><br>
<br>
<big>¿Es posible que hay un bug en mx donde el parámetro
fullinv/ansi causa ese error?<br>
cual tabla isisuc y actab tiene built-in el mx?<br>
Si precisan los datos de prueba, puedo enviarlo en un archivo .rar
que pesa 500Kb<br>
<br>
abc<br>
Ernesto Spinak<br>
</big>
<pre class="moz-signature">--
.^. .^.
( ) ( )
=== ===
=[=]================================[=]=
| | Ernesto Spinak | |
| | <a class="moz-txt-link-abbreviated" href="mailto:spinaker@adinet.com.uy" target="_blank">spinaker@adinet.com.uy</a> | |
| | Montevideo, Uruguay | |
| | tel/fax (598) 2622-3352 | |
| | celular (598) 99612238 | |
=[=]================================[=]=
=== ===
( ) ( )
V V </pre>
<br>_______________________________________________<br>Reddes.bvs-tech mailing list<br>Reddes.bvs-tech@listas.bireme.br<br>http://listas.bireme.br/mailman/listinfo/reddes.bvs-tech<br></div></div><br>_______________________________________________<br>Reddes.bvs-tech mailing list<br>Reddes.bvs-tech@listas.bireme.br<br>http://listas.bireme.br/mailman/listinfo/reddes.bvs-tech<br></div></body></html>