El nuevo sistema de filtrado no recurre al OCR, lo que garantiza la velocidad de detección.
Kaspersky Lab ha logrado la patente de una nueva e tecnología para la
detección del correo no deseado. La tecnología, patentada en Rusia, garantiza la
velocidad y nivel de detección de los mensajes no deseados en forma de imágenes.
Los sistemas actuales de filtrado detectan con facilidad el spam en forma de
texto. Por esta razón, los spammers usan con frecuencia métodos que les permiten
incluir los mensajes no deseados en ficheros gráficos. El filtrado del spam
gráfico es mucho más complejo que el de texto, ya que el sistema antispam debe,
además de decidir si el mensaje es spam o no, detectar el texto en el fichero
gráfico.
La mayoría de los métodos usados para establecer la presencia de texto en los
ficheros gráficos se basan en el reconocimiento óptico de caracteres (OCR). No
obstante, para que el reconocimiento óptico sea de calidad es necesario que el
tamaño, estilo y ubicación de los caracteres sea uniforme. Así, los spammers se
valen de ciertas artimañas, como deformar y/o agregar “ruidos" a las imágenes,
para dificultar y ralentizar el proceso de detección del texto incluido en los
elementos gráficos.
La base de la tecnología patentada es un método estadístico de probabilidades
que analiza tanto la ubicación de las formas de las palabras y renglones, como
su contenido. La presencia de filtros especiales garantiza la estabilidad del
sistema frente a los elementos que generan “ruido" y la división del texto
mediante marcos y líneas. El uso de este método especial de detección también es
capaz de detectar las deformaciones que son frecuentes en el spam gráfico, como
el giro de texto y el texto en forma de olas.
Además de detectar el texto en los ficheros gráficos, el nuevo sistema es capaz
de determinar si el texto es spam comparando su patrón con los identikit de spam
almacenados en la base de datos antispam.
Fuente: DiarioTI