El Codiguero
Programando para la wé

Categoría 'Artículos varios'

Consejos para evitar el SPAM

Lunes 17 de Noviembre de 2008

Introducción
El spam, o correo basura es sin duda alguna la parte más molesta de trabajar con correo electrónico.
Otros términos que se usan frecuentemente son UCE (siglas en inglés de Correo electrónico comercial no solicitado) o UBE (siglas en inglés de Correo electrónico masivo no solicitado).
La peor parte del correo basura es que los costos para [...]

Bots: servicios de internet y desconocidos

Jueves 3 de Julio de 2008

Servicios de internet
En esta categoría he incluido a los robots que proveen servicios que no entran en otras categorías, por ejemplo el robot del Internet Archive o el Validador del W3C

ia_archiver
Se identifica como: ia_archiver-web.archive.org
Éste es el robot del Internet Archive. Este sitio mantiene copias de los sitios para "futura referencia", y a veces resulta bastante [...]

Bots: Programas y publicitarios / corporativos

Jueves 3 de Julio de 2008

Es incontable la cantidad de programas que por un motivo u otro se conectan a alguna página de internet. La mayoría de ellos son inofensivos, aunque algunos son sospechosos y bien podrían ser robots de los "malos"…
El problema es que no todos los programas que se conectan a páginas de internet se identifican con su [...]

Bots: Buscadores y lectores de blogs

Jueves 3 de Julio de 2008

Buscadores de blogs
Nada en particular, simplemente sitios y servicios especializados en búsqueda y directorios de blogs.
El más conocido de esta categoría es Technorati.

BlogPulseLive
Se identifica como: BlogPulseLive (support@blogpulse.com)
BlogPulse es un buscador de blogs con funciones estadísticas muy interesantes
Feedfetcher-Google
Se identifica como: Feedfetcher-Google; (+http://www.google.com/feedfetcher.html)
Feedfetcher es el nombre del robot que Google usa para analizar el contenido de los [...]

¿Cómo escribir un archivo robots.txt?

Martes 1 de Julio de 2008

Un archivo robots.txt es un archivo de texto simple, que sirve para indicar a los robots (en especial a los robots de los buscadores) qué partes del sitio no debería indexar. Se considera que se puede indexar cualquier carpeta o archivo que no esté explícitamente prohibido por este archivo.
Los buscadores más importantes lo respetan (de [...]

Conociendo a los Bots: Buscadores genéricos

Viernes 23 de Mayo de 2008

Los "bots", "robots", "spiders" (arañas) o "crawlers" son los programas que van por la internet de página en página, analizando su contenido para diferentes propósitos.
Los hay "buenos", como los de los buscadores que luego nos redirigirán visitas, y "malos", como los que buscan direcciones de correo para luego enviar correo basura. Por lo general son [...]

CSV: simple y versátil

Lunes 31 de Marzo de 2008

Los archivos CSV son muy simples y permiten crear archivos para ser abiertos en programas de hoja de cálculo de manera muy sencilla. Vale la pena conocer su estructura y los detalles que conciernen a su creación.

.htaccess y páginas de error

Jueves 3 de Enero de 2008

Los errores HTTP se ven bastante seguido, pueden suceder en cualquier sitio, en cualquier momento.
El sitio falla, alguien copia mal un enlace que le pasa a un amigo, alguien escribe mal la dirección a la que quiere ir. Incluso puede pasar que un motor de búsqueda tenga un enlace viejo en su índice.
Se podría decir [...]



Todo el contenido de este sitio está bajo una licencia de Creative Commons.

Campaña AnyBrowser | XHTML 1.0 Válido | CSS 2 Válido | WAI A

Diseño creado por alvlin. Sitio basado en WordPress