Viernes 19 de Septiembre de 2008
Introducción
He aquí el último tema de la serie básica sobre Expresiones Regulares: los cuantificadores.
Ciertos metacaracteres cumplen la función de indicar cuántas veces debe aparecer un patrón en una cadena para que la comparación sea exitosa. Estos caracteres se denominan cuantificadores, y son los siguientes:
* (asterisco)
Indica que el patrón debe aparecer cero o más veces
+ (más)
Indica [...]
Categoría(s): Programación | 1 comentario »
Viernes 12 de Septiembre de 2008
En este capítulo se presenta el metacaracter de alternación, "|". Pero antes de describirlo se mencionan algunos caracteres que si bien no se consideran "meta", tienen un significado especial: los paréntesis y la barra "\", que sirve para escapar los caracteres con significado especial.
Los paréntesis
Los paréntesis ( "(" y ")" ) tienen dos usos [...]
Categoría(s): Programación | 1 comentario »
Miércoles 3 de Septiembre de 2008
Esta parte termina el tema de las clases de caracteres.
El punto
El punto (.) es un metacaracter comodín, representa a cualquier caracter, incluso a aquellos caracteres no visibles (saltos de línea, por ejemplo).
Pero no se usa dentro de clases de caracteres, de hecho, dentro de una clase se considera un caracter normal. Es lógico que así [...]
Categoría(s): Programación | 0 comentarios »
Lunes 25 de Agosto de 2008
Las clases de caracteres son conjuntos de caracteres que representan 'opciones' para el mismo caracter dentro del patrón. Una clase de caracteres se delimita con [ y ]
Las clases de caracteres se utilizan en aquellos casos en los que se sabe que en la cadena deben aparecer un conjunto limitado de caracteres en una cierta [...]
Categoría(s): Programación | 0 comentarios »
Sábado 23 de Agosto de 2008
Existen dos caracteres que actúan como anclas: fijan la posición de la cadena en la que debe encontrarse el patrón buscado. Estos caracteres son
^ (acento circunflejo) Indica que el patrón debe estar al comienzo de la cadena
$ (signo de moneda) Indica que el patrón debe estar al final de la cadena.
Ejemplo: en la frase [...]
Categoría(s): Programación | 0 comentarios »
Sábado 23 de Agosto de 2008
Una definición posible de lo que son las "expresiones regulares" (también llamadas "patrones") es la siguiente: "Una expresión regular es una secuencia de caracteres que describe la forma de otra en un lenguaje formal". Son la mejor forma de analizar texto, y aunque tienen sus "trucos", no son tan complicadas como parecen una vez que uno se familiariza con ellas.
Categoría(s): Programación | 0 comentarios »
Jueves 3 de Julio de 2008
Servicios de internet
En esta categoría he incluido a los robots que proveen servicios que no entran en otras categorías, por ejemplo el robot del Internet Archive o el Validador del W3C
ia_archiver
Se identifica como: ia_archiver-web.archive.org
Éste es el robot del Internet Archive. Este sitio mantiene copias de los sitios para "futura referencia", y a veces resulta bastante [...]
Categoría(s): Artículos varios | 0 comentarios »
Jueves 3 de Julio de 2008
Es incontable la cantidad de programas que por un motivo u otro se conectan a alguna página de internet. La mayoría de ellos son inofensivos, aunque algunos son sospechosos y bien podrían ser robots de los "malos"…
El problema es que no todos los programas que se conectan a páginas de internet se identifican con su [...]
Categoría(s): Artículos varios | 0 comentarios »
Jueves 3 de Julio de 2008
Buscadores de blogs
Nada en particular, simplemente sitios y servicios especializados en búsqueda y directorios de blogs.
El más conocido de esta categoría es Technorati.
BlogPulseLive
Se identifica como: BlogPulseLive (support@blogpulse.com)
BlogPulse es un buscador de blogs con funciones estadísticas muy interesantes
Feedfetcher-Google
Se identifica como: Feedfetcher-Google; (+http://www.google.com/feedfetcher.html)
Feedfetcher es el nombre del robot que Google usa para analizar el contenido de los [...]
Categoría(s): Artículos varios | 1 comentario »
Martes 1 de Julio de 2008
Un archivo robots.txt es un archivo de texto simple, que sirve para indicar a los robots (en especial a los robots de los buscadores) qué partes del sitio no debería indexar. Se considera que se puede indexar cualquier carpeta o archivo que no esté explícitamente prohibido por este archivo.
Los buscadores más importantes lo respetan (de [...]
Categoría(s): Artículos varios | 0 comentarios »