Regex

Tabla de contenidos

Resumir con:

Las expresiones regulares, comúnmente conocidas como regex (abreviatura de «regular expressions»), son una secuencia de caracteres que definen un patrón de búsqueda.

Estas expresiones se utilizan en una variedad de lenguajes de programación y herramientas para realizar operaciones sobre cadenas de texto, como búsqueda, coincidencias, sustituciones y validaciones.

¿Qué es una expresión regular?

Una expresión regular es un conjunto de caracteres que describe un patrón que puede coincidir con una o más cadenas de texto. Este patrón está diseñado para identificar secuencias de caracteres dentro de un texto que siguen ciertas reglas o estructuras.

En otras palabras, las regex permiten buscar patrones específicos, como direcciones de correo electrónico, números de teléfono, palabras o incluso estructuras gramaticales complejas, en grandes bloques de texto.

El poder de las expresiones regulares reside en su capacidad de describir no solo coincidencias simples, sino también patrones complejos y sofisticados.

Por ejemplo, se puede utilizar una expresión regular para verificar si una cadena de texto sigue el formato de una dirección de correo electrónico, si contiene un número de teléfono o si tiene una secuencia específica de caracteres.

¿Para qué sirven las expresiones regulares?

Las expresiones regulares tienen múltiples aplicaciones en el campo de la informática y el desarrollo de software. Algunas de las funciones más comunes son:

  • Búsqueda y coincidencia de patrones: Permiten encontrar coincidencias dentro de cadenas de texto de manera precisa y eficiente. Por ejemplo, buscar todas las direcciones de correo electrónico en un archivo de texto.
  • Validación de datos: Las regex se utilizan frecuentemente para validar datos de entrada, como números de teléfono, códigos postales, URLs y direcciones de correo electrónico. Este es un método muy común en formularios web para asegurarse de que los usuarios introduzcan datos en el formato adecuado.
  • Sustitución de texto: Una de las funcionalidades más útiles es la capacidad de realizar reemplazos en texto basándose en un patrón específico. Por ejemplo, sustituir todas las apariciones de una palabra por otra dentro de un documento.
  • Análisis de texto: Las expresiones regulares también se utilizan en herramientas de procesamiento de texto y análisis de datos para extraer información valiosa de grandes volúmenes de texto.

Ejemplos de regex

Para ilustrar mejor el uso de expresiones regulares, veamos algunos ejemplos:

Coincidencia de una dirección de correo electrónico

[a-zA-Z0-9._%+-]+@[a-zA-Z0-9.-]+.[a-zA-Z]{2,}

Esta expresión regular busca una dirección de correo electrónico que siga el formato estándar: un nombre de usuario que puede contener letras, números y algunos caracteres especiales, seguido de un símbolo @, y luego un dominio, seguido de un . y una extensión de al menos dos letras.

Coincidencia de un número de teléfono en formato internacional

+?[0-9]{1,4}[-.s]?[0-9]{1,3}[-.s]?[0-9]{3,4}[-.s]?[0-9]{3,4}

Esta expresión regular puede coincidir con números de teléfono en diferentes formatos, permitiendo opcionalmente el símbolo + al principio, seguido de grupos de números separados por guiones, puntos o espacios.

Coincidencia de una fecha en formato dd/mm/yyyy:

b(0[1-9]|[12][0-9]|3[01])/(0[1-9]|1[0-2])/d{4}b

Esta regex busca fechas en formato de día/mes/año. Asegura que el día esté entre 01 y 31, el mes entre 01 y 12, y el año contenga exactamente cuatro dígitos.

Funcionalidades avanzadas de las expresiones regulares

Algunas funcionalidades adicionales de las regex son:

  • Agrupación y capturas: Usando paréntesis, se pueden agrupar partes de una expresión regular y capturar esos grupos para su posterior uso o análisis. Por ejemplo, en (d{4})-(d{2})-(d{2}), los paréntesis permiten capturar el año, mes y día de una fecha en formato yyyy-mm-dd.
  • Cuantificadores: Los cuantificadores permiten especificar cuántas veces un carácter o grupo de caracteres debe aparecer en una coincidencia. Por ejemplo, a+ significa «una o más veces», mientras que a{3} significa «exactamente tres veces».
  • Alternancia: El símbolo | permite definir alternativas dentro de una expresión regular. Por ejemplo, color|colour coincidiría con ambas variantes ortográficas de la palabra.

Te proponemos formaciones relacionadas con lenguajes de programación:

Compartir en:

Artículos relacionados

Responsive

Cuando decimos que un diseño o un sitio web es responsive, nos referimos a que su diseño se adapta con facilidad a diferentes formatos de dispositivos. Es decir, un sitio web responsive es aquel que se puede visualizar en tablets, móviles y ordenadores

Fork

En programación, un fork se refiere a la creación de una copia o derivación de un proyecto o código base. Este término, que proviene del inglés y significa «bifurcación», describe visualmente lo que ocurre: a partir de un punto común, el código se

Deep learning

El deep learning o aprendizaje profundo es una técnica de aprendizaje automático mediante el cual se le instruye a los ordenadores a completar tareas de igual forma que la mente humana. Es enseñar a las máquinas conocimientos a través de la experiencia, es

Applet

Un applet es un pequeño programa que se ejecuta dentro de otra aplicación, típicamente un navegador web. Los applets están escritos en el lenguaje de programación Java y se utilizan para proporcionar funcionalidades interactivas y dinámicas en páginas web. A diferencia de las

Scroll al inicio