Regex

Tabla de contenidos

Tabla de contenidos

Las expresiones regulares, comúnmente conocidas como regex (abreviatura de «regular expressions»), son una secuencia de caracteres que definen un patrón de búsqueda.

Estas expresiones se utilizan en una variedad de lenguajes de programación y herramientas para realizar operaciones sobre cadenas de texto, como búsqueda, coincidencias, sustituciones y validaciones.

¿Qué es una expresión regular?

Una expresión regular es un conjunto de caracteres que describe un patrón que puede coincidir con una o más cadenas de texto. Este patrón está diseñado para identificar secuencias de caracteres dentro de un texto que siguen ciertas reglas o estructuras.

En otras palabras, las regex permiten buscar patrones específicos, como direcciones de correo electrónico, números de teléfono, palabras o incluso estructuras gramaticales complejas, en grandes bloques de texto.

El poder de las expresiones regulares reside en su capacidad de describir no solo coincidencias simples, sino también patrones complejos y sofisticados.

Por ejemplo, se puede utilizar una expresión regular para verificar si una cadena de texto sigue el formato de una dirección de correo electrónico, si contiene un número de teléfono o si tiene una secuencia específica de caracteres.

¿Para qué sirven las expresiones regulares?

Las expresiones regulares tienen múltiples aplicaciones en el campo de la informática y el desarrollo de software. Algunas de las funciones más comunes son:

  • Búsqueda y coincidencia de patrones: Permiten encontrar coincidencias dentro de cadenas de texto de manera precisa y eficiente. Por ejemplo, buscar todas las direcciones de correo electrónico en un archivo de texto.
  • Validación de datos: Las regex se utilizan frecuentemente para validar datos de entrada, como números de teléfono, códigos postales, URLs y direcciones de correo electrónico. Este es un método muy común en formularios web para asegurarse de que los usuarios introduzcan datos en el formato adecuado.
  • Sustitución de texto: Una de las funcionalidades más útiles es la capacidad de realizar reemplazos en texto basándose en un patrón específico. Por ejemplo, sustituir todas las apariciones de una palabra por otra dentro de un documento.
  • Análisis de texto: Las expresiones regulares también se utilizan en herramientas de procesamiento de texto y análisis de datos para extraer información valiosa de grandes volúmenes de texto.

Ejemplos de regex

Para ilustrar mejor el uso de expresiones regulares, veamos algunos ejemplos:

Coincidencia de una dirección de correo electrónico

[a-zA-Z0-9._%+-]+@[a-zA-Z0-9.-]+.[a-zA-Z]{2,}

Esta expresión regular busca una dirección de correo electrónico que siga el formato estándar: un nombre de usuario que puede contener letras, números y algunos caracteres especiales, seguido de un símbolo @, y luego un dominio, seguido de un . y una extensión de al menos dos letras.

Coincidencia de un número de teléfono en formato internacional

+?[0-9]{1,4}[-.s]?[0-9]{1,3}[-.s]?[0-9]{3,4}[-.s]?[0-9]{3,4}

Esta expresión regular puede coincidir con números de teléfono en diferentes formatos, permitiendo opcionalmente el símbolo + al principio, seguido de grupos de números separados por guiones, puntos o espacios.

Coincidencia de una fecha en formato dd/mm/yyyy:

b(0[1-9]|[12][0-9]|3[01])/(0[1-9]|1[0-2])/d{4}b

Esta regex busca fechas en formato de día/mes/año. Asegura que el día esté entre 01 y 31, el mes entre 01 y 12, y el año contenga exactamente cuatro dígitos.

Funcionalidades avanzadas de las expresiones regulares

Algunas funcionalidades adicionales de las regex son:

  • Agrupación y capturas: Usando paréntesis, se pueden agrupar partes de una expresión regular y capturar esos grupos para su posterior uso o análisis. Por ejemplo, en (d{4})-(d{2})-(d{2}), los paréntesis permiten capturar el año, mes y día de una fecha en formato yyyy-mm-dd.
  • Cuantificadores: Los cuantificadores permiten especificar cuántas veces un carácter o grupo de caracteres debe aparecer en una coincidencia. Por ejemplo, a+ significa «una o más veces», mientras que a{3} significa «exactamente tres veces».
  • Alternancia: El símbolo | permite definir alternativas dentro de una expresión regular. Por ejemplo, color|colour coincidiría con ambas variantes ortográficas de la palabra.

Te proponemos formaciones relacionadas con lenguajes de programación:

Compartir en:

Artículos relacionados

Algoritmo

El algoritmo es uno de los conceptos más básicos que es necesario comprender para adentrarse en el mundo de la programación y desarrollar una mentalidad propia de un programador.  Es probable que hayas oído sobre los algoritmos en algunas conversaciones sobre tecnología o

Blockchain

El blockchain, también conocido como cadena de bloques, es una tecnología de almacenamiento de información que se utiliza para mantener un registro descentralizado y seguro de información de forma encadenada. Digamos que el blockchain es una base de datos gigante interconectada que registra

Big Data

El Big Data se refiere a conjuntos de datos de gran volumen, muy interrelacionados y de muy diversas fuentes que son difíciles de gestionar con herramientas y métodos tradicionales de procesamiento de datos. Tres V del Big Data Hay tres V que definen

Base de datos

Una base de datos (BBDD) es una colección organizada de información estructurada que se almacena y administra en un sistema informático. Puede contener diversos tipos de datos, como texto, números, fechas, imágenes, videos, entre otros.  Al hablar de información estructurada nos referimos a

Scroll al inicio