Regex en .NET con C sharp

¿Qué es Regex?

Regex (abreviatura de Regular Expressions) es una herramienta para procesar texto basándose en patrones predefinidos. Es especialmente útil para implementar validaciones en los datos que recibimos, ya sea de otros sistemas o de los usuarios a través de la interfaz de la UI. Su uso nos permite identificar, extraer, reemplazar o validar datos de manera eficiente, como números, correos electrónicos (emails), fechas, entre otros.

En C#, es posible validar ya sea un teléfono, un correo electrónico o cualquier input digitado por un usuario para evitar inconsistencias en nuestro modelo o base de datos, por ejemplo, desde Visual Studio.

Para esto vamos a utilizar la operación IsMatch(param1, param2) de la clase Regex de la librería System.Text.RegularExpressions.

¿Qué nos devuelve esta operación? Este método devuelve un valor booleano (true o false) indicando si hay coincidencia o no.

Parámetros

input (param1): La cadena que se desea validar o buscar coincidencias.
pattern (param2): La expresión regular que define el patrón contra el cual se evaluará la cadena.

Retorno

Devuelve true si la cadena cumple con el patrón especificado.
Devuelve false si no hay coincidencia.

La biblioteca RegularExpressions es nativa, lo que significa que está incluida en el Framework de .NET o .NET Core/5+ sin necesidad de instalar paquetes adicionales o de terceros.

Si se utiliza Visual Studio como entorno de desarrollo, no es necesario descargar o configurar nada extra; simplemente se debe usar el espacio de nombres al inicio del archivo y de esa forma ya es posible trabajar con expresiones regulares directamente.

Using:

using System.Text.RegularExpressions;

Una vez que hicimos el using, podemos aplicarlo a una clase de la siguiente manera. Supongamos que tenemos la clase [Cliente] con los atributos, documento, nombre y teléfono.

Desde las propiedades de esa clase, podemos validar dichos atributos de la siguiente manera:

// Ejemplo para documento
public string Cedula
{
    get { return cedula; }
    set
    {
        if(Regex.IsMatch(value, "[0-6]{1}[0-9]{3}[0-9]{3}[0-9]{1}"))
        {
            cedula = value;
        }
        else
        {
            throw new Exception("La cédula del cliente no es válida.");
        }   
    }
}

Observemos el patrón que le indicamos a la operación IsMatch() en el segundo parámetro.

Lo que estamos especificando entre los paréntesis rectos o corchetes [0-6], es un rango de valores que el CLR de .NET deberá comparar para validar nuestra cadena. En el caso del primer corchete, tenemos valores que van del 0 al 6. Es decir que todos los enteros comprendidos entre el 0 y el 6 son permitidos.

Seguido a los paréntesis rectos, tenemos un par de llaves {1} que reciben por valor una cantidad de lo que le precede, [0-6]{1} -> dicho en otras palabras, admite un dígito del 0 al 6 y sólo un dígito en esa posición.

Si combinamos el resto de indicadores del patrón, podemos entonces validar una cédula (documento Uruguayo ej: 4.745.346-8) especificando valor y rango.

Tabla de referencia

[] - Paréntesis rectos permiten definir rangos que refieren a un lugar del string.

Ejemplo con números [0-9]

Ejemplo con letras [a-z] o [A-Z] (minúsculas y mayúsculas)

Ejemplo con caracteres especiales [./%&-]

Este es un ejemplo con las posibles combinaciones para validar el atributo nombre:

// Ejemplo para nombres y apellidos
public string Nombre
{
    get { return nombre; }
    set
    {
        if(Regex.IsMatch(value, "[A-Za-z áéíóúÁÉÍÓÚñÑüÜ]{3,60}"))
        {
            nombre = value;
        }
        else
        {
            throw new Exception
            ("El nombre del cliente contiene carácteres inválidos.");
        }
    }
}

Este patrón, coincidirá con los siguientes caracteres:

Letra mayúscula o minúscula del alfabeto (A-Z, a-z).
Vocales con tilde (áéíóúÁÉÍÓÚ).
Letras específicas como ñÑ y üÜ.
Espacios en blanco, ya que se añadió un espacio dentro de los corchetes.

Hay que tener presente que no es lo mismo definir un espacio literal en el patrón o un \s.

El metacaracter \s representa cualquier tipo de carácter de espacio en blanco y no es lo mismo que un espacio literal ya que incluye:

Espacio en blanco ( ).
Tabulación (\t).
Retorno de carro (\r).
Nueva línea (\n).
Avance de página (\f).

No son equivalentes, ya que el espacio literal solo coincide con un espacio regular, mientras que \s es más amplio y cubre otros tipos de espacios. Dependiendo del contexto, esposible elegir entre uno u otro.

Además, en las llaves esta vez tenemos una cantidad mínima requerida (3) y máxima (60) con la especificación {3,60}. Esto se traduce a que los nombres admitidos serán los comprendidos entre 3 y 60 carácteres máximo.

Patrón Número de teléfono

Aca tenemos algunos otros ejemplos de validaciones más comunes:

// Ejemplo para números de teléfono de Uruguay
public string Telefono
{
    get { return nroTelefono; }
    set
    {
        if(Regex.IsMatch(value, "^[1-9][0-9]{7}$") ||
           Regex.IsMatch(value, "^0[1-9][0-9]{7}$"))
        {
            nroTelefono= value;
        }        else
        {
            throw new Exception("El nro. de teléfono no es válido.");
        }
    }
}

En este caso, tenemos los caracteres ^ y $ al principio y al fin de la expresión ya que definen el inicio y el final de una cadena, respectivamente. Esto asegura que el patrón coincida con toda la cadena y no solo con una parte de ella.

En este caso, la expresión del primer Regex asegura que:

La cadena comienza con un número entre 1 y 9.
Le siguen exactamente 7 dígitos numéricos ([0-9]{7}).
La cadena termina justo después de esos 8 caracteres.

Algunos ejemplos válidos podrían ser:

22345678
98765432

Ejemplos no válidos:

01234567 (no empieza con 1-9).
1234567 (solo tiene 7 dígitos).
123456789 (tiene más de 8 dígitos).
12345678abc (tiene caracteres adicionales al final).

La segunda expresión admite números celulares Uruguayos del tipo 099, 098, 091, etc.

Patrón Tarjeta de Crédito

// Ejemplo para limitar cantidad de caracteres en una tarjeta de crédito
public string NroTarjeta
{
    get { return nroTarCredito; }
    set
    {
        if(Regex.IsMatch(value, "[0-9]{4}[0-9]{4}[0-9]{4}[0-9]{4}"))
        {
            nroTarCredito=value;
        }
        else
        {
            throw new Exception("El nro. de tarjeta no es válido.");
        }
    }
}

Más patrones:

1. Un nombre de usuario que puede tener únicamente 8 caracteres de longitud:

"^.{8}$"

El punto (.) en este caso, es un comodín que coincide con cualquier carácter, excepto los saltos de línea.

2. Un nombre especial que puede tener únicamente 10 caracteres de longitud compuesto solo de letras (minúsculas y mayúsculas) y números:

"^[a-zA-Z0-9]{10}$"

3. Un ejemplo para email:

"^[a-zA-Z0-9._-]+@[a-zA-Z0-9.-]+\.[a-zA-Z]{2,}$"

[a-zA-Z0-9._-]+: Permite una o más letras (mayúsculas o minúsculas), números, puntos (.), guiones bajos (_) y guiones (-) como parte del usuario del email.
+@: Requiere que el símbolo @ esté presente.
[a-zA-Z0-9.-]+: Permite una o más letras, números, puntos o guiones en el dominio.
\.: Asegura que haya al menos un punto en el dominio.
[a-zA-Z]{2,}: Requiere que la extensión del dominio tenga al menos dos caracteres (como .com, .org, .io, .co).

En este caso puntual, estamos utilizando el cuantificador + que se aplica al carácter que le precede y quiere decir "una o más veces", pero no vacío.

Cuantificadores

* : Cero o más veces.

Ejemplo: a* coincide con "" (vacío), a, aa, aaa, etc.

+ : Una o más veces.

Ejemplo: a+ coincide con a, aa, aaa, pero no con "".

?: Cero o una vez.

Ejemplo: a? coincide con "" o a.

Herramienta en línea para Regex

https://regex101.com/

Regex101.com es una herramienta en línea que te permite escribir, probar y analizar expresiones regulares de manera interactiva y en tiempo real. Es muy útil para aprender, depurar y optimizar las expresiones que estás probando.

¿Cómo se usa?

Seleccionar el lenguaje en el menú desplegable.
Escribí tu expresión regex en el cuadro superior.
Tipear el texto que querés probar en el cuadro inferior como entrada.
Ponerse a probar expresiones.

En materia: Programación .NET

Buscar este blog

Regex en .NET con C sharp

¿Qué es Regex?

Parámetros

Retorno

Using:

using System.Text.RegularExpressions;

Tabla de referencia

Patrón Número de teléfono

Patrón Tarjeta de Crédito

Herramienta en línea para Regex

¿Cómo se usa?

Etiquetas

Otros artículos

Principio de Responsabilidad Única (SRP) – SOLID explicado con ejemplos

Open/Closed Principle (OCP) – SOLID explicado con ejemplos

Guía Completa para Crear un README.md Profesional en GitHub

Principio de Segregación de Interfaces (ISP) – SOLID explicado con ejemplos

Principio de Sustitución de Liskov (LSP) – SOLID explicado con ejemplos

Principio de Inversión de Dependencia (DIP) – SOLID explicado con ejemplos

En materia: Programación .NET

Regex en .NET con C sharp

¿Qué es Regex?

Parámetros

Retorno

Using: using System.Text.RegularExpressions;

Tabla de referencia

Patrón Número de teléfono

Patrón Tarjeta de Crédito

Herramienta en línea para Regex

¿Cómo se usa?

Etiquetas

Otros artículos

Principio de Responsabilidad Única (SRP) – SOLID explicado con ejemplos

Open/Closed Principle (OCP) – SOLID explicado con ejemplos

Guía Completa para Crear un README.md Profesional en GitHub

Principio de Segregación de Interfaces (ISP) – SOLID explicado con ejemplos

Principio de Sustitución de Liskov (LSP) – SOLID explicado con ejemplos

Principio de Inversión de Dependencia (DIP) – SOLID explicado con ejemplos

Using:

using System.Text.RegularExpressions;