¿Qué es Regex?
Regex (abreviatura de Regular Expressions) es una herramienta para procesar texto basándose en patrones predefinidos. Es especialmente útil para implementar validaciones en los datos que recibimos, ya sea de otros sistemas o de los usuarios a través de la interfaz de la UI. Su uso nos permite identificar, extraer, reemplazar o validar datos de manera eficiente, como números, correos electrónicos (emails), fechas, entre otros.En C#, es posible validar ya sea un teléfono, un correo electrónico o cualquier input digitado por un usuario para evitar inconsistencias en nuestro modelo o base de datos, por ejemplo, desde Visual Studio.
Para esto vamos a utilizar la operación IsMatch(param1, param2) de la clase Regex de la librería System.Text.RegularExpressions.
¿Qué nos devuelve esta operación? Este método devuelve un valor booleano (true o false) indicando si hay coincidencia o no.
Parámetros
- input (param1): La cadena que se desea validar o buscar coincidencias.
- pattern (param2): La expresión regular que define el patrón contra el cual se evaluará la cadena.
Retorno
- Devuelve true si la cadena cumple con el patrón especificado.
- Devuelve false si no hay coincidencia.
La biblioteca RegularExpressions es nativa, lo que significa que está incluida en el Framework de .NET o .NET Core/5+ sin necesidad de instalar paquetes adicionales o de terceros.
Si se utiliza Visual Studio como entorno de desarrollo, no es necesario descargar o configurar nada extra; simplemente se debe usar el espacio de nombres al inicio del archivo y de esa forma ya es posible trabajar con expresiones regulares directamente.
Using:
using System.Text.RegularExpressions;
Una vez que hicimos el using, podemos aplicarlo a una clase de la siguiente manera. Supongamos que tenemos la clase [Cliente] con los atributos, documento, nombre y teléfono.
Desde las propiedades de esa clase, podemos validar dichos atributos de la siguiente manera:
// Ejemplo para documento
public string Cedula
{
get { return cedula; }
set
{
if(Regex.IsMatch(value, "[0-6]{1}[0-9]{3}[0-9]{3}[0-9]{1}"))
{
cedula = value;
}
else
{
throw new Exception("La cédula del cliente no es válida.");
}
}
}
Observemos el patrón que le indicamos a la operación IsMatch() en el segundo parámetro.
Lo que estamos especificando entre los paréntesis rectos o corchetes [0-6], es un rango de valores que el CLR de .NET deberá comparar para validar nuestra cadena. En el caso del primer corchete, tenemos valores que van del 0 al 6. Es decir que todos los enteros comprendidos entre el 0 y el 6 son permitidos.
Seguido a los paréntesis rectos, tenemos un par de llaves {1} que reciben por valor una cantidad de lo que le precede, [0-6]{1} -> dicho en otras palabras, admite un dígito del 0 al 6 y sólo un dígito en esa posición.
Si combinamos el resto de indicadores del patrón, podemos entonces validar una cédula (documento Uruguayo ej: 4.745.346-8) especificando valor y rango.
Tabla de referencia
[] - Paréntesis rectos permiten definir rangos que refieren a un lugar del string.
Ejemplo con números [0-9]
Ejemplo con letras [a-z] o [A-Z] (minúsculas y mayúsculas)
Ejemplo con caracteres especiales [./%&-]
Este es un ejemplo con las posibles combinaciones para validar el atributo nombre:
// Ejemplo para nombres y apellidos
public string Nombre
{
get { return nombre; }
set
{
if(Regex.IsMatch(value, "[A-Za-z áéíóúÁÉÍÓÚñÑüÜ]{3,60}"))
{
nombre = value;
}
else
{
throw new Exception
("El nombre del cliente contiene carácteres inválidos.");
}
}
}
Este patrón, coincidirá con los siguientes caracteres:
- Letra mayúscula o minúscula del alfabeto (A-Z, a-z).
- Vocales con tilde (áéíóúÁÉÍÓÚ).
- Letras específicas como ñÑ y üÜ.
- Espacios en blanco, ya que se añadió un espacio dentro de los corchetes.
El metacaracter \s representa cualquier tipo de carácter de espacio en blanco y no es lo mismo que un espacio literal ya que incluye:
- Espacio en blanco ( ).
- Tabulación (\t).
- Retorno de carro (\r).
- Nueva línea (\n).
- Avance de página (\f).
No son equivalentes, ya que el espacio literal solo coincide con un espacio regular, mientras que \s es más amplio y cubre otros tipos de espacios. Dependiendo del contexto, esposible elegir entre uno u otro.
Además, en las llaves esta vez tenemos una cantidad mínima requerida (3) y máxima (60) con la especificación {3,60}. Esto se traduce a que los nombres admitidos serán los comprendidos entre 3 y 60 carácteres máximo.
Patrón Número de teléfono
Aca tenemos algunos otros ejemplos de validaciones más comunes:
// Ejemplo para números de teléfono de Uruguay public string Telefono { get { return nroTelefono; } set { if(Regex.IsMatch(value, "^[1-9][0-9]{7}$") || Regex.IsMatch(value, "^0[1-9][0-9]{7}$")) { nroTelefono= value; }
else { throw new Exception("El nro. de teléfono no es válido."); } } }
En este caso, tenemos los caracteres ^ y $ al principio y al fin de la expresión ya que definen el inicio y el final de una cadena, respectivamente. Esto asegura que el patrón coincida con toda la cadena y no solo con una parte de ella.
En este caso, la expresión del primer Regex asegura que:
- La cadena comienza con un número entre 1 y 9.
- Le siguen exactamente 7 dígitos numéricos ([0-9]{7}).
- La cadena termina justo después de esos 8 caracteres.
Algunos ejemplos válidos podrían ser:
- 22345678
- 98765432
Ejemplos no válidos:
- 01234567 (no empieza con 1-9).
- 1234567 (solo tiene 7 dígitos).
- 123456789 (tiene más de 8 dígitos).
- 12345678abc (tiene caracteres adicionales al final).
La segunda expresión admite números celulares Uruguayos del tipo 099, 098, 091, etc.
Patrón Tarjeta de Crédito
// Ejemplo para limitar cantidad de caracteres en una tarjeta de crédito
public string NroTarjeta
{
get { return nroTarCredito; }
set
{
if(Regex.IsMatch(value, "[0-9]{4}[0-9]{4}[0-9]{4}[0-9]{4}"))
{
nroTarCredito=value;
}
else
{
throw new Exception("El nro. de tarjeta no es válido.");
}
}
}
Más patrones:
1. Un nombre de usuario que puede tener únicamente 8 caracteres de longitud:
"^.{8}$"
El punto (.) en este caso, es un comodín que coincide con cualquier carácter, excepto los saltos de línea.
2. Un nombre especial que puede tener únicamente 10 caracteres de longitud compuesto solo de letras (minúsculas y mayúsculas) y números:
"^[a-zA-Z0-9]{10}$"
3. Un ejemplo para email:
"^[a-zA-Z0-9._-]+@[a-zA-Z0-9.-]+\.[a-zA-Z]{2,}$"
- [a-zA-Z0-9._-]+: Permite una o más letras (mayúsculas o minúsculas), números, puntos (.), guiones bajos (_) y guiones (-) como parte del usuario del email.
- +@: Requiere que el símbolo @ esté presente.
- [a-zA-Z0-9.-]+: Permite una o más letras, números, puntos o guiones en el dominio.
- \.: Asegura que haya al menos un punto en el dominio.
- [a-zA-Z]{2,}: Requiere que la extensión del dominio tenga al menos dos caracteres (como .com, .org, .io, .co).
- * : Cero o más veces.
- Ejemplo: a* coincide con "" (vacío), a, aa, aaa, etc.
- + : Una o más veces.
- Ejemplo: a+ coincide con a, aa, aaa, pero no con "".
- ?: Cero o una vez.
- Ejemplo: a? coincide con "" o a.
Herramienta en línea para Regex
¿Cómo se usa?
- Seleccionar el lenguaje en el menú desplegable.
- Escribí tu expresión regex en el cuadro superior.
- Tipear el texto que querés probar en el cuadro inferior como entrada.
- Ponerse a probar expresiones.