10 RegEx Tester для JavaScript, Python, PHP, Golang, Ruby тощо.

| | 0 Comments| 4:07 AM
Categories:

Вираз регулярного виразу може завдати шкоди. Ну іноді!

Давайте дізнаємося про регулярні вирази та їх шаблони. Ми збираємося розглянути такі шаблони, які здаються заплутаним супом символів. Ми побачимо, що означає кожен символ у регулярному виразі.

Прочитавши цю статтю, ви зможете створювати свої регулярні вирази та використовувати їх на свій розсуд. Зрештою, ми також перерахуємо деякі онлайн-інструменти тестування RegEx, щоб на основі вимог ви могли створити свій RegEx і перевірити його за допомогою цих інструментів.

вступ

Регулярні вирази або, як їх зазвичай називають, RegEx — це будь-яка послідовність символів, яку можна використовувати як шаблон для пошуку символів або рядків.

Наприклад, щоб визначити, чи містить рядок або фраза слово «яблуко», ми можемо використати регулярний вираз «/яблуко» для пошуку в рядку. Як інший приклад, ми можемо використовувати “/[0-9]”, щоб перевірити, чи даний рядок містить число від 0 до 9.

Регулярні вирази та їх використання

Регулярні вирази широко використовуються для різноманітних цілей у сучасних веб-операціях. Перевірка веб-форм, веб-пошукові системи, лексичні аналізатори в IDE, текстові редактори та редактори документів є одними з кількох прикладів, де регулярні вирази часто використовуються.

Усі ми багато разів використовували «CTRL + F» для пошуку в документі чи фрагменті коду, щоб знайти конкретне слово, фразу чи вираз. Цю операцію можна назвати дуже поширеним прикладом використання регулярних виразів.

  Як зробити цеглу в майнкрафт

Перш ніж продовжувати, давайте подивимося на дуже часто використовуваний регулярний вираз.

Чи можете ви вгадати 🤔 наведений нижче регулярний вираз, для чого він використовується?

^([a-zA-Z0-9_-.]+)@([a-zA-Z0-9_-.]+).([a-zA-Z]{2,5})$

Не хвилюйтеся, якщо ви не можете вгадати. Я впевнений, що ви зможете здогадатися до кінця цієї статті.

Спочатку почнемо з A, B, C RegEx.

Жетони

Для початку давайте розглянемо різні символи в Regex, показаному вище.

^([a-zA-Z0-9_-.]+)@([a-zA-Z0-9_-.]+).([a-zA-Z]{2,5})$

Якщо ми подивимося на наведений вище регулярний вираз, то побачимо, що він складається з багатьох символів або символів або токенів. Давайте дізнаємося, що вони означають:

Токен

Значення

^

Цей маркер позначає початок рядка.

(…)

Це позначає групу, у якій охоплено все, що надано в межах (…).

[…]

The [] охоплює символи, будь-які з яких можуть бути зіставлені. Наприклад – [abc] відповідатиме a, b або c.

аз

Набір малих літер від a до z. Ми повинні пам’ятати, що Regex чутливий до регістру.

AZ

Набір символів верхнього регістру від А до Я.

0-9

Цифри від 0 до 9.

_

Це відповідатиме символу _.

Це персонаж втечі.

.

Це відповідає символу «.» буквально. Це використовується, оскільки символ «.» у регулярному виразі сам по собі є маркером, який відповідає будь-якому символу

  Як захистити свій Google Диск на iPhone та iPad за допомогою Face ID або Touch ID

+

Це квантор. Це відповідає одному або декільком символам, з якими він використовується. Наприклад, a+ означає одне або кілька входжень символу a.

Це відповідатиме символу «-».

@

Це відповідатиме символу «@».

{}

Це ще один квантор. Він використовується для позначення кількості повторень символу. Наприклад, {3} означає рівно 3 а.

$

Це позначає кінець рядка.

Розбиття заданого шаблону регулярного виразу

Тепер, озброївшись цими попередніми знаннями про токени, давайте спробуємо розшифрувати наведений вище регулярний вираз:

  • ^([a-zA-Z0-9_-.]+) означає, що ми шукаємо рядок, який починається принаймні з одного або кількох літерно-цифрових символів верхнього чи нижнього регістру, підкреслення, дефіса чи крапки. Наприклад, все, що схоже на user_name.01, відповідатиме шаблону. Ми повинні пам’ятати, що сюди не потрібно включати всі символи, а лише один символ [a-zA-Z0-9_-.] зроблю.
  • Символ @ відповідає одному входженню @. Додавши до попереднього прикладу щось на зразок [email protected] підійде.
  • ([a-zA-Z0-9_-.]+) аналогічний першому пункту. Це також означає, що ми шукаємо рядок, який містить принаймні один або більше буквено-цифрових символів, підкреслення, дефіс або крапку. Додавши до прикладу, [email protected] підійде сюди.
  • Як ви вже могли здогадатися, ми натякаємо на шаблон електронної пошти. Жити далі, . відповідає одному «.» характер. Якщо ми продовжимо поточний приклад, щось подібне [email protected]
  • ([a-zA-Z]{2,5})$ це означає, що рядок має закінчуватися від 2 до 5 символів алфавіту у верхньому або нижньому регістрі. Якщо ми додамо .com до попереднього прикладу, ми можемо отримати [email protected]що є загальним шаблоном рядка електронної пошти.
  Як виправити вікове обмеження Tinder

Об’єднавши все вищесказане, ми бачимо, що ми шукаємо рядок ідентифікатора електронної пошти. Тепер ми можемо використовувати цей вираз для перевірки будь-якого ідентифікатора електронної пошти. Якщо наш тестовий ідентифікатор електронної пошти відповідає цьому шаблону, ми можемо сказати, що це дійсний ідентифікатор електронної пошти.

PS – це шаблон для найпоширеніших ідентифікаторів електронної пошти в Інтернеті.

Типи токенів

Багато токенів можна використовувати в різних комбінаціях у регулярних виразах для опису різноманітних виразів. Нижче ми розглянемо різні типи токенів, які використовуються в регулярних виразах. Крім того, ми також розглянемо найбільш часто використовувані токени в кожній категорії.

Основні жетони

Почнемо з основних жетонів. Ці маркери використовуються майже з усіма регулярними виразами. Отже, ми повинні дізнатися про них в першу чергу.

Токен

Значення

r

Це відповідає символу повернення каретки.