정규표현식(Regular Expression, Regex, 정규식)
정규식 문법
ttps://github.com/google/re2/wiki/Syntaxhttps://ko.wikipedia.org/wiki/정규_표현식
복잡한 정규식의 사용에 대해
- 너무 심각하게 복잡한 기능이 필요한 정규식은 쓰지 말고, 그냥 python 프로그래밍으로 해결 하는 것이 훨씬 나은 방법이다. 그러나 정말 어쩔 수 없이 해야만한다면 정규식에 대한 매우 높은 이해도가 필요하다.
- Python을 쓴다면, 정규식보다 훨씬 더 구현이 빠르고 정확하며, 디버깅, 유지보수, 협업이 용이해진다. 특히 너무 복잡한 문제에는 가능한 정규식은 사용하지 않는 것이 정신 건강에 이롭다.
https://codeday.me/ko/qa/20190403/229820.html
Regex를 이해하는 핵심 원리
- 기본적으로 정규식은 항상 (찾을패턴 + 개수)의 형태로 조합하여 텍스트를 검색한다.
- 패턴의 검출은 string의 뒷쪽에서부터, 즉 역순으로 적용된다.패턴은 항상 가장 큰 범위의 string에서부터 적용된다.(즉 패턴을 최대한 넓게 적용하려한다.)
- 예를들어 REGEXREPLACE은 항상 뒤에서부터, 가장 큰 범위로, multiple하게 적용된다.
문자 지정 문법
- [ ]안에 원하는 pattern을 입력한다.
- | 은 '또는'을 의미한다.
예약어(키워드)