Python의 re 모듈

re 모듈은 문자열 일치를 위한 Python의 고유 모듈입니다. 이 모듈에서 제공되는 많은 기능은 정규 표현식을 기반으로 합니다.

문자열 일치 및 추출을 위해 정규 표현식이 사용됩니다. 필요한 문자열 부분입니다. 모든 언어에 공통됩니다.

1. 문자

2. 문자 세트

3. 수량자

그리디 모드: 항상 최대한 많은 문자를 일치시키려고 노력합니다.

Non-greedy는 그 반대이며 항상 가능한 한 적은 수의 문자를 일치시키려고 시도합니다.

{0,}는 이전 문자와 0번 이상 일치하며 * 메타문자와 동일합니다.

{+,}는 이전 문자와 1번 또는 무한번 일치하며 +와 동일합니다. 메타 문자 문자

{0,1}는 이전 문자와 0 또는 1회 일치하며 이는 ? 메타 문자와 동일합니다.

() 뒤에 (adc)*와 같은 특수 메타 문자가 오는 경우 그러면 *로 제어되는 선행 문자는 더 이상 선행 문자가 아닌 ()의 전체 내용입니다.

4. 특수 그룹화 사용 표: 일반 함수에 의해 반환된 객체에만 유용합니다.

5 , 단언

단언의 표현형식을 보면 그룹화 기호를 사용하고 있음을 알 수 있는데, 맨 앞에 물음표가 붙는다. 이 물음표는 비포착 그룹이고 이 그룹이라는 뜻이다. 번호가 없으며 역참조로 사용할 수 없으며 어설션으로만 사용할 수 있습니다.

xxx에서 xxx와 일치합니다: (?<=).*(?=)

제가 이해한 바는 다음과 같습니다.

p>

5. 예

(1) 아님

^(?!.*200).*$, 200에만 일치함

^( ?!.*[200|400]).*$, 200 및 400에만 일치합니다.

[^a-z]는 반전되었으며 a-z 문자를 포함하지 않습니다.

(2 ) \u4e00 -\u9fa5 중국어

(3) r"\b([\u4e00-\u9fa5]\s?[\u4e00-\u9fa5]+)\b" # Xiao Ming은 단어를 다음과 일치시킵니다. 중간 공백

컴파일 함수는 정규식을 컴파일하고 두 함수 match() 및 search()에서 사용할 정규식(패턴) 객체를 생성하는 데 사용됩니다.

match 시도합니다. 문자열의 시작 위치가 패턴과 일치합니다. 시작 위치가 성공적으로 일치하지 않으면 아무것도 반환되지 않습니다.

검색은 전체 문자열을 검색하여 첫 번째로 성공한 일치 항목을 반환합니다.

re.match와 re.search의 차이점:

정규식 대체 함수

성공적으로 일치하는 지정된 위치의 문자열을 대체하고 숫자를 반환합니다. 두 개의 변수를 사용하여 각각을 허용할 수 있습니다.

(2) 두 개 이상의 문자를 잘라서 [ ] 안에 넣습니다(구분 기호는 유지되지 않음):

(3) 사용 ( ) 그룹 캡처(구분 기호 유지):

문자열에서 정규식과 일치하는 모든 하위 문자열을 찾아 목록을 반환합니다. 일치하는 항목이 없으면 빈 목록이 반환됩니다.

참고: match와 search는 한 번만 일치하고 findall은 모든 항목과 일치합니다.

사용법:

참고 1: 일치가 이루어지면 이전에 성공한 일치에서 다음 일치가 시작되며 다음 숫자부터 시작하여 성공적으로 일치한 것으로 이해할 수도 있습니다. 문자열, 다음 일치에 참여하지 않음

참고 2: 일치 규칙이 작성되지 않은 경우, 즉 빈 규칙인 경우 원래 문자열보다 한 자리 더 많은 빈 문자열 목록이 반환됩니다.

참고 2: 일치하는 규칙이 작성되지 않은 경우, 즉 빈 규칙이 반환됩니다.

p>

참고 3: 정규 일치가 빈 문자와 일치할 때 규칙에 그룹이 하나만 있고 그룹 뒤에 *가 오면 그룹의 내용이 0 이상이 될 수 있음을 의미하므로 그룹에는 두 가지 의미가 있습니다.

하나는 그룹의 콘텐츠를 일치시키는 것을 의미하고,

다른 하나는 그룹의 0개 콘텐츠(즉, 공백)를 일치시키는 것을 의미합니다.

따라서 *를 사용하지 마십시오. 그렇지 않으면 빈 문자열과 일치할 수 있습니다.

정규 표현식, 반환 유형은 표현식 객체입니다.

예: <_sre.SRE_Match object; 6, 7), match='a' >

객체를 반환하려면 일반 메서드를 사용하여 문자열을 가져와야 합니다.

上篇: 입의 복수형 下篇: windows 에서 CMD 에서 특정 포트를 빠르게 닫는 방법
관련 내용