Жолдан арнайы таңбаларды алып тастаңыз
' str.replace ' қолданайық
str.replace көмегімен біз кейбір таңбаларды басқаларына ауыстыра аламыз. Егер біз жай ғана кейбір таңбаларды алып тастағымыз келсе, оларды бос жолға ауыстырамыз. str.replace() ауыстыруды табылған барлық сәйкестіктерге қолданады.
s="Hello$ Python3$" s1=s.replace("$", "") print (s1) # Результат: Hello Python3
Барлық таңбаларды алып тастамау үшін сәйкестіктер санына шектеу қоя алсақ.
s="Hello$ Python3$" s1=s.replace("$", "", 1) print (s1) # Результат: Hello Python3$
" re.sub " арқылы
қайта. қосалқы (үлгі, жауап, жол, санау=0, жалаушалар=0)
> Ең сол жақ қабаттаспайтын жолды ауыстыру арқылы алынған жолды қайтарады
> үлгі қайталау мәні үшін жолда сәйкес келеді. Үлгі сәйкес келсе
> табылмады, өзгертілмеген жолды қайтарыңыз
> -
Python құжаттамасынан
Егер біз таңбаларды алып тастағымыз келсе, сәйкестіктерді бос жолға ауыстырамыз.
s="Hello$@& Python3$" import re s1=re.sub("[$|@|&]","",s) print (s1) # Результат: Hello Python3
s1=re.sub(“[$|@|&]”,””,s)
- Ауыстыру үлгісі → "[ $ | @ | &]»
- [ ] жиынды анықтау үшін пайдаланылады
- $ | @ | & → $ немесе @ немесе & іздейді
- Бос жолмен ауыстырыңыз
- Егер жоғарыдағы таңбалар ауыстырылған болса, онда олар бос жолға ауыстырылады
Әріптерден басқа барлық таңбаларды алып тастаңыз
'isalpha()' көмегімен
isalpha() жолда тек әріптерден тұратынын тексеру үшін пайдаланылады. Әріп болса True қайтарады. Жолдағы әрбір таңбаны қайталап, оның әріп екенін тексереміз.
Мысал
s="Hello$@ Python3&" s1="".join(c for c in s if c.isalpha()) print (s1) # Результат: HelloPython
s=”Hello$@ Python3&”
(c үшін с in s, егер c.isalpha())
Нәтиже → *['H', 'e', 'l', 'l', 'o', 'P', 'y', 't', 'h', 'o', 'n'] *
Біздің алдымызда жолдағы барлық әріптерді қамтитын генератор нысаны бар:
s1=””.join(c үшін c in s, егер c.isalpha())
””.join барлық таңбаларды бір жолға біріктіреді.
'сүзгі()' арқылы
s = "Hello$@ Python3&" f = filter(str.isalpha, s) s1 = "".join(f) print(s1)
f = сүзгі(str.isalpha, s)
filter() функциясы жолдың әрбір элементіне str.isalpha әдісін қолданады және егер ол true болса, онда элементті қайтарамыз. Әйтпесе, өткізіп жібереміз.
s1 = ””.қосылу(f)
filter() функциясы берілген жолдың барлық әріптерін қамтитын итераторды қайтарады және join() барлық элементтерді бір-біріне «жабады».
're.sub()' көмегімен
s = "Hello$@ Python3$" import re s1 = re.sub("[^A-Za-z]", "", s) print (s1) # Результат: HelloPython
s1 = re.sub(“[^A-Za-z]”, ””, s) ескеріңіз
- “[ A-Za-z]”* → Әріптерден басқа барлық таңбаларды іздейді. Жиынның басында * көрсетсеңіз, онда жиынтықта көрсетілмеген барлық таңбалар үлгіге сәйкес келеді. (орыс сөздері үшін [^A-Yaa-ya] пайдаланыңыз - ред.)
- Үлгіге сәйкес келетін барлық таңбалар бос жолға ауыстырылады.
- Әріптерден басқа барлық таңбалар жойылады.
Әріптер мен сандардан басқа барлық таңбаларды алып тастаңыз
'isalnum()' арқылы
isalnum() жолдың тек сандардан немесе әріптерден тұратынын анықтағымыз келгенде қолданылады.
Қажетті таңбаларды анықтау үшін жолдың әрбір таңбасын аралап көрейік.
s = "Hello$@ Python3&" s1 = "".join(c for c in s if c.isalnum()) print(s1) # Результат: HelloPython3
're.sub()' көмегімен
s = "Hello$@ Python3&_" import re s1 = re.sub("[^A-Za-z0-9]", "", s) print(s1) # Результат: HelloPython3
s1=re.sub(“[^A-Za-z0–9]”,””,s) қарастырыңыз
- “[^A-Za-z0–9]” → Бұл үлгі әріптер мен сандардан басқа барлық таңбаларды іздейді.
- Барлық табылған таңбалар бос жолға ауыстырылады
- Әріптер мен сандардан басқа барлық таңбалар жойылады.
Тұрақты өрнектерді пайдаланып жолдан барлық сандарды алып тастаңыз
're.sub()' көмегімен
s = "Hello347 Python3$" import re s1 = re.sub("[0-9]", "", s) print(s1) # Результат: Hello Python$
s1=re.sub(“[0–9]”,””,s) қарастырыңыз
- [0-9] - 0-ден 9-ға дейінгі сандар
- re.sub(“[0–9]”, ””, s) - сәйкестіктер болса, бос жолмен ауыстырыңыз
Жолдан сандардан басқа барлық таңбаларды алып тастаңыз
'isdecimal()'
isdecimal() егер жолдағы барлық таңбалар цифр болса, шын мәнін қайтарады, әйтпесе жалған.
s = "1-2$3%4 5a" s1 = "".join(c for c in s if c.isdecimal()) print(s1) # Результат: 12345
Біз жолдың әрбір таңбасынан өтіп, оның цифр екенін тексереміз. "".join() барлық элементтерді біріктіреді.
're.sub()' көмегімен
s = "1-2$3%4 5a" import re s1 = re.sub("[^0-9]", "", s) print(s1) # Результат: 12345
s1 = re.sub(“[^0–9]”, ””, s) ескеріңіз
- [^0-9] 0-ден 9-ға дейінгі таңбалардан басқа барлық таңбаларды іздейді
- re.sub(“[^0–9]”, ””, s) сандардан басқа барлық таңбалар бос жолға ауыстырылады.
'сүзгі()' арқылы
s = "1-2$3%4 5a" f = filter(str.isdecimal, s) s1 = "".join(f) print(s1) # Результат: 12345
f = filter(str.isdecimal, s) қарастырыңыз
filter() функциясы әрбір таңба үшін str.isdecimal әдісін орындайды, егер ол true мәнін қайтарса, оны генераторға қосады. Содан кейін генератор join() әдісі арқылы жолға шығарылады.
Ескерту
Python тіліндегі жолдар өзгермейтін нысандар, сондықтан жоғарыда аталған әдістердің барлығы берілген жолдан таңбаларды алып тастап, жаңасын қайтарады, олар бастапқы жолдың күйін өзгертпейді.
Я конечно понимаю, что это статья с Медиума, но всё равно - очень не хватает сравнения скорости выполнения замен.
Опечатка в заголовке статьи - 5 СОпсобов
помогло, спасибо