12个Python数据处理常用内置函数

开发 后端
在python数据分析中,经常需要对字符串进行各种处理,例如拼接字符串、检索字符串等。下面我将对python中常用的内置字符串操作函数进行介绍。

[[387854]]

在python数据分析中,经常需要对字符串进行各种处理,例如拼接字符串、检索字符串等。下面我将对python中常用的内置字符串操作函数进行介绍。

1.计算字符串的长度-len()函数

  1. str1='我爱python' 
  2. length=len(str1) 
  3. print(length) 

len()函数在计算字符串的长度时,不区分英文、数字和汉字,所有字符都按一个字符计算。

有时,我们需要获取字符串实际所占的字节,即计算python默认编码UTF-8下的实际字节长度,可以这样做:

  1. str1='我爱python' 
  2. length=len(str1.encode()) 
  3. print(length) 

12

和UTF-8编码下一个汉字占3个字节相吻合

2.分割字符串

split()方法可以实现字符串分割,也就是把一个字符串按照指定的分割符分割为字符串列表。具体语法格式如下

  1. str.split(sep,maxsplit) 

参数说明:

  1. str:表示要分割的字符串  
  2. sep:指定的分割符  
  3. maxsplit:用于指定分割的次数 

3.统计某字符出现的次数

count()方法用于检索某字符串在另一字符串中出现的次数,语法格式如下:

  1. str.count(str1) 

参数说明:

  1. str:表示原字符串 
  2. str1:表示要检索的字符串 

4.检索某字符串是否存在(find)

find()方法用于检索是否包含指定的子字符串。如果检索的字符串不存在,则返回-1,否则返回首次出现该子字符串的索引。其语法格式如下:

  1. str.find(str1) 

参数说明:

  1. str:表示原字符 
  2. str1:表示要检索的子字符串 

5.检索某字符串是否存在(index)

index()与find()方法类似,也是用于检索是否包含指定的子字符串。只不过index()方法在指定字符串不存在是会抛出异常。具体语法如下:

  1. str.index(str1) 

参数说明:

  1. str:表示原字符 
  2. str1:表示要检索的子字符串 

6.检索字符串是否已指定字符串开头

这里用到startswith()方法,如果是则返回True,否则返回False,具体语法如下:

  1. str.startswith(str1) 

参数说明:

  1. str:表示原字符 
  2. str1:表示要检索的子字符串 

7.检索字符串是否已指定字符串结尾

这里用到endswith()方法,如果是则返回True,否则返回False,具体语法如下:

  1. str.endswith(str1) 

参数说明:

  1. str:表示原字符 
  2. str1:表示要检索的子字符串 

8.大写字母转小写字母

lower()方法用于价格字符串中的大写字母转换为小写字母,语法格式如下:

  1. str.lower() 

9.小写字母转换为大写字母

upper()方法用于价格字符串中的小写字母转换为大写字母,语法格式如下:

  1. str.upper() 

10.删除空格和特殊字符

strip()方法用于去掉字符串左、右两侧的空格和特殊字符,语法格式如下:

  1. str.strip([chars]) 

参数说明:

  1. str:表示原字符 
  2. chars:为可选参数,用于指定要取出的字符,可以指定多个。如果chars为“@”,则取出左、右两侧包括的“@”“。”。如果不指定chars参数,默认去除空格、制表符“\t”、回车符“\r”、换行符“\n”等 

11.去掉字符串左侧的字符

lstrip()方法用于去掉字符串左侧的空格和特殊字符,语法格式如下:

  1. str.lstrip([chars]) 

参数说明:

  1. str:表示原字符 
  2. chars:为可选参数,用于指定要取出的字符,可以指定多个。如果chars为“@”,则取出左、右两侧包括的“@”“。”。如果不指定chars参数,默认去除空格、制表符“\t”、回车符“\r”、换行符“\n”等 

12.去掉字符串右侧的字符

rstrip()方法用于去掉字符串右侧的空格和特殊字符,语法格式如下:

  1. str.rstrip() 

参数说明:

  1. str:表示原字符 
  2. chars:为可选参数,用于指定要取出的字符,可以指定多个。如果chars为“@”,则取出左、右两侧包括的“@”“。”。如果不指定chars参数,默认去除空格、制表符“\t”、回车符“\r”、换行符“\n”等 

本文转载自微信公众号「python数据分析之禅」,作者小dull鸟 。转载本文请联系python数据分析之禅公众号。

 

责任编辑:武晓燕 来源: python数据分析之禅
相关推荐

2022-03-02 11:45:16

Python函数数据分析

2024-01-24 13:14:00

Python内置函数工具

2019-02-18 15:05:16

Python内置函数索引

2024-02-22 10:14:40

Filter函数Python

2021-04-26 05:35:22

Python内置函数

2010-03-22 10:27:28

Python常用模块I

2020-05-26 13:45:46

Python函数字符串

2020-06-24 07:44:12

Python数据技术

2023-12-22 15:44:43

2020-09-27 08:36:21

Python Memcached缓存

2020-09-29 08:35:08

MongoDBPython数据

2021-08-11 12:07:12

PythonPgSQL数据

2024-01-31 23:22:35

vaexPython

2020-09-24 06:49:34

PythonRedis

2023-12-12 11:06:37

PythonPandas数据

2023-09-25 13:19:41

pandasPython

2022-09-17 18:23:46

Lodash模块化JavaScrip

2020-09-25 16:20:21

Python内置函数字符串

2017-11-14 05:04:01

大数据编程语言数据分析

2023-03-24 16:41:36

Pandas技巧数据处理
点赞
收藏

51CTO技术栈公众号