实用小技巧,Python一秒将全部中文姓名转为拼音!

开发 后端
有时在处理文件时候,我们需要将中文姓名转换为拼音,或者是转换为拼音首字母,本文将介绍三种Python实现的方法,最后给一个批量操作的代码案例!

 有时在处理文件时候,我们需要将中文姓名转换为拼音,或者是转换为拼音首字母,本文将介绍三种Python实现的方法,最后给一个批量操作的代码案例!

[[353586]]

一、xpinyin

开门见山,Python中文字转拼音可以使用xpinyin,直接使用pip安装即可👇

 

  1. pip install xpinyin -i http://pypi.douban.com/simple --trusted-host pypi.douban.com 

接着导入xpinyin下的 Pinyin 方法如下

 

  1. from xpinyin import Pinyin 

首先试试中文名转拼音,

 

  1. p = Pinyin() 
  2. result1 = p.get_pinyin('叶伏天'
  3. result1 

结果如下:

 

  1. 'ye-fu-tian' 

tone_marks可以显示声调

 

  1. result2 = p.get_pinyin('叶伏天', tone_marks='marks'

结果如下:

 

  1. 'yè-fú-tiān' 

去掉空格👇

 

  1. s = result1.split('-'
  2. result3 = s[0].capitalize() + ' ' + ''.join(s[1:]).capitalize() 
  3. result3 
  4.  
  5. 结果如下: 
  6. 'Ye Futian' 

 

 

 

有时需要中文名转拼音首字母,也很简单👇

 

 

 

二、pypinyin

另一种方法是使用pypinyin,安装同样可以使用pip

 

  1. # 安装 
  2. pip install pypinyin -i http://pypi.douban.com/simple --trusted-host pypi.douban.com 

直接导入就行👇

 

  1. import pypinyin 

再来看看中文名转拼音的实现办法

 

  1. result1 = pypinyin.pinyin('叶庭云', style=pypinyin.NORMAL) 
  2. result1 

结果如下:

 

  1. [['ye'], ['ting'], ['yun']] 

启用多音节来实现声调

 

  1. result2 = pypinyin.pinyin('叶庭云', heteronym=True
  2. result2 

结果如下:

 

  1. [['yè''xié'], ['tíng'], ['yún']] 

因为返回的是一个嵌套的list,所以需要简单调整一下

 

  1. result_ = [i[0] for i in result1] 
  2. result3 = result_[0].capitalize() + ' ' + ''.join(result_[1:]).capitalize() 
  3. result3 

结果如下:

 

  1. 'Ye Tingyun' 

启用多音字模式时,竟然发现 ‘叶’ 也是多音字,查询了资料发现确实是这样,涨知识啦!

 

 

 

 

 

 

下面是中文名转拼音首字母的方法

 

 

 

三、snownlp

最后一种办法是使用snownlp,同样的pip安装与导入如下:

 

  1. # 安装 
  2. pip install snownlp -i http://pypi.douban.com/simple --trusted-host pypi.douban.com 
  3. # 导入 
  4. from snownlp import SnowNLP 

中文名转拼音👇

 

  1. s = SnowNLP('叶庭云'
  2. s.pinyin 

结果如下:

 

  1. ['ye''ting''yun'

将list转为字符串

 

  1. result4 = s.pinyin[0].capitalize() + ' ' + ''.join(s.pinyin[1:]).capitalize() 
  2. result4 

结果如下:

 

  1. 'Ye Tingyun' 

 

 

 

 

最后是中文名转拼音首字母

 

 

 

四、批量将中文名转换成拼音

现在,掌握了基本使用后,我们就能利用批量操作来解放双手

 

  1. import pypinyin 
  2. import pandas as pd 
  3.  
  4. df = pd.read_excel('学生名单_test.xls'
  5. df.head() 

先导入一份学生名单如下

 

 

 

下面是使用pypinyin批量将全部学生的中文姓名转换为拼音

 

  1. pinyin_name = [] 
  2. first_pinyin = [] 
  3. for i in df['姓名']: 
  4.     result = pypinyin.pinyin(i, style=pypinyin.NORMAL) 
  5.     result_ = [i[0] for i in result] 
  6.     result2 = result_[0].capitalize() + ' ' + ''.join(result_[1:]).capitalize() 
  7.     result3 = ''.join([i[0].upper() for i in result_]) 
  8.     print(result2, i, sep=' '
  9.     pinyin_name.append(result2) 
  10.     first_pinyin.append(result3) 
  11.      
  12. df['英文名'] = pinyin_name 
  13. df['拼音首字母'] = first_pinyin 
  14. df.head() 

或者是转换为拼音首字母,运行结果如下:

 

 

 

责任编辑:华轩 来源: 早起Python
相关推荐

2020-11-11 17:00:02

PythonOffice文件PDF

2023-10-26 18:03:14

索引Python技巧

2024-03-11 15:08:26

Linux操作系统进程

2024-02-01 18:06:04

Python编程系统

2011-07-01 11:13:47

MogileFS

2013-02-20 15:59:50

Windows 8

2022-02-18 11:51:36

Python代码编程语言

2020-09-24 10:03:54

Python开发语言

2022-04-29 08:15:40

Python技巧Max

2020-12-24 09:18:51

SQL数据库函数

2021-03-15 08:13:19

JavaScript开发代码

2011-12-19 17:03:09

点心桌面

2010-09-07 13:33:44

云安全技术

2022-08-28 23:51:04

编辑器vim代码

2024-02-26 08:05:00

Pythonpypinyin开发

2017-10-30 17:25:11

javascript

2011-03-23 16:24:44

LAMPMySQL

2016-05-10 10:16:13

JavaScript技巧

2014-05-19 10:16:31

算法机器学习

2011-07-07 16:17:14

点赞
收藏

51CTO技术栈公众号