十年网站开发经验 + 多家企业客户 + 靠谱的建站团队
量身定制 + 运营维护+专业推广+无忧售后,网站问题一站解决
有时在处理文件时候,我们需要将中文姓名转换为拼音,或者是转换为拼音首字母,本文将介绍三种Python实现的方法,最后给一个批量操作的代码案例!

创新互联专注于永嘉网站建设服务及定制,我们拥有丰富的企业做网站经验。 热诚为您提供永嘉营销型网站建设,永嘉网站制作、永嘉网页设计、永嘉网站官网定制、小程序定制开发服务,打造永嘉网络公司原创品牌,更为您提供永嘉网站排名全网营销落地服务。
一、xpinyin
开门见山,Python中文字转拼音可以使用xpinyin,直接使用pip安装即可
- pip install xpinyin -i http://pypi.douban.com/simple --trusted-host pypi.douban.com
 
接着导入xpinyin下的 Pinyin 方法如下
- from xpinyin import Pinyin
 
首先试试中文名转拼音,
- p = Pinyin()
 - result1 = p.get_pinyin('叶伏天')
 - result1
 
结果如下:
- 'ye-fu-tian'
 
tone_marks可以显示声调
- result2 = p.get_pinyin('叶伏天', tone_marks='marks')
 
结果如下:
- 'yè-fú-tiān'
 
去掉空格
- s = result1.split('-')
 - result3 = s[0].capitalize() + ' ' + ''.join(s[1:]).capitalize()
 - result3
 - 结果如下:
 - 'Ye Futian'
 
有时需要中文名转拼音首字母,也很简单
二、pypinyin
另一种方法是使用pypinyin,安装同样可以使用pip
- # 安装
 - pip install pypinyin -i http://pypi.douban.com/simple --trusted-host pypi.douban.com
 
直接导入就行
- import pypinyin
 
再来看看中文名转拼音的实现办法
- result1 = pypinyin.pinyin('叶庭云', style=pypinyin.NORMAL)
 - result1
 
结果如下:
- [['ye'], ['ting'], ['yun']]
 
启用多音节来实现声调
- result2 = pypinyin.pinyin('叶庭云', heteronym=True)
 - result2
 
结果如下:
- [['yè', 'xié'], ['tíng'], ['yún']]
 
因为返回的是一个嵌套的list,所以需要简单调整一下
- result_ = [i[0] for i in result1]
 - result3 = result_[0].capitalize() + ' ' + ''.join(result_[1:]).capitalize()
 - result3
 
结果如下:
- 'Ye Tingyun'
 
启用多音字模式时,竟然发现 ‘叶’ 也是多音字,查询了资料发现确实是这样,涨知识啦!
下面是中文名转拼音首字母的方法
三、snownlp
最后一种办法是使用snownlp,同样的pip安装与导入如下:
- # 安装
 - pip install snownlp -i http://pypi.douban.com/simple --trusted-host pypi.douban.com
 - # 导入
 - from snownlp import SnowNLP
 
中文名转拼音
- s = SnowNLP('叶庭云')
 - s.pinyin
 
结果如下:
- ['ye', 'ting', 'yun']
 
将list转为字符串
- result4 = s.pinyin[0].capitalize() + ' ' + ''.join(s.pinyin[1:]).capitalize()
 - result4
 
结果如下:
- 'Ye Tingyun'
 
最后是中文名转拼音首字母
四、批量将中文名转换成拼音
现在,掌握了基本使用后,我们就能利用批量操作来解放双手
- import pypinyin
 - import pandas as pd
 - df = pd.read_excel('学生名单_test.xls')
 - df.head()
 
先导入一份学生名单如下
下面是使用pypinyin批量将全部学生的中文姓名转换为拼音
- pinyin_name = []
 - first_pinyin = []
 - for i in df['姓名']:
 - result = pypinyin.pinyin(i, style=pypinyin.NORMAL)
 - result_ = [i[0] for i in result]
 - result2 = result_[0].capitalize() + ' ' + ''.join(result_[1:]).capitalize()
 - result3 = ''.join([i[0].upper() for i in result_])
 - print(result2, i, sep=' ')
 - pinyin_name.append(result2)
 - first_pinyin.append(result3)
 - df['英文名'] = pinyin_name
 - df['拼音首字母'] = first_pinyin
 - df.head()
 
或者是转换为拼音首字母,运行结果如下: