加入收藏 | 设为首页 | 会员中心 | 我要投稿 核心网 (https://www.hxwgxz.com/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 教程 > 正文

用Python分析了数千个微信昵称后,我们发现了这些规律...

发布时间:2018-08-28 19:30:28 所属栏目:教程 来源:XksA
导读:一、前言 这是一篇技术文,但又不是一篇技术文,今天分享的是,当笔者获取了微信小程序英文取名的3500多个微信用户昵称、年龄段后,分析得到下面结果。 二、Let's get it 1.基本信息获取 访问英文取名的用户基本信息接口,获取英文取名用户微信名(Nick nam
副标题[/!--empirenews.page--]

用Python分析了数千个微信昵称后,我们发现了这些规律...

一、前言

这是一篇技术文,但又不是一篇技术文,今天分享的是,当笔者获取了微信小程序英文取名的3500多个微信用户昵称、年龄段后,分析得到下面结果。

二、Let's get it

1.基本信息获取

访问英文取名的用户基本信息接口,获取英文取名用户微信名(Nick names)、访问次数(Count)、总数据集(Response data),并将微信名存入文件。

  1. # 获取所有用户数量和相关信息 
  2. def get_json(): 
  3.     # 获取入口 
  4.     search_url = '英文取名用户接口,欢迎扫码使用英文取名,生成一个最适合你的英文名' 
  5.     # 发送http请求,获取请求页面 
  6.     search_response = requests.get(search_url) 
  7.     # 设置编码 
  8.     search_response.encoding = 'UTF-8' 
  9.     # 将页面转变成json代码格式 
  10.     search_json = search_response.json() 
  11.     # 获取我们需要的数据,是列表格式 
  12.     our_data = search_json['ResponseData'] 
  13.     list_len = len(our_data) 
  14.     print('总用户数有:' + str(list_len)) 
  15.     user_visit_numbers = 0 
  16.     data_research = 0 
  17.     NickName = [] 
  18.     for x in our_data: 
  19.         user_numbers = x['Count'] + user_visit_numbers 
  20.         if x['NickName'] == '': 
  21.             data_research += 1 
  22.         NickName.append(x['NickName']) 
  23.     print("微信名获取失败量:"+str(data_research)) 
  24.     print(NickName) 
  25.     name = ['微信名称'] 
  26.     file_test = pd.DataFrame(columns=name, data=NickName) 
  27.     file_test.to_csv(r'I:/data.csv', encoding='utf-8',index=False) 
  28.     print('总访问量:' + str(user_visit_numbers)) 

运行结果:

  1. 总用户数有:3549 
  2. 微信名获取失败量:0 
  3. 总访问量:4573 

2.读取所有微信名,数据分类

(1)读取微信名

  1. # 读取文件,取出微信名 
  2.  def get_name(): 
  3.      NickName = [] 
  4.      with open('I:/data.csv','r',encoding='utf8') as file : 
  5.          i = 0 
  6.          for line in file: 
  7.              if i == 0:   # 去除表头 
  8.                  i = 1 
  9.                  continue 
  10.             line = line.strip()    # 去除换行符 
  11.             NickName.append(line) 
  12.     return NickName 

(2)数据分为以下六大类

用Python分析了数千个微信昵称后,我们发现了这些规律...

  1. # ch :Chinese 
  2. ch_name_number = 0 
  3. ch_name = [] 
  4. # en :English 
  5. en_name_number = 0 
  6. en_name = [] 
  7. # di : digtal 
  8. di_name_number = 0 
  9. di_name = [] 
  10. # img : image 
  11. img_name_number = 0 
  12. img_name = [] 
  13. # ch_di : Chinese and digtal 
  14. ch_di_name = [] 
  15. # other : other 
  16. oth_name_number = 0 
  17. oth_name = [] 

(编辑:核心网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

热点阅读