趣味数据:分析了6.5万字的歌词,看到了这样的周杰伦

趣味数据:分析了6.5万字的歌词,看到了这样的周杰伦

一、准备歌词素材

歌词选择:杰伦至今的所有专辑(从最开始的<JAY>到最新的<周杰伦的床边故事>)

由于爬虫木有学会,就只能手动收集歌词。经过一系列的 google、baidu,终于找到别人整理好的歌词全集。ok,就这样歌词文件搞定了,一共也没多大,也就207K(想想周董这么多年唱的歌词大半都在这207K的txt文件里就不免有些感慨)。

趣味数据:分析了6.5万字的歌词,看到了这样的周杰伦

二、对歌词文件完成分词

这是最难的部分,产品汪只会跟程序猿们相爱相杀,哪会写代码呀!!!

趣味数据:分析了6.5万字的歌词,看到了这样的周杰伦

没办法,硬着头皮也要写。网上goolge各种关键字,看博客,花了半天的时间,连蒙带猜,勉勉强强看懂了网上的代码示例,比着葫芦画瓢写了一点点写。

趣味数据:分析了6.5万字的歌词,看到了这样的周杰伦

千难万险,终于写完调通,最终主要的部分一共也就12行,没有任何注释(简直乞丐版代码,根本看不出来哪里sexy ~~~~(>_<)~~~~)

趣味数据:分析了6.5万字的歌词,看到了这样的周杰伦
三、对分词的结果进行分析

好,我们终于到了正文,以上都是废话,下边才是重要结论。(如果以这种方式写邮件一定会被老板打死 ♪(^∇^*) )

结论一:杰伦最喜欢的唱的主题 — 情歌 (我自己也知道这是废话 O(∩_∩)O)

趣味数据:分析了6.5万字的歌词,看到了这样的周杰伦

拉了下出现频率 top20 的词语,满满的都是文艺、伤感、爱情 :

我们 / 怎么 / 没有 / 微笑 / 离开 / 爱情 / 回忆 / 不要 / 开始 / 如果 / 怎么 / 开始

我擦,感觉随机排列组合都能成歌词,方文山以后是不是就可以下岗了 ♪(^∇^*)

结论二:杰伦喜欢妈妈胜过爸爸,喜欢外婆胜过爷爷以及外公(歌词中没有出现奶奶)

趣味数据:分析了6.5万字的歌词,看到了这样的周杰伦

大家应该都听过<听妈妈的话>。

杰伦专门为外婆写了一首歌<外婆>,其中也就1句歌词提到了外公。

至于爷爷,杰伦也有那首<爷爷泡的茶>

结论三:杰伦喜欢黑色、白色胜过其他颜色

趣味数据:分析了6.5万字的歌词,看到了这样的周杰伦

很符合周董的形象,歌词里高大上的黑色&白色力压其他颜色。看到黑白两色频率这么高,我第一时间想到的是<以父之名>,感觉很符合那个气质。还有就是青色出现了6次,大概率是因为<青花瓷>吧。

结论四:杰伦最喜欢的语气词是 oh~

趣味数据:分析了6.5万字的歌词,看到了这样的周杰伦

毋庸置疑,杰伦最喜欢 oh~ ,排除大小写的因素,[oh] 出现的频率甚至超过 [我们] 成为出现词频最高的词汇。此外杰伦经典的 “哎呦不错哦~” 中的 [哎呦] 也名列前茅,看来杰伦真的很喜欢讲这句话。

总结:

只是从歌词来看,大概杰伦就是一个穿着黑白帽衫,表面上酷酷的,但是骨子里满是深情、文艺, 只喜欢喝爷爷泡的茶,听妈妈的话,爱自己外婆的 ,嘴里时不时地冒出一句‘哎呦,不错哦’ 的 五好青年 ^_^

以上内容纯属胡说八道,如有雷同,纯属巧合。

本文作者张冬鑫,原文载于作者知乎专栏。

去年今日运营文章

  1. 2023:  520告白日!小红书关键词热度查询,今年的心动密码是什么?(0)
  2. 2023:  视频号+社群裂变3大玩法,助力商家高效增长(0)
  3. 2023:  办公室电脑常用技巧:桌面待办管理告别低效忙碌(0)
  4. 2023:  冲刺618:新品变爆品,品牌如何提炼差异化卖点?(0)
  5. 2023:  小红书数据调研分析!喜茶新联名,这次怎么样?(0)

原创文章,作者:爱运营,如若转载,请注明出处:https://www.iyunying.org/seo/dataanalysis/104859.html

(0)
爱运营的头像爱运营管理员
上一篇 2017年5月18日 下午1:51
下一篇 2017年5月18日 下午2:37
分享本页
返回顶部