资本寒冬下,这个不足10人的小团队,如何用算法替代了1000个编辑?

资本寒冬下,这个不足10人的小团队,如何用算法替代了1000个编辑
长文干货,4000字,看完需要9分钟。
作者:JohnK,无量数据CEO

专注人工智能在个人生活和消费领域的探索

当你想在周末闲暇时候,找寻城市里新开的人气小店,人少的美景;
当你去到一个新的城市,想要快速找到当地人喜欢去的地道餐厅……
你亦或在大而全的App里寻寻觅觅;
亦或在不同的微信公众号、小众App的内容中跳转,寻找……

每天,有10万个本地达人创作的公众号和小众App,在全国范围产生20万篇本地最具消费价值的内容,也有人在微博,知乎默默地产出高质量的美食玩乐攻略,那里面一定有一篇文章,能够解决你的问题。
如何在恰到好处的那一刻,找到自己最需要的那一段文字,视频?
于是我们发现,人工智能在消费内容这个领域,有大量的事情可以做,每个人都能消除信息不对称,享受到最值的品质生活。

把100个城市装进口袋,到哪都是本地人

资本寒冬下,这个不足10人的小团队,如何用算法替代了1000个编辑?于是我们想到了聚合,试图把这10万个本地人做的公众号内容,放到一个产品里,让用户到了任何地方,都不用再问东问西,迅速找到吃喝玩乐好去处。
我们做了一款产品叫做去哪逛,包括1个已经完成的App和半个月增长了5000粉丝的公众号。

但是内容聚合这个事情也有很多人在做了,我们缺少很好的内容经验,怎么办呢,考虑到我们是一个数据公司,会一些算法和架构,于是……

我们试着做了一套算法,发现它能替代1000个编辑

资本寒冬下,这个不足10人的小团队,如何用算法替代了1000个编辑?先看看筛选算法
这是7000篇文章的筛选工作,主要任务是把7000篇文章中,跟吃喝玩乐相关的文章识别出来。
一边是机器用算法跑了50秒,准确率达到了97%,另一边是一个人,花了10个小时一个一个判断,最终做到了83%的准确率。
也就是说,在这个环节上,机器已经完胜人类。
资本寒冬下,这个不足10人的小团队,如何用算法替代了1000个编辑?
具体示例,左侧是机器判断跟吃喝玩乐无关的内容,右侧是和吃喝玩乐有关的内容。
在7000篇的测试通过后,我们开始对全国20万个公众号累计上百万篇内容进行算法调试。

再一览分类算法
资本寒冬下,这个不足10人的小团队,如何用算法替代了1000个编辑?橙色是算法分类的结果,蓝色是人工分类结果,除了个别多义文章上的处理,机器对文章的分类已经做到接近于人的识别能力。
这些对文本的学习处理的算法,在很早就出现了,在很长一段时间内,都仅仅是极客们的玩具,在如今信息爆炸的环境下,我们做到了这些算法在具体场景具体领域下的最大化使用。

再一瞥全文学习算法
这道算法会拆解一篇文章所有的段落、句和词,对文章进行深度学习和理解,从而判断这篇文章是不是一篇好文章,会不会有很好的传播效果。比如算法对下面一篇文章打出了232的高分:
《苏州夜景最美的17个地方,一定要带你的ta去一遍!》
全文的内容非常聚焦,一直都在讲最适合带爱人约会的好去处,算法对于文章中许多直击人性的词都给予了高分,而文章实际表现也不俗,2万多阅读,85个赞,赞比接近千分之四,非常健康的数字。
而对下面一篇打出了-240的低分:
《WOW!大叔家这么好玩,一起组队续卡吧》
这篇文章质量就很一般,通篇都在陈述山姆店里面有什么,没有走到消费者心里面,便宜的东西连价格都不标,反而是贵的东西标了价格,丝毫没有任何点能够打动人心。而最终效果也确实不如人意,上万的阅读,却只有10个赞。
这个传播力算法最直接的作用,就是能够帮助文案创作,相较于很多很难量化的文案创作标准,算法一跑,文章质量如何已经略知一二了。
在历史文章的计算中,机器对于质量较差的文章判断准确率达到了99%,对于好文章的判断率也有65%。

如果一切顺利,我们明年会顺便推出这样一个小的工具,帮助大量的内容创作者们分析自己的文案。在拒绝一些公司的高价收购和合作意向之后,我们决定这个产品将完全免费。
整套算法由6道算法构成,包含文章质量判断、相关性识别、主题分类、图片处理、热度预测、全文学习,这6道算法我们都已经实现,并在逐步部署完善中,考虑到资金有限,我们也希望能够获得一笔投资,来继续完善算法和架构。
这套算法最终能够每天处理100万篇文章,最后精选出5万篇文章,呈现给不同地方的用户,随着后续的完善,能够做到呈现给不同类型,不同场景的用户。
而这个工作量,等效于1000个编辑。

30个人,做到全球生活消费内容的运营

从提出这个想法到实现出来之后,我们发现,这玩意儿还有更大的价值,就是全球多语系的内容运营,实时聚合各个国家的达人在各个平台上写的吃喝玩乐内容,再通过机器翻译,将内容用本地化的语言呈现给用户,打通语言之间的障碍。让你5分钟在全球都能变成本地人。
而就现实意义来讲,这让1个人,运营100个公众号,监控10万个公众号成为可能。而随着机器处理背靠的自然增长规律,以及随着自我学习不断提高的精度,机器甚至可以取代更高级别的操作,比如排版、图片处理、润色等等。
这套算法,算一个城市和算全世界是同一个成本,为什么不去做全世界呢?
这么复杂的系统,只需要30个人,而它的价值是能够替代上万人的办公室的文案、运营方面的重复劳动。

机器也懂人,一切逃不开数学规律

资本寒冬下,这个不足10人的小团队,如何用算法替代了1000个编辑?这两个数字是什么意思呢?就是我们做了两个不相关的训练集,得出来两套字典,其中字典A是7000多个词,字典B是9000多个词,我们发现,两个字典有25%的词和得分是一模一样的,另外有73.2%的词,它们得分误差在20%以内,也就是说,内容的好或者坏,是有共性的。
文章这种感性的东西,会有数学常数吗?
资本寒冬下,这个不足10人的小团队,如何用算法替代了1000个编辑?这是25000篇文章的热度分布,可以看出呈现出非常漂亮的对称分布。
让我们更有信心的是算法的结果分布:
资本寒冬下,这个不足10人的小团队,如何用算法替代了1000个编辑?上图去掉噪点(通常是阅读很低的文章)之后,从左到右是按照算法给出得分从大到小排序的文章的实际点赞比,我们发现文章实际赞比的分布和算法得分呈现非常高的正相关性。
数学规律,是衡量一个系统是否有效的最终规律,纯逻辑化的算法,在感性的内容中间跳跃闪烁,并能给出最冷酷的判断,看似不可理喻,实际上已经远远穿透了感情的表层,直击人性的根源,而人性本身,在各领域无一不与数学规律牢牢相关,比如股市的泡沫和崩盘、病毒营销的传播效应、成绩优劣的正态分布……
既然机器已经能做到感性内容的处理,我们不禁想到,他们能否进一步穿透人类,直接到达深层的需求领域?

从内容到消费的算法全打通

聚合、场景需求感知、连接两端的推荐引擎,这是未来智能时代必须具备的。
当前的商业环境下,商家很难感知消费者的真实需求,以为卖出的是可乐,实际上卖出的是清爽,以为卖出的是钻戒,实际上卖出的是那个大小合适的洞口,以为卖出的是一桌饭菜,实际上卖出的是感情的注脚,以为卖出的是艺术课,实际上卖出的是家长对孩子的期望。
于是我们提出更有挑战的目标:场景需求感知引擎。
当前时代,推荐引擎的智能程度,只能算的上1%,通病是将用户过度单维化,时间、场景、热点却只能通过高成本的人工来实现。
你在淘宝上下单买了个马桶盖,买完后发现淘宝的“猜你喜欢”全都变成了马桶盖,你听了一天民谣,想换点刺激的,但是软件只会继续给你推荐民谣,你失恋了特别想听点伤感的,而软件则给了你昨天听过的摇滚。
未来需要场景和需求的感知,从需求感知到引导消费,人类会越来越依赖人工智能,这不仅应该而且必定会成为现实。
比如你饿了,想吃东西了,或者馋了,才会主动打开外卖或者美食的App,而有没有办法识别你饿了还是渴了?想吃辣还是想吃甜品?你的屁股被劣质的椅子硌得生疼,是不是压根就没想过有一款椅子特别适合你的身体?你的肺最近特别差,你会主动去想附近空气最好的去处去散散心?你的体脂比飙升,是不是希望在餐桌前,能有人帮你选好最适合你又最美味的菜肴?你褪黑素近来分泌紊乱,如果有人能帮你推荐一家好的按摩店和一个好的按摩套餐,让你美美地睡上一觉,你是不是会爱上TA?
人的一切外在欲求,哪怕是漫无目的地尝试和沉迷,都非常强地受到场景、体征、情感、环境、心智等等方面的影响,建立在具体条件下的多维计算后的感知引擎,才能做到比你更懂你,所以我们敢说,当前的推荐引擎,其智能程度,顶多算得上1%。而在未来,人工智能在这里有更多的想象力。
资本寒冬下,这个不足10人的小团队,如何用算法替代了1000个编辑?所以,在完成这些之前,我们绝不会降格回到互联网的老思维上去。

资本寒冬,让我们上了一课

以上思考,全得益于这场资本寒冬。
下半年开始的这场寒冬,投资人一下子都保守起来。如果说,寒冬前,天使投资人和创业者们是在一个热情的party上,大家都感知对方的亮点,这个人读万卷书行万里路,那个人歌唱的好又是运动健将,现在寒冬来了,则突然都变成了相亲的饭局,七大姑八大姨评价你的指标都变成了房产和收入。
当然,这并不怪谁,反而我们要感谢这股寒冬,这股寒冬让我们知道自己到底穿了几层衣服,是选择躲起来还是大胆的迎接寒冷,让自己的骨骼更加健壮,更加不惧风雪。
正值天使轮融资进程,在和二十多个投资人的初步沟通中,我们确实发现了我们很多的短板,而我们在一轮又一轮地分析论证之后,最终的结论却是:
与其花心思去补那些短板,让我们成为又一个四平八稳的团队,不如极致化我们的长处,让我们在算法、自动化方面在消费内容这个领域大放异彩。
正因这样的觉悟,在长达数月的方向验证、市场调查和一次又一次的希望、失望、困惑之后,我们从正式提出构想到实现算法,仅仅花了两周时间。
对于这一轮的融资情况,我们也有非常坚定的预期和应对方式,一个月前,我们还在联系商家来探索盈利模式,而现在,我们确信,传统的和互联网的获客和变现方式,都是限制我们思考的枷锁,只有打破这个枷锁,才能让新技术新时代更快到来。

终语:既然是去发现新大陆,就不要带上渔网

作为个人而言,实际上这可能是我近来最放开的一篇文章了,贯穿我以往所言,无一不是求稳、专注,但恰恰在这个资本市场和创业环境一片消沉的时候,我更想对其他创业者说一句:苟活和伟大是可以共存的,因此千万不要被眼前的困顿打败。
这个寒冬,对于经历过风雨的老将来说,充其量就是摔一跤,而一些玩票的,风险没有评估成熟的创业者们,他们中的一些人,才会觉得无望,会打退堂鼓,回到自己的舒适区去。
但历来苟活者中,往往存在着志在千里的大才,他们不到时候,不会爆发,数十年的打磨锤炼,才会成就大业,比如一边卖着豆子一边读着春秋的,比如钻了别人胯下却面不改色的,比如当了十年奴隶只为复国的,比如白天挨家挨户卖塑料桶,晚上必留两小时看书的。
往往越是经历过这些的,在关键时刻,越是能表现出别人难以企及的坚韧,有了坚韧作为最牢固的地基,你会发现,外面的一切,都是为你添砖加瓦。
这只是一个初创团队在面临资本寒冬时,将自己最深层的思考贡献出来,仅仅为了在外面充斥着消极浮躁的时候,希望有人能够看到他们的务实,专注。因为他们坚信,自己所做的一切,最终会显露价值。

我们团队成员,在每个人能承受的最低薪酬的状况下,在孵化器每天最早到,最晚走。每个人都大胆接下不熟悉的任务,一两周后便能够将诸多细节娓娓道来。其中一个成员,母亲去世,一边承受着莫大的哀痛,一边调动一切努力和资源去做推广,这样的团队,不管什么条件下都能坚强的活着的。

这个团队叫做:无量数据,专注人工智能在个人生活和消费领域的探索。
有意向投资、加入我们的,可以联系微信:rjfrant

作者:JohnK
链接:https://zhuanlan.zhihu.com/p/23318781
来源:知乎
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。

去年今日运营文章

  1. 2023:  小红书种草训练营课件(0)
  2. 2023:  私域用户运营必备的13个理论模型(0)
  3. 2023:  2023小红书Will商业大会PPT(0)
  4. 2023:  2023高端护肤品牌直播方案【美妆护肤】【直播带货】(0)
  5. 2023:  能力提升系列:个人商业画布详解(0)

原创文章,作者:爱运营,如若转载,请注明出处:https://www.iyunying.org/zha/hot/82819.html

(0)
爱运营爱运营管理员
上一篇 2016年11月1日 上午11:00
下一篇 2016年11月1日 上午11:20

推荐资讯

发表回复

登录后才能评论

评论列表(1条)

  • 爱运营
    爱运营 2016年11月1日 上午11:17

    不错的产品,但是今天看官网是宕机状态。而且这类产品需要考虑的版权问题比较多。
    在不看版权和盈利的前提下,这样的产品是值得学习的,机器学习,机器筛选优质内容并推送。

分享本页
返回顶部