文章列表

内部人揭秘佳缘用户推荐系统 你的心仪对象是怎么匹配出来的
2018-10-29
2011年8月我加入世纪佳缘,开始时主要负责佳缘的交友推荐系统优化,后来我这个团队也负责其他的机器学习事情,比如佳缘的网警系统(抓恶意用户)。刚来时团队加上我只有3个人,做的事基本集中在推荐系统,以及对业务部门新产品的接口支持。当时我自己并没有推荐系统应用于工业界的实际经验,所以很想当然地就从自己了解的推荐算法开始工作了。2011年到2013年中这段时间,我们在算法方面主要做了两个方向的尝试。第一个是尝试item-basedkNN算法。对这个算法的优化
世纪机缘 913 人学过
内部人揭秘佳缘用户推荐系统 你的心仪对象是怎么匹配出来的
2018-10-29
2011年8月我加入世纪佳缘,开始时主要负责佳缘的交友推荐系统优化,后来我这个团队也负责其他的机器学习事情,比如佳缘的网警系统(抓恶意用户)。刚来时团队加上我只有3个人,做的事基本集中在推荐系统,以及对业务部门新产品的接口支持。当时我自己并没有推荐系统应用于工业界的实际经验,所以很想当然地就从自己了解的推荐算法开始工作了。2011年到2013年中这段时间,我们在算法方面主要做了两个方向的尝试。第一个是尝试item-basedkNN算法。对这个算法的优化
世纪机缘 712 人学过
聊一聊留存分析,活跃、留存和产品增长之间的关系
2018-10-25
本文会从什麽是活跃用户,什麽是用户留存,为什麽要做留存分析,活跃、留存和产品增长之间的关系,以及怎麽做留存分析,来给大家展开话题。
922 人学过
“数据驱动” 到底是什么
2018-09-25
LinkedIn利用数据分析为所有职场人员作出迅捷、高质、高效的决策,提供具有指导意义的洞察和可规模化的解决方案。因此,商业数据分析不仅是一种科学,而且是实实在在可以为业务带来价值的科学LinkedIn作为一家职业社交网站,通过人才招聘、广告投放、付费订阅等服务实现了盈利,这三项服务的背后实际上都有着数据分析的重要贡献。LinkedIn利用数据分析为所有职场人员作出迅捷、高质、高效的决策,提供具有指导意义的洞察和可规模化的解决方案。
数据驱动 681 人学过
一读懂人工智能、机器学习和深度学习的区别
2018-09-20
人工智能是最早出现的,也是最大、最外侧的同心圆;其次是机器学习,稍晚一点;最内侧,是深度学习,当今人工智能大爆炸的核心驱动。有人说,人工智能(AI)是未来,人工智能是科幻,人工智能也是我们日常生活中的一部分。这些评价可以说都是正确的,就看你指的是哪一种人工智能。
聚类分析基础知识总结及实战解析
2018-09-20
聚类分析是没有给定划分类别的情况下,根据样本相似度进行样本分组的一种方法,是一种非监督的学习算法。聚类的输入是一组未被标记的样本,聚类根据数据自身的距离或相似度划分为若干组,划分的原则是组内距离最小化而组间距离最大化,
聚类分析 484 人学过
数据测量与分析:入门完全指南
2018-08-29
在这篇入门完全指南中,我们将探讨分析学中一些基本的方法,以及用户体验测量与分析中的日常工作和交付物。我们也将列举一些常用工具、相关书籍,帮UX从业者更好地学会收集和分析数据。有没有一种神奇的方法,可以创造广受欢迎或者能让用户一见钟情的体验?并没有。创造所有人都喜爱的体验并非我们的目标,相反,我们力求创造一种直接服务于特定人群并让他们满意的体验。同样地,也没有一种特定的衡量我们创作成功与否的方法。在这样的情形下,分析学就�
数据分析 数据测量 623 人学过
海量数据分析处理的十个方法
2018-08-28
本文将简单总结下一些处理海量数据问题的常见方法。当然这些方法可能并不能完全覆盖所有的问题,但是这样的一些方法也基本可以处理绝大多数遇到的问题。下面的一些问题基本直接来源于公司的面试笔试题目,方法不一定最优,如果你有更好的处理方法,欢迎讨论。
数据分析 492 人学过
作为数据科学家应该学习的第一件事
2018-08-23
根据30年的商业经验,下面的列表是我认为首先应该在数据科学课中讲授的(非全面的)内容选择。这是我文章的后续内容为什么Logistic回归应该最后讲解。我不确定下面这些主题是否在数据营或大学课堂上讨论过。问题之一是招聘教师的方式。招聘过程是有利于以学业成就或其“明星”身份而闻名的个人,并且他们倾向于在数十年内反复教导同一事物。
数据科学家 547 人学过
机器学习中最常用的5个回归损失函数
2018-08-10
机器学习中所有的算法都需要最大化或最小化一个函数,这个函数被称为“目标函数”。其中,我们一般把最小化的一类函数,称为“损失函数”。它能根据预测结果,衡量出模型预测能力的好坏。
机器学习 回归损失函数 561 人学过