云服务器网:购买云服务器和VPS必上的网站!

app上架市场后应考虑哪些问题?

内容兴趣偏好标签是甚么?简单来讲,就是分析用户喜欢看的文章类型,取得用户的兴趣偏好。在此基础上,个性化推荐用户内容,push推动,有效增进app活跃并延长用户生命周期。简单地说,这件事实际上是两步:一是对文章进行分类,俗称给文章贴标签。其次,给用户贴上标签,即

内容兴趣偏好标签是甚么?

简单来讲,就是分析用户喜欢看的文章类型,取得用户的兴趣偏好。在此基础上,个性化推荐用户内容,push推动,有效增进app活跃并延长用户生命周期。

简单地说,这件事实际上是两步:

一是对文章进行分类,俗称给文章贴标签。

其次,给用户贴上标签,即用户浏览了哪些类型的文章,相应地会得到自己的兴趣偏好标签。

那末在实际操作中真的那末简单吗?这两个看似简单的环节是怎么实现的?

一般有三种获得样本的方式:

一是人工标注文章,优点是准确,缺点是效力低,算法需要大量样本,本钱很高。

另外一种方法是通过一些开源网站提供的关键词进行模型训练,比如从搜狗词库获得。优点是本钱低,但缺点明显。由于区别的分类系统对部份分类的理解不一致,分类不够准确,后期需要大量的人力进行改正。

第三种方法是和一些信息类型的信息类型app合作,获得他们的文章和分类作为样本,比如今天的头条,uc等等都是不错的选择。我们当时都试过了(一把苦涩的眼泪)。

取得样本后,是对算法模型的训练和测试。算法模型的训练原理是通过对样本文章进行分词,提取实体,建立特点工程,以每一个特点词为向量,拟合函数。这样,当有新文章时,文章就会通过分词和模型来计算结果。但是模型不能一次性用样本准确,模型需要测试和校订。

通过测试的模型不是一劳永逸的,后期仍可能出现一些分类不准确的问题,多是样本或算法模型酿成的。这就要求我们找出这些异常的文章及其分类,纠正分类,再次作为训练样本喂给模型进行模型改正。一方面,我们可以对转化率较低的分类文章进行人工抽样,肯定问题会不会属于算法。另外,在这里,由于每篇文章的标签都被赋予了一个值,我们可以为这些值设置一个阈值。当最高值低于某个阈值时,这些文章及其标签将被召回,并手动标记和纠正,并放入样本库中。

文章标签的计算,由于文章有各种标签的可能性,而不是一些二级分类的结果,所以我们使用的方法是通过类似性算法,模型计算文章的标签,并分配值,值越高,越接近这些标签,并标记相应的标签。

到目前为止,文章标签的部份已完成。

如何给用户贴上标签

其实给用户贴标签的方式有两种,统计标签和算法标签。

统计类相对简单粗鲁,以用户一段时间浏览的文章类型作为用户的兴趣偏好。

算法会增加更多的影响因素,包括文章浏览的数量、浏览的时间间隔、文章与当前热门事件的关系、用户属性等。

前者可以在算法资源不足、运营需求大的情况下领先,后者可以在前者的基础上划分部份流量,验证和调剂算法模型,不断优化。

但在第一种方式中,我们发现用户在一段时间内浏览文章类型不稳定,大多数用户会有一个或几个主要的兴趣偏好,这些类型会浏览更多的文章,但同时,用户或多或少会浏览其他类型的文章,乃至有些用户会看到哪里,甚么会看到。

基于这类情况,我们需要对用户的兴趣偏好进行排名,即对用户在一段时间内浏览的每种文章类型的文章数量进行排名,并取用户的数量top10个标签清楚地告知操作用户喜欢甚么类型的文章,在这些类型中,用户喜欢甚么类型的优先级,方便操作学生推送选择。

因此,用户标签也需要更灵活,可让操作学生根据事件产生的时间和次数灵活组合选择用户群。

由于目前push很大一部份推送是手动进行的,从文章的选择,到用户的选择,到文章和用户的匹配,通常在正式推送之前进行大量的推送A/Btest,信息文章种类繁多,仅一级标签就到达30+种类,二级标签从100到几百不等,整体标签极可能有不计其数的标签,单靠操作学生推,是绝对不可能完成的。

因此,在运营资源有限、没法实现自动化的情况下,一般运营学生会对标签进行测试,选择覆盖用户数量大、转化率高的标签。但与此同时,这类情况会致使一些利益偏好相对较小的用户被排除在外。

针对这类情况,我们取用户top10个二级标签及其相应的一级标签作为用户的一级和二级标签。这样就解决了用户覆盖的问题,运营商也能够集中精力推送主标签和人群。

本文来源:https://www.yuntue.com/post/73484.html | 云服务器网,转载请注明出处!

关于作者: yuntue

云服务器(www.yuntue.com)是一家专门做阿里云服务器代金券、腾讯云服务器优惠券的网站,这里你可以找到阿里云服务器腾讯云服务器等国内主流云服务器优惠价格,以及海外云服务器、vps主机等优惠信息,我们会为你提供性价比最高的云服务器和域名、数据库、CDN、免费邮箱等企业常用互联网资源。

为您推荐

发表回复

您的电子邮箱地址不会被公开。 必填项已用*标注