基于协同过滤的个性化微博推荐算法研究

2021-05-27 来源：好走旅游网

第２０卷第３期　２０１７年３月　软件工程ＳＯＦＴＷＡＲＥ　ＥＮＧＩＮＥＥＲＩＮＧ　、，０ｌ－２０　Ｎｏ．３　Ｍａｒ．２０１７　文章编号：２０９６－１４７２（２０１７）－０３－１４－０３　基于协同过滤的个胜化微博推荐算法研究　秦晓晖　（太原工业学院计算机工程系，山西太原０３０００８）　摘要：当前，微博已经成长为世界上最有影响力的社交网络服务之一。随着微博的流行，微博上大量的数据也使　得用户无法快速获取他感兴趣的信息。推荐系统是通过研究用户已有数据来发掘用户兴趣，从而为用户推荐可能感兴趣　的对象，如产品、网页、微博等。本文介绍了一种基于协同过滤推荐技术的微博推荐算法，从影响用户兴趣度的隐性因　素，以及微博互联网中的数据采集和预处理等角度对微博推荐进行研究。使用矩阵分解对隐ｆ生因素建模，在已有用户与　微博、用户与微博发布者影响因素的基础上，提出微博与微博发布者影响因素，提高了原算法的准确度。　关键词：微博推荐，协同过滤，矩阵分解　中图分类号：ＴＰ３９１　文献标识码：Ａ　Ａ　Ｐｅｒｓｏｎａｌｉｚｅｄ　Ｍｉｃｒｏ－Ｂｌｏｇ　Ｒｅｃｏｍｍｅｎｄａｔｉｏｎ　Ａｌｇｏｒｉｔｈｍ　Ｂａｓｅｄ　ｏｎ　Ｃｏｌｌａｂｏｒａｔｉｖｅ　Ｆｉｌｔｅｒｉｎｇ　ＱＩＮ　Ｘｉａｏｈｕｉ　（ＳｃｈｏｏｌｏｆＣｏｍｐｕｔｅｒＥｎｇｉｎｅｅｒ，ｒａｉｙｕａｎＩｎｓｔｉｔｕｔｅｏｆＴｅｃｈｎｏｌｏｇｙ，Ｔａｉｙｕａｎ　０３０００８，Ｃｈｉｎａ）　Ａｂｓｔｒａｃｔ：Ｃｕｒｒｅｎｔｌｙ，ｍｉｃｒｏ－ｂｌｏｇ　ｈａｓ　ｂｅｃｏｍｅ　ｏｎｅ　ｏｆ　ｔｈｅ　ｍｏｓｔ　ｉｎｆｌｕｅｎｔｉａｌ　ｎｅｔｗｏｒｋｉｎｇ　ｓｅｒｖｉｃｅｓ　ｔｈｒｏｕｇｈｏｕｔ　ｔｈｅ　ｗｏｒｌｄ．　Ａｌｏｎｇ　ｗｉｔｈ　ｉｔｓ　ｉｎｃｒｅａｓｉｎｇ　ｇｒｏｗｔｈ　ｏｆｐｏｐｕｌａｒｉｔｙ，ｔｈｅ　ｌａｒｇｅ　ｎｕｍｂｅｒ　ｏｆｉｎｆｏｒｍａｔｉｏｎ　ａｖａｉｌａｂｌｅ　ｏｎ　ｍｉｃｒｏ—ｂｌｏｇ　ｈａｓ　ｏｂｓｔｒｕｃｔｅｄ　ｐｅｏｐｌｅ　ｆｒｏｍ　ａｃｃｅｓｓｉｎｇ　ｔｈｅ　ｍｅｓｓａｇｅｓ　ｔｈｅｙ　ａｒｅ　ｉｎｔｅｒｅｓｔｅｄ　ｉｎ．Ｔｈｅ　ｍｉｃｒｏ－ｂｌｏｇ　ｒｅｃｏｍｍｅｎｄａｔｉｏｎ　ｓｙｓｔｅｍ　ｐｉｃｋｓ　ｏｕｔ　ａｎｄ　ｒｅｃｏｍｍｅｎｄｓ　ｔｈｅ　ｏｂｊｅｃｔｓ（ｅ．ｇ．ｐｒｏｄｕｃｔｓ，ｗｅｂｐａｇｅｓ，ｍｉｃｒｏ—ｂｌｏｇｓ，ｅｔｃ．）ｖｉａ　ａｎａｌｙｚｉｎｇ　ｔｈｅ　ｅｘｉｓｔｉｎｇ　ｄａｔａ　ｏｆ　ｔｈｅ　ｕｓｅｒ．Ｔｈｅ　ｐａｐｅｒ　ｐｒｏｐｏｓｅｓ　ａ　ｍｉｃｒｏ　ｂｌｏｇ　ｒｅｃｏｍｍｅｎｄａｔｉｏｎ　ａｌｇｏｒｉｔｈｍ　ｂａｓｅｄ　ｏｎ　ｔｈｅ　ｃｏｌｌａｂｏｒａｔｉｖｅ　ｆｉｌｔｅｒｉｎｇ　ｔｅｃｈｎｉｑｕｅ，ｅｘｐｌｏｒｅｓ　ｓｏｍｅ　ｒｅｃｅｓｓｉｖｅ　ｆａｃｔｏｒｓ　ｗｈｉｃｈ　ｍａｙ　ｉｎｆｌｕｅｎｃｅ　ｕｓｅｒ’Ｓ　ｉｎｔｅｒｅｓｔ　ａｎｄ　ｓｔｕｄｉｅｓ　ｍｉｃｒｏ－ｂｌｏｇ　ｒｅｃｏｍｍｅｎｄａｔｉｏｎ　ｆｒｏｍ　ｔｈｅ　ｐｅｒｓｐｅｃｔｉｖｅ　ｏｆ　ｄａｔａ　ｃｏｌｌｅｃｔｉｎｇ　ｎａｄ　ｐｒｅｐｒｏｃｅｓｓｉｎｇ　ｏｎ　ｍｉｃｒｏ－ｂｌｏｇ　ｎｅｔｗｏｒｋｓ．Ｗｈｉｌｅ　ｔｈｅ　ｐｒｅｖｉｏｕｓ　ｓｔｕｄｉｅｓ　ｏｎｌｙ　ｆｏｃｕｓ　ｏｎ　ｔｈｅ　ｒｅｌａｔｉｏｎｓｈｉｐ　ｂｅｔｗｅｅｎ　ｈｔｅ　ｕｓｅｒ　ａｎｄ　ｔｈｅ　ｐｕｂｌｉｓｈｅｒ，ａｎｄ　ｔｈａｔ　ｂｅｔｗｅｅｎ　ｈｔｅ　ｕｓｅｒ　ｎａｄ　ｈｔｅ　ｍｉｃｒｏ—ｂｌｏｇ　ｐｏｓｔ，ｔｈｉｓ　ｐａｐｅｒ　ａｄｏｐｔｓ　ｍａｔｒｉｘ　ｄｅｃｏｍｐｏｓｉｔｉｏｎ　ｔｏ　ｍｏｄｅｌ　ｒｅｃｅｓｓｉｖｅ　ｆａｃｔｏｒｓ　ａｎｄ　ｐｒｏｐｏｓｅｓ　ｔｈｅ　ｉｎｆｌｕｅｎｃｅ　ｆａｃｔｏｒｓ　ｂｅｔｗｅｅｎ　ｔｈｅ　ｐｕｂｌｉｓｈｅｒ　ｎａｄ　ｔｈｅ　ｍｉｃｒｏ—ｂｌｏｇ　ｐｏｓｔ．Ｆｉｎａｌｌｙ，ｈｔｅ　ｅｘｐｅｒｉｍｅｎｔａｌ　ｒｅｓｕｌｔｓ　ｓｈｏｗ　ｔｈａｔ　ｔｈｅ　ｎｅｗ　ａｌｇｏｒｉｔｈｍ　ｓｉｇｎｉｆｉｃａｎｔｌｙ　ｉｍｐｒｏｖｅｓ　ｔｈｅ　ａｃｃｕｒａｃｙ　ｏｆ　ｍｉｃｒｏ－ｂｌｏｇ　ｒｅｃｏｍｍｅｎｄａｔｉｏｎ．　Ｋｅｙｗｏｒｄｓ：ｍｉｃｒｏ－ｂｔｏｇ　ｒｅｃｏｍｍｅｎｄａｔｉｏｎ；ｃｏｌｌａｂｏｒａｔｉｖｅ　ｉｆｌｔｅｒｉｎｇ；ｍａｔｒｉｘ　ｄｅｃｏｍｐｏｓｉｔｉｏｎ　１引言（Ｉｎｔｒｏｄｕｃｔｉｏｎ）　分析的，那么就需要找出影响用户对于微博兴趣度的一些隐　目前被广泛应用的协同过滤算法…在推荐系统　中发挥　性因素，而矩阵分解作为一种隐含语义模型可以很好地帮我　着很重要的作用。随着信息种类的丰富，我们需要对一些很　们找出这些隐性因素。因此在微博中并不需要指出微博具体　难基于内容来分析的信息，尤其是对一些复杂的甚至难以表　的属性类别，可以使用隐语义模型构建矩阵：比如构建一个　达的概念进行兴趣分析，协同过滤算法表现出了一定的优越　ｕｓｅｒ－ｔｗｅｅｔ矩阵Ｒ见公式（１），其中　ｆ，表示用户　对微博，的兴趣　性。矩阵分解算法　旧前已经被广泛地应用于推荐系统中，它　度，通过对矩阵尺分解得到矩阵Ｐ和矩阵Ｑ，其中，为影响用户　作为隐语义模型中的一种方法取得了一定的成就。协同过滤　兴趣度的隐性属性，这个过程就称为奇异值分解　’　。　算法一般可以分为基于相似邻居的方法“’　和基于模型的方　Ｒ　ｔｗｅｅｔ１　ｔｗｅｅｔ　２　Ｐ　厂１　ｆＺ　Ｑ　ｔｗｅｅｔ１　ｔｗｅｅｔ　２　法　’　这两大类，目前隐因子概率模型或者矩阵分解模型经　ｕｓｅｒ１　Ｒｌｌ　Ｒ１２＝ｕｓｅｒ１　Ｐｌｌ　Ｐ１２×厂１　Ｑｌ１　ｑ１２　ｆ１１　ｕｓｅｒ　２　Ｒ２１　Ｒ２２　ｕｓｅｒ　２　Ｐ２１　Ｐ２２　ｆ２　Ｑ２１（２２２　常被用来解决一些问题。本文主要使用基于模型算法中的矩　通过矩阵Ｐ和矩阵Ｑ想乘即可得出尺中缺失的兴趣度，详　阵分解算法，具体使用隐因子模型来度量影响微博用户喜好　的一些隐性因素。　本文向用户进行微博推荐是通过用户对微博的兴趣度来　第２０卷第３期　秦晓晖：基于协同过滤的个性化微博推荐算法研究　１５　从上述过程可以看出我们无需确定属性的具体类别和属　被挖掘出来，而且一定程度上缓解了由于转发行为少而导致　性的个数，只需要设置隐因子模型中的属性个数值作为属性　分类的粒度即可，值越大即代表分类的粒度越细。通过隐因　子模型，在不知道微博的类型和用户喜欢的微博类别的前提　的矩阵稀疏问题。　（１）用户一微博主题偏好分解　由于用户微博转发次数导致数据稀疏的问题，本文通过　微博内容信息来缓解该问题，不同的主题可以使用不同的词　下也可以得到用户对每个类别的兴趣度。　２基于协同排序的微博推荐算法（ｃ　０Ｊｌａｂｏｒａｔｉｖｅ　来代表，因此可以将微博的隐因子模型转化为主题词语的隐　ｒａｎｋｉｎｇ　ｍｅｔｈｏｄ　ｆｏｒ　ｔｗｅｅｔ　ｒｅｃｏｍｍｅｎｄａｔｉｏｎ）　２．１微博排序优化准则　本文研究用户对微博喜好度的排序，我们使用协同排序　算法，它是基于隐因子模型的协同过滤方法。首先定义表示　尺ｄ低维向量，同时定义Ｐｔ￡∈Ｒａ和ｑｆ∈Ｒｄ来表示用户和微博的　＝　因子组合，于是转化为分解模型（７）：　∑…　ｑｗ）　（７）　其中，　表示用户一属性矩阵，ｑ　表示词一属性矩阵，ｑⅥ，矩　阵中的每一个词　都属于微博　，ｚ为微１射中词的个数，乘以　对每个词的权重进行归一化。这样的转化由原来的用户对一　属性空间向量。那么就可以通过公式（３）来预测用户“对微博　的喜好度：　ＹＵ，Ｌ　Ｐｕ　ｑ￡　（３）　条微博的喜好度转变为用户对词或主题的喜好度，从而缓解　了矩阵稀疏问题。　（２）用户一发布者社会关系分解　由于我们最终要获得的是用户对微博兴趣度的排序结　果，而预测值　为用户ｕ对微１靴喜好度，这里我们认为用户对　转发过的微博喜好度大于未转发过的微博即ｙｕ，ｋ＞ｙｕ，ｈ，为了　除了微博内容还可以将用户与发布者的社会关系也考虑　实现微博的排序，我们将目标函数定义为计算求微博艮在喜好　进模型。如果用户对发布者发布的微博主题感兴趣的话，也　度排序中比微博　靠前的可能性，详见公式（４）：　就是用户的兴趣与该微博发布者的微博主题很相似，那么该　用户转发该发布者的微博的可能性就比较高，因此通过用户　与微博发布者之间的隐性因子可以预测用户转发该条微博的　其中，　为转发过的微博，ｈ为非转发的微博，，表示微博排　Ｐ（７＿（　）＞ｒ（／１）ｌｕ）＝　１　概率，详见公式（８）：　Ｙｕ．￡＝ｐｕｒｄｐ（Ｏ　（８）　序，Ｐ表示微博　比微博ｈ的排序靠前的概率，等式右边是对　Ｙｕ，　＞Ｙｕ，ｈ的归一化处理。　这里，我们构建表示用户对转发微　其中，ｄｐ（ｃ］表示发布者ｐ发布的微１射的发布者隐性因子矩阵。　这种分解不考虑微博的内容计算转发一条微博的先验概率。　博喜好度大于非转发微博喜好度的数组Ｄ，见公式（５）：　Ｄ＝（＜Ｕ，ｋ，五＞ｆｋ∈Ｒｅ（ｕ），石　尺Ｐ（札））　（５）　考虑社交关系进我们的模型通过线性组合可以得到公式（９）：　其中，Ｒｅ（ｕ）为用户ｕ转发微博的集合。依据前面的假设，我们　认为所有用户对转发微博的喜好度比非转发微博高，因此尺ｅ　集合里的所有微博盆都能与非　ｅ集合里的微１尊白组成Ｄ中的一　个元素＜“，岛　，这里我们定义　为正例，ｈ为负例。对公式（６）　取对数进行最大似然估计更加便于计算，最终转化为求解目　标函数（６）：　１　＝　∑　ｑｗ＋ａｄｐ（ｏ）　（９）　（３）发布者一微博主题权威性分解　在以上分析的基础上我们又考虑了发布者与微博主题权　威性之间的隐性因子对用户兴趣度的影响。这里提出的微博　权威性对用户微博转发行为的影响不是基于用户来考虑的，　Ｍｉｎ＞　其中，，为正则化参数。　Ｉｎ（１＋ｅ－（ｙｕ，ｋ一　∞）＋Ｆ　（６）　‘一＜ｕ，ｋ，ｈ＞ＥＤ　与以上两种分析是不同的。通常如果一些权威专家发布一些　他所在的专家领域相关的微博，那么这种微博话题通常会比　２．２基于矩阵的隐因子分解模型　本文中通过研究用户、微博和微博发布者三者之间的隐　性因素来预测用户对微博的兴趣度。因此可以籽用户一微博　较吸引用户的注意力，用户会倾向于转发此类微博。计算微　博权威性隐性因子详见公式（１０）：　矩阵使用ＳＶＤ方法拆分为三个矩阵，具体分解为用户一微博　矩阵、用户一发布者矩阵、发布者一微博矩阵，矩阵分解的　过程不仅极大地丰富了我们的模型，使得一些潜在影响因素　Ｙｕ　；∑ｗ　ｑｗ　（１０）　通过线性组合将微博权威性的隐性因子考虑进我们的模　型可以转化为公式（１１）：　１６　软件工程　验数据。　２０１７年３月　Ｙｕ，ｉ＝ＰｕＴ（　∑ｗｅｒＬｑｗ＋ａｄｎ（０）十　∑　ｆｌｄｎ（ｏ（１１）　３．２评价标准　公式（１１）表示通过挖掘用户、微博和发布者这三者中的两　两之间的隐性因子度量用户的兴趣度，不仅全面地考虑了多　种隐性因子丰富了模型，而且一定程度上缓解了数据稀疏的　问题。　考虑到推荐结果中成功率的问题，本文使用平均准确　率来评价预测结果的准确度。模型的推荐结果是微博排序，　同时还可以用准确度关联成功推荐的微博的排序位置从而使　得推荐模型得到更准确的评估，即成功推荐的微博排序越靠　前，那么平均准确率越高。如果系统没有成功推荐的微博，　那么准确率记为０。评估公式详见（１９）：　ＡＰ＝—（４）参数估计　本文使用线性加权的方法来预测用户对微博的兴趣度，　其中　为发布者对微博影响因子的权重，卢为发布者对微博　Ｚ￣＝ＩＰ＠ｎ丽￣ｒ—ｅｔｗ—ｅｅｔ（ｎ）　——（１９）　主题影响因子的权重。２．１节中给出的目标函数（６）是求解的对　象，本文中使用梯度下降的方法得到最优解即对目标函数求　其中，Ｊｖ为测试集中的微博数量，尺为测试集中用户转发过的　导。首先对矩阵进行初始化，这里我们使用随机数，然后通　微博数量，ｒｅｔｗｅｅｔ（ｎ）为布朗函数，当第ｎ条微博是用户转发过　过对构造的数据集Ｄ中的每一组元素计算梯度来不断更新矩阵　的微博（即成功推荐），ｒｅｔｗｅｅｔ（ｎ）的值为１，当第１＂１条微博为用　中的值直到循环终止得到最优解。其中，梯度更新系数详见　户没有转发过的微博时，ｒｅｔｗｅｅｔ（ｎ）的值为０。ｐ＠ｎ为取排序结　果中前１７条微博时的准确度。当计算出所有用户的ＡＰ值时就　公式（１２）￣Ｕ公式（１７）：　可以得到ＭＡＰ的值，详见公式（２０），其中Ｊｖ为用户总数。　ｏ一＿　ａｋ＝§　－嘉∑　ｑｓ＋（　㈤）卜ｏ＇ｌｐｕ（１２）　ＭＡＰ：　（２０）　一一一　Ｉ旦Ｏｑｗ＋＝垂（　＋ｄｐ㈤）（∞广　’一ａｚｑｗ＋　　…、　３．３实验结果　本文通过与其他几种方法的对比实验结果来验证算法的　一——　ｅ一Ｏ旦ｑ＝垂有效性。按照时间排序的方法是指所有微博按照时间排序不　－ｗ　（１＋ｄＩＴｚ　ｐｕ　＋ｄｐ（ｐ㈤）ｋ）Ｊ一　一ｏｒ２ｑｗ　一　（（１１４４））　通过其他算法重排序，这种方法表现微博最直接、最原始的　一１　状态，但却忽略了用户兴趣对微博排序的影响，与这种方法　一　　＝　ＰＰｕ＋　ｕ　＋　ｑｑ　ｗ），４－）一ａ一　（３ｄｐ㈤　∞　（１５）　得到的结果相对比将有效地说明本文中算法研究的意义和必　一　ＯＬ要性。按相似度排序的方法是按照微博与用户标签的相似性　一　＝合ｕ合　Ｐ　＋亭ｑ＋　ｑｗ一）一ａ一㈣　（３ｄｐ㈣　ｃ　１６　）来排序的，这里使用余弦相似度来计算相似度，标签是指用　户历史微博和转发微博历史里面的关键词的集合。原始　方法　一　＝合（　＋　一）一　（１７）　在隐性因素方面只考虑主题层次和社会关系层次。矩阵分解　模型算法ＳＶＤ在原始算法的基础上添加影响用户兴趣度的微　其中，　“＋”表示在数据集中转发微博中的值，　“一”表示在　博权威性隐性因素预测用户兴趣度。该算法也使用随机梯度　非转发微博中的值，鲁表示真实值与预测值之间偏差的概率，　算法来估计实验参数，实验中矩阵分解过程中使用到的Ｋ值取　详见公式（１８）：　３０准确率最高。　垂＝１一Ｐ（ｒ（　）＞７＿（　Ｉｕ）＝卜　（１８）　表１所有方法的ＭＡＰ值　Ｔａｂ．１　ＭＡＰ　ｒｅｓｔｆｌｔｓ　ｏｆ　ａｌｌ　ｍｅｔｈｏｄｓ　算法中不停循环使得模型中的权重值不断更新，向着梯　度下降的方向直到循环终止得到最优解。　３实验（Ｅｘｐｅｒｉｍｅｎｔ）　４结论（Ｃｏｎｃｌｕｓｉｏｎ）　３．１数据来源　按照时间序列排序的推荐方法依赖于用户的登录时间，　本文根据特定的需求在新浪微博使用爬虫系统　获取相关　用户对登录时间前后的微博转发概率大，因此预测准确度很　数据，网络爬虫作为搜索引擎的核心技术是一种自动提取网　低。按照相似度的排序只通过关键词计算微博表面相似度，　页信息的计算机程序或者自动化脚本ｎ。　。本文的实验数据通过　忽略了内在语义。原始方法没有考虑微博与微博发布者之间　随机选取一个微博用户，然后以发射状不断爬取该用户的关　的隐性因素而低于ＳＶＤ方法。　注者的数据，以及关注者的关注者的数据，从爬取的数据中　参考文献（Ｒｅｆｅｒｅｎｃｅｓ）　找出１０２４个关注者人数超过１５的微博用户的主页信息作为实　【１】Ｓｈｉ　Ｙ，Ｌ￣ｓｏｎ　Ｍ，Ｈａｎｊａｌｉｃ　Ａ．ＣｏＵａｂｏｒａｔｉｖｅ　Ｆｉｌｔｅｒｉｎｇ　Ｂｅｙｏｎｄ　ｔｈｅ　第２Ｏ卷第３期　秦晓晖：基于协同过滤的个性化微博推荐算法研究　Ｕｓｅｒ—Ｉｔｅｍ　Ｍａｔｒｉｘ：Ａ　Ｓｕｒｖｅｙ　ｏｆ出ｅ　Ｓｔａｔｅ　ｏｆ　ｔｈｅ　Ａｒｔ　ａｎｄ　Ｆｕｔｕｒｅ　Ｋｎｏｗｌｅｄｇｅ，２００８：４２６—４３４．　Ｃｈａｌｌｅｎｇｅｓ［Ｊ］．ＡＣＭ　Ｃｏｍｐｕｔｉｎｇ　Ｓｕｒｖｅｙｓ（ＣＳＵＲ），２０１４，４７（１）：３．　【７】Ｒｅｎｄｌｅ　ｓ．Ｔｈｅ　ＩＥＥＥ　Ｉｎｔｅｒｎａｔｉｏｎａｌ　Ｃｏｎｆｅｒｅｎｃｅ　ｏｎ　Ｄａｔａ　【２】Ｙａｎｇ　Ｘ，ｅｔ　ａ１．Ａ　Ｓｕｒｖｅｙ　ｏｆ　Ｃｏｌｌａｂｏｒａｔｉｖｅ　Ｆｉｌｔｅｒｉｎｇ　Ｂａｓｅｄ　Ｓｏｃｉａｌ　Ｍｉｎｉｎｇ［Ｃ］．Ｆａｃｔｏｒｉｚａｔｉｏｎ　ｍａｃｈｉｎｅｓ，２０１０：９９５—１０００．　Ｒｅｃｏｍｍｅｎｄｅｒ　Ｓｙｓｔｅｍｓ［Ｉ】．Ｃｏｍｐｕｔｅｒ　Ｃｏｍｍｕｎｉｃａｔｉｏｎｓ，　［８］Ｃａｏ　Ｙ．，ｅｔ　ａ１．Ａｄａｐｔｉｎｇ　Ｒａｎｋｉｎｇ　ＳＶＭ　ｔｏ　Ｄｏｃｕｍｅｎｔ　２０１４，４１：１—１０．　Ｒｅｔｒｉｅｖａｌ［Ｃ】．Ｔｈｅ　２９ｔｈ　Ａｎｎｕａｌ　Ｉｎｔｅｒｎａｔｉｏｎａ１　ＳＩＧＩＲ　【３】Ｌｅｖｙ　Ｏ，Ｇｏｌｄｂｅｒｇ　Ｙ．Ｎｅｕｒｌａ　Ｗｏｒｄ　Ｅｍｂｅｄｄｉｎｇ　ａｓ　Ｉｍｐｌｉｃｉｔ　Ｍａｔｒｉｘ　Ｃｏｎｆｅｒｅｎｃｅ，２００６：１８６－１９３．　Ｆａｃｔｏｒｉｚａｔｉｏｎ【Ｃ】．Ａｄｖａｎｃｅｓ　ｉｎ　Ｎｅｕｒａｌ　Ｉｎｆｏｒｍａｔｉｏｎ　Ｐｒｏｃｅｓｓｉｎｇ　【９】孙立伟，何国辉，吴礼发．网络爬虫技术的研究Ｕ】．电脑知识与　Ｓｙｓｔｅｍｓ，２０１４：２１７７—２１８５．　技术，２０１０，６（１５）：４１　１２－４１　１５．　【４］Ｓａｒｗａｒ　Ｂ．，ｅｔ　ａ１．Ｉｔｅｍ—Ｂａｓｅｄ　Ｃｏｌｌａｂｏｒａｔｉｖｅ　Ｆｉｌｔｅｒｉｎｇ　［１０】高建煌．个性化推荐系统技术与成用［Ｄ】．中国科学技术大　Ｒｅｃｏｍｍｅｎｄａｔｉｏｎ　Ａｌｇｏｒｉｔｈｍｓ［Ａ］．Ｈｙｐｅｒｍｅｄｉａ　Ｔｒａｃｋ　ｏｆ　ｔｈｅ　１０ｔｈ　学，２０１０．　Ｉｎｔｅｒｎａｔｉｏｎａｌ　Ｗｏｒｌｄ　Ｗｉｄｅ　Ｗｅｂ　Ｃｏｎｆｅｒｅｎｃｅ．２００１：２８５—２９５．　［１１】Ｃｈｅｎ　Ｋ．，ｅｔ　ａ１．ＣｏｌｌａｂＯｒａｔｉｖｅ　Ｐｅｒｓｏｎａｌｉｚｅｄ　Ｔｗｅｅｔ　［５】Ｓｈｉ　Ｙ．，Ｌａｒｓｏｎ　Ｍ．，Ｈａｎｊａｌｉｃ　Ａ．Ｅｘｐｌｏｉｔｉｎｇ　Ｕｓｅｒ　Ｓｉｍｉｌａｒｉｔｙ　Ｂａｓｅｄ　Ｒｅｃｏｍｍｅｎｄａｔｉｏｎ［Ａ］．Ｔｈｅ　３５ｔｈ　Ｉｎｔｅｒｎａｔｉｏｎａｌ　ＡＣＭ　ＳＩＧＩＲ　ｏｎ　Ｒａｔｅｄ——Ｉｔｅｍ　Ｐｏｏｌｓ　ｆｏｒ　Ｉｍｐｒｏｖｅｄ　Ｕｓｅｒ——Ｂａｓｅｄ　Ｃｏｌｌａｂｏｒａｔｉｖｅ　Ｃｏｎｆｅｒｅｎｃｅ　ｏｎ　Ｒｅｓｅａｒｃｈ　ａｎｄ　Ｄｅｖｅｌｏｐｍｅｎｔ　ｉｎ　Ｉｎｆｏｒｍａｔｉｏｎ　Ｆｉｌｔｅｒｉｎｇ［Ａ】．Ｔｈｉｒｄ　ＡＣＭ　Ｃｏｎｆｅｒｅｎｃｅ　ｏｎ　Ｒｅｃｏｍｍｅｎｄｅｒ　Ｒｅｔｒｉｅｖａｌ，２０１２：６６１－６７０．　Ｓｙｓｔｅｍｓ，２００９：１２５—１３２．　作者简介：　【６】Ｋｏｒｅｎ　Ｙ．Ｆａｃｔｏｒｉｚａｔｉｏｎ　Ｍｅｅｔｓ　ｔｈｅ　Ｎｅｉｇｈｂｏｒｈｏｏｄ：ａ　秦晓晖（１９８７－），女，硕士，助教．研究领域：中文信息处理，　Ｍｕｈｉｆａｃｅｔｅｄ　Ｃｏｌｌａｂｏｒａｔｉｖｅ　Ｆｉｌｔｅｒｉｎｇ　Ｍｏｄｅｌ［Ａ】．Ｔｈｅ　人工智能．　１　４ｔｈ　ＡＣＭ　ＳＩＧＫＤＤ　Ｉｎｔｅｒｎａ　ｃｉＯｎａ】ＣＯｎｆｅｒｅｎＣｅ　ｏｎ　（上接第２５页）　数量，然后就可以确定母鸡ｂ的数量（ｂ＝ｌＯＯ－ａ－ｃ）；当然，我们　断地对已有算法设计进行改进和优化的精神。当然，该问题　也可以先确定母鸡ｂ和小鸡Ｃ的数量，再确定公鸡ａ的数量，此　的解决方法不止于此，必定还会有一些更优的算法值得我们　时所使用的二重循环语句是：　去探索。　ｆｏｒ（ｂ＝ｌ　Ｉｂ＜＝２５　ｌｂ＋＋）　参考文献（Ｒｅｆｅｒｅｎｃｅｓ）　ｆｏｒ（ｃ＝６３　ｌ　ｃ＜＝８７　ｌ　ｃ＋＝３）　【１］Ｆａｔｈｉｍａ　Ｈ．，Ｍｕｓｔｈａｆａ　Ａ．Ｓｙｅｄ．Ｏｐｔｉｍｉｚａｔｉｏｎ　Ｂａｓｅｄ　Ｒｏｕｔｉｎｇ　｛ａ＝１００－ｂ－ｃ；　Ａｌｇｏｒｉｔｈｍｓ［Ｊ］．Ｉｎｔｅｒｎａｔｉｏｎａｌ　Ｊｏｕｒｎａｌ　ｏｆ　Ａｐｐｌｉｅｄ　Ｒｅｓｅａｒｃｈ　ｏｎ　ｉｆ（５　ａ＋３｝ｂ＋ｃ／３＝＝ｌ００）　Ｉｎｆｏｒｍａｔｉｏｎ　Ｔｅｃｈｎｏｌｏｇｙ　ａｎｄ　Ｃｏｍｐｕｔｉｎｇ，２０１４，５（１）：５５—７０．　ｐｒｉｎｔｆ（”公鸡＝％ｄ，母鸡＝％ｄ，小鸡＝％ｄ＼ｎ”，ａ，ｂ，ｃ）；｝　【２】Ｇｕａｎｇ—Ｙｕ　ｚｈｕ，Ｗｅｉ—ＢＯｚｈａｎｇ．ＯＰｔｉｍａｌ　Ｆｏｒａｇｉｎｇ　也可以先确定公鸡ａ和母鸡ｂ的数量，再确定小鸡Ｃ的数　Ａｌｇｏｒｉｔｈｍ　ｆｏｒ　Ｇｌｏｂａｌ　ＯｐｔｉｍｉｚａｔｉｏｎＵ］．Ａｐｐｌｉｅｄ　Ｓｏｆｔ　量，此时所使用的二重循环语句是：　Ｃｏｍｐｕｔｉｎｇ，２０１７，５１：２９４—３１３．　ｆｏｒ（ａ＝１；ａ＜＝１４，ａ＋＋）　［３】Ｒ．ＶｅｎｋａｔａＲａｏ，Ｇ．Ｇ．Ｗａｇｈｍａｒｅ．Ａ　Ｎｅｗ　Ｏｐｔｉｍｉｚａｉｔｏｎ　ｌＡｇｏｒｉｔｈｍ　ｆｏｒ（ｂ＝１　ｌｂ＜＝２５　Ｉｂ＋＋）　．　ｆｏｒ　Ｓｏｌｖｉｎｇ　Ｃｏｍｐｌｅｘ　Ｃｏｎｓｔｒａｉｎｅｄ　Ｄｅｓｉｇｎ　Ｏｐｔｉｍｉｚａｔｉｏｎ　｛ｃ＝１００一ａ—ｂｌ　ＰｒｏｂｌｅｍｓＪ［］．Ｅｎｇｉｎｅｅｒｉｎｇ　Ｏｐｔｉｍｉｚａｔｉｏｎ，２０１７，４９（１）：６０—８３．　ｉｆ（（５十ａ＋３　ｂ＋ｃ／３＝＝ｌｏｏ）＆＆（ｃ％３＝＝０））　［４】黄隆华，陈志辉．算法设计与分析课程的“百钱买百鸡问题”　ｐｒｉｎｔｆ（”公鸡＝％ｄ，母鸡：％ｄ，小鸡＝％ｄＸｎ”，ａ，ｂ，ｃ）ｌ｝　趣用　计算机教育，２０１６（３）：１４３—１４５．　根据对算法五的三种情况进行对比可以发现，情况一的　【５】耿国华．算法设计与分析【Ｍ】．北京：高等教育出版社，２０１２（１）：　执行次数为１２６，情况二的执行次数为２５＊９＝２２５，情况三的执　２０—２　２＿　．　行次数为１４．２５＝３５０，显然选择取值范围小的两个变量作为循　【６】许桂平．浅析ｃ￣－－￣三种循环结构语句Ｌ－『】．考试周刊，２０１４　环变量来构造二重循环是比较合理的，当然这三种情况的算　（２１）：１１７—１１８．　法执行效率都要优于前面的算法。　【７】任爱华．ｃ语言程序设计【Ｍ］．北京：中央广播电视大学出版　５结论（Ｃｏｎｃｌｕｓｉｏｎ）　社．２０ｉ５：６６—９５．　以上五个算法是应用多重循环语句对“百钱买百鸡”问　ｆ８】马学敏．计算机ｃ语言循环语句的应用研究Ｕ］．中国新通信，　题的算法分析，由差到优循序渐进地对算法进行了改进，通　２０１６（１７）：８７—８８．　过每一次的改进降低了算法的执行时间，从最初的１０　次的循　作者简介：　环执行次数降到了最后的１２６次，最终得到了最为理想的算　龙敏敏（１９７９－－），女，本科，讲师．研究领域：计算机应用技　法。所以，我们在进行算法设计时，不应该只是得出了正确　术，计算机教育教学．　的算法就可以了，而是要尽量去寻找最优的算法，要具有不　

因篇幅问题不能全部显示，请点此查看更多更全内容

查看全文

全部栏目

基于协同过滤的个性化微博推荐算法研究