基于用户兴趣分类的协同过滤推荐算法

2020-01-21 来源：好走旅游网

２０１１年第２０卷第５期　ｈｔｔｐ：ｌｌｗｗｗ．ｃ－Ｓ－ａ．ｏｒｇ．ｃｎ　计算机系统应用　基于用户兴趣分类的协同过滤推荐算　陶俊，张　宁　（上海理工大学管理学院，上海２０００９３）　摘要：在现代信息网络中，个性化的推荐系统已经成为用户和应用软件交互的关键部分。推荐算法是个性化　推荐系统的核心，其中，协同过滤算法是至今应用最为成功的推荐算法之一。但传统的协同过滤算法没有考虑　用户兴趣的多样性，对用户兴趣度量不准确，难以适用于用户多兴趣的推荐系统，提出了适应用户兴趣多样性　的协同过滤算法并利用改进的模糊聚类算法搜索最近邻。最后采用实际的日志数据进行算法实验，实验结果表　明该算法较其他推荐算法具有较优的执行效率和推荐精度。　关键词：个性化：协同过滤算法：兴趣分类；模糊聚类　Ｃｏｌｌａｂｏｒａｔｉｖｅ　Ｆｉｌｔｅｒｉｎｇ　Ａｌｇｏｒｉｔｈｍ　Ｂａｓｅｄ　ｏｎ　Ｉｎｔｅｒｅｓｔ－Ｃｌａｓｓ　ＴＡＯ　Ｊｕｎ，ＺＨＡＮＧＮｉｎｇ　（Ｓｃｈｏｏｌ　ｏｆＭａｎａｇｅｍｅｎｔ，Ｕｎｉｖｅｒｓｉｔｙ　ｏｆ　Ｓｈａｎｇｈａｉ　ｆｏｒ　Ｓｃｉｅｎｃｅ　ａｎｄ　Ｔｅｃｈｎｏｌｏｇｙ，Ｓｈａｎｇｈａｉ　２０００９３，Ｃｈｉｎａ）　Ａｂｓｔｒａｃｔ：Ｉｎ　ｔｈｅ　ｍｏｄｅｍ　ｉｎｆｏｒｍａｔｉｏｎ　ｎｅｔｗｏｒｋ，ｔｈｅ　ｐｅｒｓｏｎａｌｉｚｅｄ　ｒｅｃｏｍｍｅｎｄａｔｉｏｎ　ｓｙｓｔｅｍ　ｈａｓ　ｂｅｃｏｍｅ　ａ　ｋｅｙ　ｐａｒｔ　ｏｆ　ｕｓｅｒｓ　ｎ　ｓｏｆｉｔｗａｒｅ　ａｐｐｌｉｃａｔｉｏｎ．Ｒｅｃｏｍｍｅｎｄａｔｉｏｎ　ａｌｇｏｒｉｔｈｍｓ　ａｒｅ　ｔｈｅ　ｃｏｒｅ　ｏｆ　ｐｅｒｓｏｎａｌｉｚｅｄ　ｒｅｃｏｍｍｅｎｄａｔｉｏｎ　ｓｙｓｔｅｍｓ．Ａｍｏｎｇ　ｔｈｅｍ，ｔｈｅ　ｃｏｌｌａｂｏｒａｔｉｖｅ　ｆｉｌｔｅｒｉｎｇ　ｉｓ　ｏｎｅ　ｏｆ　ｔｈｅ　ｍｏｓｔ　ｓｕｃｃｅｓｓｆｕｌ　ｒｅｃｏｍｍｅｎｄａｔｉｏｎ　ａｌｇｏｒｉｔｈｍ　ｉｎ　ａｐｐｌｉｃａｔｉｏｎ．Ｈｏｗｅｖｅ￣ｔｈｅ　ｔｒａｄｉｔｉｏｎａｌ　ｃｏｌｌａｂｏｒａｔｉｖｅ　ｆｉｌｔｅｒｉｎｇ　ａｌｇｏｒｉｔｈｍ　ｄｏｅｓ　ｎｏｔ　ｃｏｎｓｉｄｅｒ　ｕｓｅｒ’Ｓ　ｍｕｌｔｉｐｌｅ　ｉｎｔｅｒｅｓｔ　ａｎｄ　ｍｅａｓｕｒｅ　ｕｓｅｒ’Ｓ　ｉｎｔｅｒｅｓｔ　ｉｍｐｒｅｃｉｓｅｌｙ，ａｎｄ　Ｃａｎ’ｔ　ｂｅ　ａｐｐｌｉｅｄ　ｔｏ　ｒｅｃｏｍｍｅｎｄａｔｉｏｎ　ｓｙｓｔｅｍ　ｗｉｔｈ　ｋｉｎｄｓ　ｏｆ　ｉｎｔｅｒｅｓｔｓ．Ｉｎ　ｔｈｉｓ　ｐａｐｅｒ，ａ　ｎｅｗ　ｍｅｔｈｏｄ　ｏｆ　ｃｏｌｌａｂｏｒａｔｉｖｅ　ｆｉｌｔｅｒｉｎｇ　ａｌｇｏｒｉｔｈｍ　ｂａｓｅｄ　ｏｎ　ｕｓｅｒｓ’ｉｎｔｅｒｅｓｔ　ｃａｔｅｇｏｒｙ　ｉｓ　ｐｒｏｐｏｓｅｄ　ｕｓｉｎｇ　ｉｍｐｒｏｖｅｄ　ｆｕｚｚｙ　ｃｌｕｓｔｅｒｉｎｇ　ａｌｇｏｒｉｔｈｍ　ｔｏ　ｓｅａｒｃｈ　ｔｈｅ　ｎｅａｒｅｓｔ　ｎｅｉｇｈｂｏｒｓ．Ｆｉｎａｌｌｙ，ｔｈｅ　ａｌｇｏｒｉｔｈｍ　ｅｘｐｅｒｉｍｅｎｔ　ｉｓ　ｇｉｖｅｎ　ｗｉｔｈ　ａｃｔｕａｌ　ｌｏｇ－ｄａｔａ．Ｒｅｓｕｌｔｓ　ｓｈｏｗ　ｔｈａｔ　ｔｈｅ　ｐｒｏｐｏｓｅｄ　ａｌｇｏｒｉｔｈｍ　ｏｕｔｒ｝ｅｒｆｏｒｍｓ　ｔｈｅ　ｏｔｈｅｒ　ｒｅｃｏｍｍｅｎｄａｔｉｏｎ　ｏｎｅｓ　ｉｎ　ｅｆｉｃｉｅｎｃｙ　ｆａｎｄ　ｒｅｃｏｍｍｅｎｄｉｎｇ　ａｃｃｕｒａｃｙ．　Ｋｅｙｗｏｒｄｓ：ｐｅｒｓｏｎａｌｉｚａｔｉｏｎ；ｃｏｌｌａｂｏｒａｔｉｖｅ　ｆｉｌｔｅｒｉｎｇ　ａｌｇｏｒｉｔｈｍ；ｉｎｔｅｒｅｓｔ　ｃｌａｓｓｉｉｃａｔｉｆｏｎ；ｆｕｚｚｙ　ｃｌｕｓｔｅｒｉｎｇ　随着互联网和电子通讯的飞速发展，网络中的信　息量急剧上升，如何帮助用户在海量的数据中找到对　其有价值的信息，指导其决策行为已成为研究者们关　注的热点。现今网络系统的一个新的服务方向就是如　何快速有效的推荐给用户可能感兴趣的资源。个性化　荐算法之一。　协同过滤这一概念首次由Ｇｏｌｄｂｅｒｇ、Ｎｉｃｏｌｓ、Ｏｋｉ　及ＴｅｒｒｙＩＩ】在１９９２年提出，应用于Ｔａｐｅｓｔｒｙ系统，该系　统适合用户群量少且要求用户给予较多的显示评价信　息。Ｔａｐｅｓｔｙ系统奠定了协同过滤推荐研究的雏形。ｒ　目前协同过滤推荐算法主要分为两类：１）基于用户的　协同过滤算法用户对项目（资源）的评分比较相似，　则他们对其他项目的评分也比较相似，从而找到具有　的推荐系统就在这种背景下产生出来的。对于推荐系　统而言，推荐算法是其核心所在。目前的推荐算法有　基于内容的过滤推荐、协同过滤推荐算法、基于人口　统计学的推荐算法、基于知识的推荐算法以及混合推　相似兴趣的最近邻，形成推荐。２）基于项目的协同过　滤算法根据用户对不同项目评分的相似性来估计该用　荐算法，其中协同过滤算法是目前应用最为成功的推　①基金项目：国家自然科学基金（７０９７ｌＯ８９）；上海市重点学科项目经费资助（￥３０５０１）　收稿时问：２０１０—０８．２４；收到修改稿时间：２０１０．０９—２６　Ｒｅｓｅａｒｃｈ　ａｎｄ　Ｄｅｖｅｌｏｐｍｅｎｔ研究开发５５．　计算机系统应用　ｈｔｔｐ：ｌｌｗｗｗ．ｃ－ｓ—ａ．Ｏｒｇ．ｃｎ　２０１１年第２０卷第５期　户对某个项目的评分，以此进行推荐。　协同过滤算法主要不足有三个方面　＇３Ｊ：一是稀疏　性问题，即当推荐系统中数据量很大而用户的显示评　示，在用户ｉ和用户Ｊ之间的相似性计算公式如式（１）　所示：　分数据又很少时，难以计算相似性，而无法推荐；二　是冷启动问题，当新项目（资源）刚进入系统时，没有用　户对其评价，造成协同过滤无法推荐该资源。三是可　扩展性问题，推荐系统中的用户和资源会随时间快速　的增长，而协同过滤算法的复杂度和数据量呈线性关　嘶，　ｃｏｓ（ｆ，　赫②相关相似性（Ｃｏｒｒｅｌａｔｉｏｎ）　　（１）　设Ｉ　表示被用户ｉ和用户ｊ共同评分过的项目集，　系增长，严重影响了执行效率，从而导致可扩展性较　差。通过分析网络日志数据，本文提出对用户兴趣分　类并用数据挖掘的方法获取用户潜在的兴趣，采用改　进的模糊聚类算法对用户兴趣聚类，从聚类中搜寻最　近邻而形成推荐并对算法进行仿真实验。　１　基于用户的协同过滤推荐算法　基于用户的协同过滤算法是目前应用最为广泛　的，算法的基本思想是使用统计方法挑选出与目标用　户喜好最相似的若干用户并将其感兴趣的项目推荐给　目标用户。假如目标用户对项目的评价与他的“最近　邻居”相似，而目标用户对某个项目的评价可以从其　“最近邻居”的评价中综合得到。该算法可分为三个　阶段【４Ｊ：　１）构建用户信息。用户的评价和偏好明确地表示　为一个ｍ木／，／的项目评价矩阵　，这里　是用户数，　刀是项目数，Ｒ＝【　ｆ，】，元素，．　，表示用户ｆ对项目　的　评分。在电子商务推荐系统中，元素　既可表示用户　是否购买商品，也可表示用户对商品的偏好程度。　２）产生“邻居”。计算系统中目标用户与其他所　有用户的相似度，找出Ｋ个最相似用户集一“最近邻　居”。Ｋ－“最近邻居”根据相似度大小从大到小排列的　“邻居”集合。　计算用户两个用户之间相似性首先要获取这两用　户评分过的所有项目，然后利用某种相似性度量方法　进行计算。度量用户相似性有多种方法，常见的有余　弦相似性、相关相似性和修正余弦相似性【５】。　①余弦相似性（Ｃｏｓｉｎｅ）　用户评分数据可以看作ｎ是维项目空间上的向　量，用户之间的相似性通过向量问的余弦夹角度量，　若用户对某项没有评分，则将该项评分设为０。设用　ｒ　Ｕ　户ｉ和用户ｉ在ｎ维项目空间上的评分分别用ｉ，７表　５６研究开发Ｒｅｓｅａｒｃｈ　ａｎｄ　Ｄｅｖｅｌｏｐｍｅｎｔ　则用户ｉ和用户ｊ之间的相似性ｓｉｍ（ｉ，　）通过Ｐｅａｒｓｏｎ　相关系数度量：　ｓｉｎ（ｉ，ｊ）＝　∈Ｉｉｊ（ｒｉｃ一　一ｒｊ）　式中，ｒｉｃ表示用户ｉ对项目ｃ的评分，ｒｉ，　，分别　表示用户ｉ和用户ｊ对项目的平均评分。　③修正余弦相似性（Ａｄｊｕｓｔｅｄ　Ｃｏｓｉｎｅ）　余弦相似性的度量方法中并没有考虑不同用户的　评分尺度问题，修正的余弦相似性度量方法通过减去　用户对项目的平均评分来改善上述缺陷，设，　表示被　用户ｉ和用户ｊ共同评分过的项目集，设，ｆ，　，分别　表示被用户ｉ和用户ｊ评分过的项目集，则用户ｉ和用　户ｉ的相似度计算公式如式（３）所示：　￣ｃ￣ｌｉｊ　（ｒｉｃ－　Ｆｉ）（ｒｊ￣－Ｆｊ）　∈Ｉ　ｉｃ一予　∈１　ｊｃ０　式中，ｒｉｃ表示用户ｉ对项目ｃ的评分，Ｆｉ和　，分别　表示用户ｉ和用户Ｊ对项目的平均评分。最近邻居搜寻　就是对每个用户ｉ，在整个的用户空间中查询用户集　ｍ＝｛ｎｌ，ｎ２，人，　），使ｆ　ｍ且，？１与ｉ相似度最高，　刀　与ｉ相似度次之，依次递减排列。　，　３）推荐。“最近邻居”集产生后，可计算目标用　户对项目的预测评价值进行Ｔｏｐ．Ｎ推荐。通过预测项　目评分值搜索最近邻居而产生推荐，预测评分计算方　－，　，Ｙ一－Ｒｊ）　．，　，，　『，　＝　ｆ＋』　＿ｒ　）　２０１１年第２Ｏ卷第５期　ｈｔｔｐ：，／Ⅵ　ｎ　ｃ－Ｓ－ａ．ｏｒｇ．ｃａ　计算机系统应用　其中，Ｐｉ，Ｙ表示目标用户ｉ对项目Ｙ的预测评价值；　ｈｏｓＬｉｄｆｒｏｍ　ａｕ１　ｕｎｉｏｎ　ｓｅｌｅｃｔ　ｄｉｓｔｉｎｃｔ　ｈｏｓｔｉｄ　ｆｒｏｍ　ａｕ２　——为用户ｉ的平均评分值：Ｐｊ，Ｙ表示为目标用户ｉ的最近　邻居集的用户ｉ对项目Ｙ的评价。在此，目标用户ｉ　的最近邻居集用ＮＮ表示。按照兴趣度预测值Ｐｉ，Ｙ的　高低产生推荐集。　传统基于用户的协同过滤算法要求有较多的用户　评分数据且算法效率也较低。　２　Ｗｅｂ日志分析处理　协同过滤算法需要整理用户评分数据、计算相似　性、寻找最近邻从而完成推荐。而大多的网络用户很　少对资源进行显示的评分，这需要Ｗｅｂ挖掘算法来获　取隐性的评价数据。本文以学校网络中心网络日志作　为数据源。在此主要分析和利用用户行为记录表，其　包括用户名、目标ＩＰ、应用类型、访问时间、ＵＲＬ及　网站等信息。用户行为记录表格式描述如下表ｌ所示。　表ｌ用户行为记录表简要格式　用户目标　应用类型　访问时间　ＵＲＬ　网站　ｕｌ　ＩＰＩ　访问网站２００９．１１．１１　１８：１２：２７　ＵＲＬＩ　ＮＥＴ１　ｕ２Ⅱ，２　ｈｔｔｐ下载２００９．１１．１１　１８：４１：２２　ＵＲＩ２　ＮＥＴ２　ｕｌ　Ｐ３　娱乐　２００９．１１．１１　１９：３５：４３　Ｉ瓜Ｉ３　ＮＥＴ３　ｕ２Ⅱ．４　聊天交友２００９．１１．Ｉｌ　１９：５６：０８　ＵＲＩ４　ＮＥＴ４　ｕｌ　５　访问网站２００９．１１．１ｌ　２０：０２：１４　ＵＲＩ．５　ＮＥＴ　从表１中可以看出，用户ｕｌ在三十分钟内共访问　了ＮＥＴ１、ＮＥＴ２以及ＮＥＴ５的３个网站，且这三个站　点分别属于两种不用的应用类型，表明了用户ｕ１的兴　趣不是唯一的。用户的兴趣可以用其选择的项目（访　问的网站）来反映且项目的类型不同也体现了用户兴　趣的不同。在实际数据中，用户名是以ＩＰ地址表示的，　为了计算方便将用户名解析编号后计算各个用户的度　（用户访问的不同站点的数目）。用户编号的ｓｑ１脚本如　下：　ｃｒｅａｔｅ　ｐｒｏｃｅｄｕｒｅ　ｍａｋｅｕｓｅｒｃｏｄｅ０　ＢＥＧＩＮ　ｄｅｃｌａｒｅ　ｎｕｍｌ　ｉｎｔ　ｄｅｆａｕｌｔ　ｌ；　ｄｅｃｌａｒｅ　ｆｌａｇ　ｉｎｔ　ｄｅｆａｕｌｔ　０：　ｄｅｃｌａｒｅ　ｕｓｅｒｉｄ　ｉｎｔ（１　０）；　ｄｅｃｌａｒｅ　ｕｓｅｒｃｏｄｅ　ｃｕｒｓｏｒ　ｆｏｒ　ｓｅｌｅｃｔ　ｄｉｓｔｉｎｃｔ　ｕｎｉｏｎ　ｓｅｌｅｃｔ　ｄｉｓｔｉｎｃｔ　ｈｏｓｔｉｄ　ｆｒｏｍ　ａｕｎ；　—　ｄｅｃｌａｒｅ　ｃｏｎｔｉｎｕｅ　ｈａｎｄｌｅｒ　ｆｏｒ　ｎｏｔ　ｆｏｕｎｄ　ｓｅｔ　ｌｆａｇ＝ｌ；　ｏｐｅｎ　ｕｓｅｒｃｏｄｅ；　ｒｅｐｅａｔ　ｆｅｔｃｈ　ｕｓｅｒｃｏｄｅ　ｉｎｔｏ　ｕｓｅｒｉｄ；　ｉｎｓｅｔ　ｉｎｔｏ　ｃｏｄｅ（ｎａｍ，ｕｓｅｒｉｄ）ｖａｌｕｅｓ（ｎｕｍ　１，　ｕｓｅｒｉｄ）；　ｓｅｔ　ｎｕｍｌ－－ｎｕｍｌ＋ｌ；　ｕｎｔｉｌ　ｆｌａｇ＝ｌ　ｅｎｄ　ｒｅｐｅａｔ；　ＥＮＤ　其中，ａｕｌ至ａＵｌｌ为用户行为记录表；计算用户度　的脚本在此略。　３算法改进　依据上述分析的基础上，对传统协同过滤算法进　行如下改进：首先按照用户访问站点的类型对其兴趣　分类；其次对同一个用户预测最近邻时要区分预测项　目的类别（页面的应用类型）以保证预测的准确性；再次　利用改进的模糊聚类算法对相似用户进行聚类，生成　最近邻，以提高算法的精度和效率；最后按照用户兴　趣在每类项目中所占的权重分配相应的该类项目的推　荐数目［６－８］。　算法的设计步骤如下：　１）用户兴趣分类　用户的兴趣可以通过其浏览　的网站反映，按照网站的应用类型分类，每种应用类　型至少包括一个网站（项目）。由于日志数据中已经按　照应用类型进行分类了，则对用户兴趣分类实现较为　简单。以表ｌ为例简要说明：用户ｕｌ访问的网站有　ＮＥＴＩ、ＮＥＴ３及ＮＥＴ５，它们的应用类型分别为访问　网站和娱乐，则用户ｕｌ的兴趣分成两类，表示为　Ｃ／１　２。　２）构建用户兴趣矩阵根据用户访问网站的记　录映射用户兴趣，计算用户兴趣度，建立用户兴趣矩　阵。考虑到推荐的时效性，用户最近的浏览记录对推　Ｒｅｓｅａｒｃｈ　ａｎｄ　Ｄｅ、ｒｅｌｏｐｍｅｎｔ研究开发５７　计算机系统应用　ｈｔｔｐ：／／ｗｗｗ．ｃ—Ｓ－ａ．ｏｒｇ．ｃｎ　２ＯＩ１年第２０卷第５期　荐越有利，从２个月的日志中问断的截取４个时间段，　每段的时间周期为３天。由于本文挖掘和分析的是用　户隐式评分信息，评分信息将由用户浏览页面的行为　间接反映。为了直观描述用户对项目的兴趣度，将用　式（７）中，Ｃ　为用户ｉ访问网站类型的数目；　Ⅳｆ　表示该用户ｉ访问网站Ｊ的次数；Ｎｆ为用户ｉ　访问各类项目的总次数。考虑每个应用类型的预测评　价值和每个网站（项目）在各自应用类型中的所占的　权重加权后，推荐每种应用类型的项目的数目。　户对项目的兴趣值划分成０到５共６个标准，划分方　法是为每个标准设置一个阈值，当用户ｉ对项目Ｊ的访　问次数超过某个阈值时，评定相应的值。假设提出以　ｒｉｊ表示用户ｉ对项目ｉ的评价值。在一段时间内，考　．改进的算法的复杂度较传统协同过滤算法低很　多，实际推荐系统会随着时间变化，数据量急剧增大，　效率降低。采用用户聚类，将相似兴趣的用户进行聚　虑有些用户兴趣较分散，有些较集中，会对推荐造成　一定的影响，在量化评分时按照用户兴趣的种类数　，ｙ　做适当的修正。用户评价值ｒｉｄ＝＿－＝ｖ＿・Ｓｉ　ｉ，其中　ＣＩｉ　ｆ，为用户ｉ对项目Ｊ的兴趣值；Ｏｔ为调节参数，可　根据需要调整，一般取Ｉ。计算对于用户ｉ浏览过类型　ＣＩｉ（　＝１，２，人　）中的网站（项目）总数，据以上的　方法统计用户ｉ对每个应用类型的评分值。最后，计　算出用户对所有应用类型的兴趣值，形成用户的兴趣　矩阵。　３）寻找最近邻并推荐对用户兴趣矩阵按不同　的兴趣分类分别利用改进的模糊聚类算法进行聚类，　从聚类结果中寻找最近邻。该步的关键就是计算用户　之间的相似性，对于相似性计算方法有很多，综合考　虑采用基于修正余弦相似性的计算方法。在应用类型　Ｃ（ｃ＝１，２，人，七）中，计算目标用户ｉ与类型ｃ中用户　Ｊ之间的相似度ｓｉｍ（ｉ，ｊ『）　。　ｓｉｒｒ（ｉ，ｊ）ｃ＝　对于用户ｉ而言，把计算出的所有相似值按照从　大到小选出若干个作为其最近邻居集。　以下将计算用户目标项目的评价值：设目标用户　ｉ，计算各个应用类型Ｃ（ｃ＝１，２，Ａ，后）中用户未进行　隐式评分ｊ项目的评分预测值ｐ（ｉ，　）　。　∑　：１ｓｉｍ（ｉ，　）ｃ’（ｒｊ，ｃ—　）　，．ｆ’　）．、　ｃ　Ｆ，＋兰＝＝　三　推荐时考虑不同项目所占推荐权重，按照推荐权　重分配该项目的推荐数目。可定义推荐权重为ｗｉ：　，　ｗ，　　，　而　（７）５８研究开发Ｒｅｓｅａｒｃｈ　ａｎｄ　Ｄｅｖｅｌｏｐｍｅｎｔ　类分组，搜索最近邻用户时，只要从相应的用户分组　中搜索推荐，并且聚类还可以离线进行，降低了算法　的执行时间。该推荐算法较适合网页的推荐，不需要　获取较多的用户信息，且对于大量用户参与的情况也　能适应，只需分析网络日志获取用户浏览行为数据进　行隐式评分即可。　４算法实验　为了验证算法的有效性，本文采用学校网络中心　Ｗｅｂ日志数据作为实验数据集。为了实验方便，搜集　并处理了近两个月的用户行为记录数据，得到用户数　目２３２个，网站数目１２４１及应用类型８个近ｌＯｏｏ００　条记录。将数据集的９０％作为训练集构建兴趣矩阵，　其余的作为测试集。　本文采用信息检索领域中评估系统效果的准确率　（Ｐｒｅｃｉｓｉｏｎ）标准来衡量传统算法和本文算法的精度【９】。　Ｐｒｅｃｉｓｉｏｎ＝．Ｎｕｍｂｅｒｏ．．．．．．．．．．．．．．．．．．．．．．．．．．．．．．．．．．ｆＨｉｔｓ＿．．．．．．．．．．．．．．．．．．．．——　（８）　Ｎ　÷　．盔　ｉ　一　２Ｏ１１年第２０卷第５期　ｈｔｔｐ：／／ｗｗｗ．ｃ－Ｓ－ａ．ｏｒｇ．ｃｎ　计算机系统应用　Ｏ．２５　参考文献　—◆一本文算法　０．２　ｌ　Ｇｏｌｄｂｅｒｇ　Ｄ，Ｎｉｃｈｏｌｓ　Ｄ，Ｏｋｉ　ＢＭ，Ｔｅｒｒｙ　Ｄ．Ｕｓｉｎｇ　’　０．１５　ｃｏｌｌａｂｏｒａｔｉｖｅ　ｆｉｌｔｅｒｉｎｇ　ｔｏ　ｗｅａｖｅ　ａｌｌ　ｉｎｆｏｒｍａｔｉｏｎ　ｔａｐｅｓｔｒｙ．　—ｇ　０．１　■一Ｕｓｅｒ－ｂａｓｅｄ　ａｔｉｏｎｓ　ｏｆＡＣＭ，１９９２，３５（１２）：６１—７０．　０　０ＣＦ　Ｃｏｍｍｕｎｉｃ．０５　２　Ｓａｎｇ　Ｙ　Ｌｉｕ　ＰＧ　Ｌｉ　Ｙ　Ａ　ｃｏｌｌａｂｏｒａｔｉｖｅ　ｆｉｌｔｅｒｉｎｇ　ａｌｇｏｒｉｔｈｍ　０　适应用户兴趣　ｉｆｔｔｉｎｇ　ｕｓｅｒ　ｉｎｔｅｒｅｓｔ　ｅｖｏｌｕｔｉｏｎ．Ｊｏｕｒｎａｌ　ｏｆ　ｔｈｅ　Ｃｈｉｎａ　Ｓｏｃｉｅｔｙ　１０　１５　２０　２５　３０　变化的协同过　ｎｕｍｂｅｒ　ｏｆ　ｒｅｃｏｍｍｅｎｄａｔ　ｉ　ｏｎ　滤算法　ｆｏｒ　Ｓｃｉｅｎｔｉｉｆｃ　ｎａｄ　Ｔｅｃｈｎｉｃａｌ　Ｉｎｆｏｒｍａｔｉｏｎ，２８（１）：１０９一ｌ　ｌ３．　３　Ｘｉｎｇ　ＣＸ，Ｇａｏ　ＦＲ，Ｚｈａｎ　ＳＩ，Ｚｈｏｕ　ＬＺ．Ａ　ｃｏｉｌａｂｏｒａｔｉｖｅ　图２算法实验结果　ｉｆｌｔｅｒｉｎｇ　ｒｅｃｏｍｍｅｎｄａｔｉｏｎ　ａｌｇｏｒｉｔｈｍ　ｉｎｃｏｒｐｏｒａｔｅｄ　ｗｉｔｈ　ｕｓｅｒ　ｎｉｔｅｒｅｓｔ　ｃｈａｎｇｅ．Ｊｏｕｒｎａｌ　ｏｆ　Ｃｏｍｐｕｔｅｒ　Ｒｅｓｅａｒｃｈ　ａｎｄ　从图２可以看出，本文改进的协同过滤算法较传　Ｄｅｖｅｌｏｐｍｅｎｔ，２００７，４４（２）：２９６—３０　１．　统协同过滤和适应用户兴趣的系统过滤算法有明显的　４王茜，王均波．一种改进的协同过滤推荐算法．计算机科　推荐精度。实验还发现改进的算法的执行时间有较大　学，２０１０，３７（６）：２２６—２２７．　的提高。改进的推荐方法不仅考虑了用户最近兴趣对　５　Ｓａｒｗａｒ　Ｂ，Ｋａｒｙｐｉｓ　Ｇ　Ｋｏｎｓｔａｎ　Ｊ，Ｒｉｅｄｌ　Ｊ．Ｉｔｅｍ－Ｂａｓｅｄ　Ｃｏｌｌａｂｏｒａｔｉｖｅ　Ｆｉｌｔｅｒｉｎｇ　Ｒｅｃｏｍｍｅｎｄａｔｉｏｎ　Ａｌｇｏｒｉｔｈｍｓ．Ｐｒｏｃ．　推荐的影响，着重是实际系统中用户兴趣的多样性的　ｏｆ　ｔｈｅ　ｌＯｔｈ　Ｉｎｅｍａｔｉｏｎａｌ　Ｗｌ０ｒｌｄ　Ｗｉｄｅ　Ｗｌｅｂ　Ｃｏｎｆｅｒｅｎｃｅ．２００１：　特征，从而有力的提高了推荐精度。　２８５－２９５．　６　Ｋｏｎｓｔｎａ　Ｊ，Ｍｉｌｌｅｒ　Ｂ，Ｍａｌｔｚ　Ｄ，ｅｔ　ａ１．ＧｒｏｕｐＬｅｎｓ：Ａｐｐｌｙｉｎｇ　５结语　ｃｏｌｌａｂｏｒａｔｉｖｅ　ｆｉｌｔｅｒｉｎｇ　ｔｏ　ｕｓｅｎｅｔ　ｎｅｗｓ．Ｃｏｍｍｕｎｉｃａｔｉｏｎｓ　ｏｆｔｈｅ　本文主要分析了传统协同过滤推荐算法的不足和　ＡＣＭ，１　９９７，４０（３０）：７７—８７．　实际用户兴趣的多样性的特点，提出改进传统协同过　７　Ｒｅｓｎ　Ｉｃｋ　Ｐ－Ｖａｒ　Ｉａｎ　ＨＲ．Ｒｅｃｏｍｍｅｎｄｅｒ　ｓｙｓｔｅｍｓ．　滤算法的具体措施。文章采用真实日志数据进行仿真　Ｃｏｍｍｕｎｉｃａｔｉｏｎｓ　ｏｆＡＣＭ，１９９７，４０（３０）：５６２８．　８ＺｅｎｇＣ，ＸｉｎｇＣＸ，ＺｈｏｕＬＺ．Ｓｉｍｉｌａｒｉｔｙｍｅａｎｓｕｒｅ　ａｎｄｉｎｓｔａｎｃｅ　实验，实验结果表明改进的算法在推荐效率和推荐精　ｓｅｌｅｃｔｉｏｎ　ｆｏｒ　ｃｏｌｌａｂｏｒａｔｉｖｅ　ｆｉｌｔｅｒｉｎｇ　ｉｎｔｅｍａｔｉｏｎａ１．Ｊｏｕｍａｌ　ｏｆ　度上都有明显的优势。随着个性化推荐的发展，对推　Ｅｌｅｃｔｒｏｎｉｃ　Ｃｏｍｍｅｒｃｅ，２００４，４（８）：ｌ１５－１２９．　荐算法在实时性和复杂度的要求将是以后推荐算法研　９杨芳，潘一飞，李杰，等．一种改进的协同过滤推荐算法．河北　究的重点。　工业大学学报，２０１０，３９（３）：８２—８７．　（上接第２９页）　参考文献　８扬小牛，楼才义．软件无线电原理与应用．北京：电子工业出　ｌ田日才．扩频通信．北京：清华大学出版社，２００７．　版社，２００１．　２　Ｒｏｇｅｒ　Ｌ，Ｐｅｔｅｒｓｏｎ　ＲＥ，Ｚｉｅｍｅｒ　ＤＥ，ｅｔ　ａ１．Ｉｎｔｒｏｄｕｃｔｉｏｎ　ｔｏ　９周润景，图亚，张丽敏．基于Ｑｕａｒｔｕｓ的ＦＰＧＡ／ＣＰＬＤ数字系　Ｓｐｒｅａｄ　Ｓｐｅｃｔｒｕｍ　Ｃｏｍｍｕｎｉｃａｔｉｏｎｓ．北京：电子工业出版　统设计实例．北京：电子工业出版社，２００７．４０—９６．　社．２００６．２—２８．　１０徐光辉，程东旭，黄如．基于ＦＰＧＡ的嵌入式开发与应用．北　３曹志刚，钱亚生．现代通信原理．北京：清华大学出版社，１９９２．　京：电子工业出版社，２００６．９１６—８４．　４朱近康．ＣＤＭＡ通信技术．北京：人民邮电出版社，２００１．　５　Ｚｉｅｍｅｒ　ＲＥ，Ｐｅｔｅｒｓｏｎ　ＲＬ．Ｉｎｔｒｏｄｕｃｔｉｏｎ　ｔｏ　Ｄｉｇｉｔａｌ　Ｃｏｍｍｕｎｉ・　１１潘松，黄继业．ＥＤＡ技术与ＶＨＤＬ．北京：清华大学出版　ｃａｔｉｏｎ．Ｐｒｅｎｔｉｃｅ　Ｉｔａｌｌ，Ｉｎｃ．２００１．　社，２００５．　６　Ｓｈａｎｎｏｎ　ＣＥ．Ａ　ｍａｔｈｅｍａｔｉｃａｌ　ｔｈｅｏｒｙ　ｏｆ　ｃｏｍｍｕｎｉｃａｔｉｏｎ．Ｂｅｌｌ　１２李光军，孟宪元．可编程ＡＳＩＣ设计及应用．北京：电子科技　Ｓｙｓｔｅｍ　Ｔｅｃｈｎｉｃａｌ　Ｊｏｕｒｎａｌ，１９４８，（２７）：３７９—４２３，６２３—６５６．　大学出版社，２０００．　７　Ｓｅａｙ　ＴＳ．Ｈｏｐｐｉｎｇ　Ｐａ￣ｅｍｓ　ｆｏｒ　Ｂｏｕｎｄｅｄ　Ｍｕｔｕａｌ　Ｉｎｔｅｒｆｅｒｅｎｃｅ　１３　Ａｓｈｅｎｄｅｎ　ＰＪ．ＶＨＤＬ设计指南．北京：Ｖｔ械工业出版社，２００５．　ｎＩｆｅｑｕｅｎｃｙ　Ｈｏｐｐｉｎｇ　Ｍｕｌｔｉｐｌｅ　Ａｃｃｅｓｓ．Ｐｒｏｃ．ｏｆ　ｈｔｅ　１　９８２　１４黄智伟，陈琼．ＦＰＧＡ系统设计与实践．北京：电子工业出版　ＩＥＥＥ　ＭＩＬＣ０Ｍ　Ｃｏｎｆｅｒｅｎｃｅ，Ｂｏｓｔｏｎ，Ｍａｓｓａｃｈｕｓｅｔｔｓ．　社，２００５．２９４—３２９，８５－１２２．　Ｒｅｓｅａｒｃｈ　ａｎｄ　Ｄｅｖｅｌｏｐｍｅｎｔ研究开发５９　

因篇幅问题不能全部显示，请点此查看更多更全内容

查看全文

全部栏目

基于用户兴趣分类的协同过滤推荐算法