《云计算环境下的个性化数字电视节目推荐系统(共13页).docx》由会员分享,可在线阅读,更多相关《云计算环境下的个性化数字电视节目推荐系统(共13页).docx(13页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、精选优质文档-倾情为你奉上云计算环境下的个性化数字电视节目推荐系统摘要:互联网协议电视(IPTV)、有线电视(CATV)、互联网、用户创建内容(UCC)和数字电视(DTV)等的广泛部署确保了可供用户选择的频道和节目的快速增长。当我们考虑到传统电视节目的技术和政策时,这是没有预料到的。由于这些范式的变化,数百个频道和节目现在对消费者来说已经是可能的了。但是当通过远程遥控或者频道导航图来搜寻自己感兴趣的频道和节目时就变得很困难并且浪费时间。为了改善频道搜索过程以及满足消费者的需求,我们提出在云计算环境下的个性化数字电视节目推荐系统。这种PDPR系统分析和使用了用户的观点模式,使节目推荐达到个性化的
2、要求并且高效的使用了计算资源。关键词:个性化频道推荐、云计算、数字电视、互联网协议电视一、引言目前,互联网协议电视(IPTV)、有线电视(CATV)、互联网、用户创建内容(UCC)和数字电视(DTV)等都得到了广泛部署,电视资源(包括频道和节目的数量)也已经在快速的增长。这在广播领域内是一种范式的变化。此前,有限的内容提供商存在,如持有许可证的电视无线电广播公司和数目不多的有线电视及卫星广播运营商。所以频道和节目的数量是有限的,消费者可以很轻易地通过频道搜索来找到他们喜爱的节目。然而,随着频道和节目数量的不断增加,这种方式的搜索已经不能像以前那样简单让人感到舒适了,现在的频道有上百个,并且随着
3、用户不断创建内容以及广播公司私有网络的建立,这一数量还在不断增加。基于这种趋势,新一代的频道推荐系统在这种多频道和多资源的领域是很有必要的。在标准化领域,TVanytime曾经尝试着使用消费者的个人资料和偏好信息来创建一个频道推荐系统,根据消费者的个性化信息,一个“个性化电子节目导航”系统被创建并提供给消费者。在学术界,关于频道推荐的传统研究被分类如下:内容为基础的频道推荐方法;协作频道推荐方法;联合过滤方法,这种方法用协作频道过滤技术来提供一个基于内容的过滤器;为了下一代EPG系统的基于客户-服务器的频道推荐方法。最近,由于其对计算资源的高效利用以及绿色信息技术(IT)基于IP广播的趋势的可
4、能性,云计算引起了广播公司的极大兴趣。这些广播公司通过计算机存储使他们的内容和商店数字化,然后尝试通过基于IP的传输如IPTV和互联网,来分发他们的内容。随着这种趋势,一些公司开始尝试为内容管理和分配系统(CMDS)应用云计算技术,以减少安装和运营成本。在韩国,“基于云计算的有线数字电视发展项目”开始于2009年的三月份,将结束于2011年的某一时间,它是由韩国通信委员会资助的。这个项目的目标是构建“存储云”,它可以利用云计算技术高效地存储和管理服务运营商的电子化内容。同时,服务于共同基础设施的共享技术被认为是为了避免重复投资,也是为了提供基于下一代计算和通信技术的智能化、个性化广播服务。在这
5、些背景下,基于对消费者观点模式的分析,我们提出云计算环境下的个性化数字电视节目推荐系统。这种个性化方法收集和分析了这样的观点模式,比如:目标用户对内容的观点模式,全部用户观点模式的统计信息,用户的私人资料或偏好信息,一种通信服务,偏好的设备类型如移动电话、个人电脑等等。本文安排如下:第二章调查传统方法及其相关问题,第三章提供建议系统的详情,第四章评估和分析建议系统的表现情况,第五章总结和展望未来的工作。二、背景及相关研究这一部分将解释基于云计算环境的下一代有线数字广播服务技术,同时,我们也将讨论以前各种各样的频道推荐方法。A、应用于下一代数字电视的云计算云计算是这样的一个系统,它实现了用一台超
6、级计算机服务器来存储数据和程序。系统通过互联网用户的需要进行访问。它可以被定义为一种标准化的与位置无关的在线工具。整体环境包括虚拟化的大型计算机和远程访问设备,比如个人电脑或移动设备。云计算的主要特点如下:点播:所有资源都是可分配的,并且参考用户需求。高度抽象:用户仅仅需要关注他自己的个人兴趣。高效:收集所有的资源,并且由分配计算IT资源的软件管理。如果云计算得以广泛应用,那么所有的数据资源都可以存储在一个超级计算机数据库中心,并且确保了个人电脑上的共享应用得以存储。这样访问超级计算机便是可能的,而不是简单的个人电脑功能。由此我们提出了这样一种基于消费者观点模式分析的频道和节目推荐系统。B、云
7、计算环境下的下一代数字电视广播服务技术“在广播领域应用云计算技术和实践”以及“通信的融合和IPTV技术为未来的融合服务”这两种理念在2009年云计算论坛上被介绍开来。随着部署宽带融合网络技术和广播通信融合技术的发展,内容服务环境已经发生了剧烈变化。他同时也混合了基本的电信和媒体业务,比如IPTV、UCC、CATV、互联网。根据下文的观点,电视范式已经变为融合的基于IP的网络以及移动宽带网络,比如移动WIMAX、LTE。从服务的角度来看,用户不仅观看已经制作好的电影,他们也制作自己的内容。固定与移动融合的电视的不断发展使无处不在的访问不受时间、地点或者服务的影响。邦介绍了实施绿色IT的方法,找出
8、商业模式,创造就业机会,并广泛用于开发未来以有线云基础设施为基础的数字广播技术。Choi介绍了IPTV EPG技术以及基于Web的用户界面,下一代IPTV EPG技术可以分为互动型EPG,协作型EPG,定制型EPG三种。互动型EPG组件以门户网站或者博客为基础,协作型EPG组件技术是IPTV语义维基技术、多媒体标签技术以及Web服务技术,定制型EPG技术是EPG与页面技术的混搭、基于语义的内容匹配技术、需求建模技术。它还建议用户偏好学习系统,个性化内容的建议,自动调度,自适应的EPG和基于Web的用户界面。C、个性化频道推荐系统基于用户在频道数量方面的偏好,个性化系统可以快速和容易地动态找到相
9、应频道,并且可以方便地访问。对于这种个性化,推荐系统是必要的。图1描述的例子是设在韩国汉城的CM电缆公司的EPG项目服务列表,大约有150种各类频道。因为很难从这么多频道中选择一个用户偏好的,一个建议系统可能会被强烈地需要。正因为如此,我们建议个性化的数字电视节目的推荐系统。一个一般的个性化推荐系统是 得分取决于用户的偏好信息和相似,并建议高得分的方案。一般来说,推荐系统分为以下几种类型:基于内容的推荐系统推荐最有可能的匹配项,然后将推荐列表和用户先前输入的数据或是首选项目比较。基于内容的推荐系统是基于信息检索,并且普遍采用评级的方法。该评级方法计算推荐列表中用户的偏好信息。它推荐了在用户资料
10、里最有可能的方案。这种方法具有更容易被采纳的优势,并且能够更快速地进行推荐。但是它也存在着结果差异和相应等级设置效率的问题。有许多基于内容的推荐系统。Zhang等人介绍了多媒体家庭平台系统,这是一种基于内容的网格推荐系统。kurapati等人介绍了多智能电视推荐和电子节目指南系统,实施一个基于内容过滤的明确的和隐含的文件。Shin等人介绍了社会意识方案推荐系统,它分类和选择同时满足团体和个人喜好的电视节目。从多个文件得出联合建议的方法被提倡解决联合多种过滤问题,例如一个人的偏好等级。这种联合推荐的方法将带来好处减少缺点。它使用经过过滤的内容,分析用户的等级,并预测在新的领域用户评级。针对基于协
11、同过滤的内容过滤,有许多多重过滤推荐方法。pessemier等人介绍了基于用户广告偏好的推荐方法,使用的是在多种设备中的获取模式,比如iDTV,因特网以及移动设备。Martinez等人介绍了频道推荐方法,它利用奇异值分解(SVD)技术和上下文匹配技术,解决在协同过滤中用户稀缺问题。三、云计算环境下个性化数字电视节目推荐系统云计算环境下个性化数字电视频道推荐建议系统的概念系统架构如图2所示:图2我们提出个性化数字电视节目推荐系统(PDPR),是以对消费者的观看模式分析为基础,通过云计算技术得来的。拟议的个性化方法收集和分析观看模式,比如目标用户对内容的观看模式,整体用户的观看模式的统计信息以及用
12、户的私人信息或是偏好信息。这是通过对用户的计算环境,通信服务,首选设备类型如移动电话,个人电脑等分析得来的。就像图3描述的那样,计划的个性化数字电视节目推荐系统涵盖:媒体储存云(MSC)、私人计算云(PCC)、个人互联网终端(IIT)、推荐代理(RA)以及多媒体广播系统(MBS)。图三,个人数字电视节目推荐系统的简要结构媒体储存云(MSC)是基于为在上百个频道播出的媒体内容提供储存的云计算。内容供应商们(CV)诸如有许可的广播公司、小到媒体操作员和内容制作者都把他们自己的媒体内容储存在媒体储存云上。服务代理商们(SAs)从MSC上提供内容给消费者,并得出包括由消费者的资料以及对观看记录的分析得
13、出的消费者的喜好在内的统计信息。MSC在个人计算云上更新这些用户资料。 一般,传统的频道推荐系统只推荐那些可能已经得到消费者喜爱的频道。他们很少考虑新推出的频道和节目。因此,这些系统也许可以在对传统频道和节目上表现出合理性,但是它们遇到新建立的频道和节目时就没有效率,也没有对任何关于新频道和节目用户信息。为了解决这个问题,我们使用整体用户统计出的浏览信息,然后分析目标消费者的喜好的相似性。例如,一些消费者对虚构戏剧几乎没有兴趣。可同时,一些消费者对一些特殊戏剧的浏览喜好可导致前者看到极好地戏剧。又如,一些消费者可能对体育事件没有任何兴趣,但是一项重大的体育赛事,比如当地队伍的国家足球联赛可能对
14、整体消费群的观看喜好是令人兴奋的,这可能让非体育友好消费者在特定时段观看这场比赛。因此,我们考虑了整体消费者的浏览模式,并用这一信息制定新媒体内容的个人频道推荐。私人计算云(PCC)监控目标用户的个人信息。PCC提供管理、调度、安全、用户资料的隐私控制以及需要的资源。一般,每个用户的个人喜好信息可能通过智能设备产生,例如个人电脑、手机、笔记本。可与此同时,这设计的系统中,每个智能设备分别传输网络日志历史到PCC。文件管理器(PM)之后分析综合的网络日志,基于这些日志生成消费这的资料。个人资料过滤代理(PFA)分析某位用户已经生成资料和其他一些用户资料的相似性。如果一些用户在他们的目标用户中显示
15、出相似喜好,之后这些与之有共同喜好的用户已经选择(或偏好)的节目就会被推荐。这使得客户间通过云计算的相似度检查成为可行。因此,传统需要大量消费者和精确偏好数据的合作方式问题可以被解决。另一个问题是传统途径里当偏好数据不可用时,推荐新内容是不可能的。然而,这个问题可以通过设计的PCC解决。因此通过设计的PCC可以在极短时间区分用户的偏好并在开始时间提供频道清单。PCC同时是独立的设备位置,可以通过不同设备给用户提供一致的个性化信息。相似的用户计算是通过矢量空间模型评价。余弦相似度用来检查和分类组之间的相似性,如中所示(1)。 这种方法通常用于评价消费者的个人资料之间的相似之处和选定频道或节目。其
16、中a,u是定义为偏好度矢量,分别根据用户(a)和用户(u)为每个节目提供。定义为偏好度,分别根据用户(a)和用户(u)为每个节目提供。个人网络终端(IIT)提供用户资料和偏好信息,是一个为个性化频道推荐的小型资源。推荐系统的精确性很大依赖于分析后的个人信息。信息的时期和容量也很重要。用户行为监控(UBM)持续监控用户的行为模式和操作模式信息。UBM从个人电脑、移动电话、笔记本等设备回收网络日志历史信息,并将用户的模式信息储存到PCC。因此,用户的信息是设备地址的独立,用户可以在混杂的设备和地址中得到一致的支持。多媒体广播系统(MBS)提供广播功能。接口代理通过包括个人数字录像机在内的机顶盒,传
17、输来自各种频道的大量媒体信息,实现用户在要求时间里选择和浏览。此外,所有消费的频道列表和历史在机顶盒中积累。个人资料过滤代理(PFA)通过文件过滤器,基于积累的浏览内容列表生成个性化频道偏好。推荐代理(RA)位于MBS。RA基于以下几点生成推荐列表:1)PCC创建的目标用户个人资料,2)已偏好频道和内容列表,通过对目标用户的媒体内容显示出相似偏好的群组确定,3)已偏好和推荐的频道和节目,有MBS根据文件过滤推荐4)MSC提供的已选择节目历史信息。此外,本系统使用个人的频道选择历史来创建用户的频道选择模式分析,并为一个频道模式生成权重因素。在这个系统中,节目属性(a)包括节目标题(T),风格(G
18、),子流派(subG),频道(C)和演员(A)。每个属性的偏好度可以以此计算:偏好度(u,a)=(偏好度(u,a)+UAu,a)/2其中, 其中,储存在客户(u)资料的偏好度属性(a)被定义为偏好度(u,a),在特定时段为客户(u)储存在频道选择历史中的频道选择频率属性(a),被定义为频率u,a,客户(u)特定时段的更新价值属性(a)被定义为UAu,a,是由频率u,a除以最大频道选择频率计算出的。在“云”中的偏好度属性(a)被定义为偏好度(c,a)。在特定时段“云”中频道选择历史的频道选择频率属性(a),被定义为频率从c,a。云中的更新价值属性(a)定义为CAc,a,由频率c,a除以最大频道选
19、择频率计算出。每个节目的总体偏好度(preference(u,p)可以通过用户偏好度和云中频道的偏好度计算,例如:其中,对用户(u)节目(p)近期频道选择模式的权重指数定义为Wu,p。云中近期频道选择模式的权重指数为Wc,p。近期频道选择模式的权重指数被一下两个因素同时决定:1)偏好度2)特定时段节目的观看分布。某节目(p)用户在近期的偏好度可以由(4)式计算。在韩国,电视节目分为首播和重播。因此,我们的计算结果反映了首播和重播两种情况。此外,我们还考虑了没有重播的情况。如果存在重播,那么其中Wup是用户(u)某特定时间段对节目(p)的偏好度。而Wcp是在某特定时间段云中节目(p)的偏好度。V
20、(p)是用户(u)观看节目(p)首播的数量,n(p)是观看节目(p)首播的数量,Rv(p)是观看节目(p)重播的数量,Rn(p)是重播的节目数量,Du是重复观看节目(p)首播和重播的数量。是首播的用户(u)浏览模式率,是重播的用户浏览模式率,是重复观看首播和重播的浏览模式率。Ci(P)于云中观看节目(p)首播的相似用户(i)群的数量,而Ri(p)是云中观看重播的相似用户(i)群数量。Dci是云中重复观看节目(p)首播和重播的相似用户(i)群数量,m是云中的相似用户群的数量。表格一是某用户(u)在近几周对节目(A)不同浏览模式的例子。根据(4)中的方程式,我们能够计算出用户在特定时间段对节目(A
21、)偏好度。收看节目的分布评估使用(5)所定义的熵的概念。熵,在一般情况下,是用于衡量数据的杂质程度。在本文中,它被用于评价某节目在用户观看节目列表中分布。如果对特定节目观看的数量增加,熵值会下降。换句话说,这意味着节目偏好度的增加。如果用户在一周观看每个节目(最多30个),熵值将会是4。9069。在本文中,我们不考虑别影响偏好度的因素,如果用户在特定时间观看超过30个节目,并把熵值定为4.9069。因此,节目评估的收视分布标准值设定在5.0。其中,Wue是用户(u)在特定时间的节目浏览分布,Wce是观看过该节目的云中特定时间相似用户群,Entropy(u)是用户(u)的熵,Entropy(c)
22、是云中相似用户群的熵。P(i|t)是特定时段云中相似用户群的观看列表中的部分节目(i)。Un是特定时段储存在已观看历史中的已观看节目数量。Cn是云中相似用户群的节目数量。如果节目数量(Um或Cn)少于30,就会被设置为节目数量。如果超过30个,将会设置30个高收率的节目作为标准。如果用户观看某节目类似于表一,已观看节目的分布将会是下面例子所描述的。该情况下显示用户选择了17次节目在总共6个节目中,包括首播和重播,例如节目(p)近期选择模式的权重值在(6)中,通过用户(u)近期选择模式(Wu,p)和云中对频道的近期选择模式(Wc,p)显示。其中,history(u)是用户(u)的频道收视历史列表
23、而history(c)是云中相似用户群的频道收视历史列表。 如图4 所描绘,序列图显示出,用户通过用户请求推荐偏爱节目过程的每个组成部分的互动。四、实验结果我们通过来自三大公司(韩国文化广播公司、韩国广播公司、韩国SBS电视台)20个用户和他们在韩国的内容评价了所设计的系统的表现。如表格3所示,实验时间是从2009年2月1日到2009年7月31日。我们评估了用户从2009年2月1日到2009年6月1日的收视模式,这个时间段是收集阶段数据。接下来,我们估计实验需要2个月以上来检查设计系统的有效性和准确性。由于韩国的定期节目重新建设,所有大公司的播出节目在2009年4月有了明显变化。这段时期,传统
24、节目被移除而新的节目制作推出。此外,播出时间也潜在变化。对用户的实验模型和频道推荐每周做一次重新评估。推荐频道数量限制在五个。由于真正的云计算基于的播出系统尚不可使用,我们基于客户服务环境建设了模拟器,用来评价系统表现。Fig. 4. Sequence diagram of the personalized DTV program recommendation system 我们使用“准确”,“召回”工具以及 “f-衡量”工具,作为表现评价衡量工具为客户衡量所设计的频道推荐系统。准确和召回在(7)中被广泛用于频道推荐页面.(7)中“recommended”是推荐系统决定的推荐频道表,“inte
25、rested”是用户观看过的频道(或者节目)。准确率是推荐列表中感兴趣的内容,它被用于评价推荐频道的精确性。高的准确率意味着推荐系统基于用户个人信息有效推荐了频道。召回率是推荐的感兴趣内容和所有感兴趣内容集合的比率。所设计系统的目标是同时提高准确率和召回率。准确率和召回率的评价见图5。在最初的实验阶段,系统精确性很低,召回率在60%-70%。主要原因是初期阶段个性化信息不足。然后,随着时间推移,用户个人资料的原始信息变得充足,准确率增加到了40%,召回率提高到了85%。根据图5,准确率和召回率在第19周都有了下降,这是因为非周期的频道被纳入了频道指南地图(韩国和南非共和国的国家足球联赛)。在这
26、段时间,非体育友好用户收看了体育节目,推荐系统表现出了些恶化。然而,第20周,另一场国家足球联赛举行,系统在频道推荐上的表现显示出提高。在第26周,准确率和召回率的表现再次同时恶化,这是因为常规广播电视频道地图的重组。系统的“f-衡量”,如(8)描述,使用了准确率和召回率调和的手段来显示整体表现,如图6所示。是准确率和召回率的权重指数,一般情况下,我们认为=1/2。大的f-衡量值意味频道推荐系统提高了更精确的结果。 五,结论和展望这本文中,我们通过云计算环境下的收视模式分析手段设计了一套个性化数字电视频道和节目推荐系统。该系统采用以消费者为导向的定制因素,当消费者访问内容存储云的数字广播媒体,
27、例如用户设备中的网络日志历史信息,会在私人计算云中创建个性化的用户配置文件。消费者已浏览历史文件也同时被使用。为了对即将出现的内容做出一个合适的、最优频道推荐,来自整体用户观赏媒体内容模式的统计信息,会被应用于加权因素。大多数移动和固定设备已经作为个人智能设备用于个性化智能服务。因此,我们为节目兴趣的可行领域,可使用个性化信息诸如偏好度和个人兴趣。个性化数据被收集后,再基于用户对电信和广播电视服务的使用,通过云计算环境下的智能设备的分析,即可完成在今后的研究工作,我们将把重点放在那些即将到来的智能设备的特点上。我们会加强系统对各种内容长度的应对。传统的研究主要集中在基于用户特点的频道选择,但另一项重要因素可能是广播室和他的数字内容长度。因此我们已经制定了一项计划,通过部署云媒体存储的时间信息来加强系统。专心-专注-专业