使用深度学习建立电影推荐系统
发布时间:2021-05-22 21:28:11 所属栏目:大数据 来源:互联网
导读:你看过《盗梦空间》吗?是否被影片中的梦中梦烧脑,或是想象现实世界中物品能否像电影中那样漂浮在空中?至少目前我们没有办法使物体悬浮在空中,但是,数据科学家可以将python向量映射到多维空间。 本文将为介绍一个电影推荐系统,在推荐系统中,有许多电影
你看过《盗梦空间》吗?是否被影片中的梦中梦烧脑,或是想象现实世界中物品能否像电影中那样漂浮在空中?至少目前我们没有办法使物体悬浮在空中,但是,数据科学家可以将python向量映射到多维空间。
本文将为介绍一个电影推荐系统,在推荐系统中,有许多电影向量悬浮于多维空间。同时,本文介绍的推荐系统无需租用服务器、编写代码、抓取数据或网页维护等繁杂的工作,非常容易上手。此外,你还可以将其扩展到社交网络、股票、运动员、电视节目、书籍等领域。想象一下,众多实例都会被映射到多维矢量空间,一览无余,那时多么直观啊。
你可以点击该链接预览我们的电影推荐系统。
学习本文需要满足以下条件:对新概念的好奇心,渴望部署自己的Web应用程序。
同时,你最好对这些知识有所了解:word2vec嵌入,神经网络,Tensorflow,Github和推荐系统。
工具/概念:
1.Embedding:将高维向量投射到低维稠密向量空间。由于表示图像/单词的像素或标记特征可能需要数百万个参数,因此我们需要定义一种受限统一结构,以此作为ML模型的输入。在对高维或大量特征进行建模以导出受限数据大小模式时,通常会遇到维数灾难,即模型无法从输入数据中提取相关模式。通常我们会使用主成分分析(PCA),TSNE或L1正则化等方法进行降维,但是对于极高维度和稀疏数据集(如Wikipedia语料库中的数百万个标记),基于神经网络的嵌入可以很好的提取相关属性。
嵌入能够捕获标记或像素之间的语义相似性,并将其投影到向量空间中。例如,我们知道“费德勒”和“网球”之间存在密切关联,那么在100维嵌入空间中,“费德勒”比“特朗普”更接近“网球”。
图示如下:
![]() (编辑:常州站长网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |