这是一个好问题,但是范围有点大,很难详细述说。
像今日头条,qq空间,哔哩哔哩应该可以算做是实时性的推荐系统,会根据你的搜索,观看等等行为去分析你的喜好。这就是为什么当你观看某一个内容时,你刷新,或者是在你观看的内容下方会有相同的内容出现。但是虽然是相同的,但使用办法还是各有不同。
至于最佳的推荐算法,真的没有一个定义。技术是不断更新迭代的,一个会比一个好。也就是没有最好,也没有最差。你应该保持务实的态度。什么是最好的?最适合自己的才是最好的。你需要根据的自己的应用场景来选择的你自己的算法。根据你所获得的数据来进行选择,但最好使用6个月以内的数据内容来明确你算法。人都是会改变的,越是较早的数据通过推荐算法得到的往往是越精确的。
内容数据的基本算法应该是TF-IDF,Word2Vec和LDA等等。基于用户的比较出名的是协同过滤推荐算法。如果你感兴趣可以去看一下,考虑到基础决定上层社会等问题,你可以先去学习排序方法。我最近做的一次项目使用的是“倒排索引”英文名为Lucene Solr,不知道对不对,英文不好。
倒排索引适合快速搜索你获取到的用户数据,也就是根据属性的值来查找记录,这种索引表中的每一项都包括一个属性值和具有该属性值的各记录的地址。不是由记录来确定属性值,而是由属性值来确定记录的位置。在关系数据库系统里倒排索引是检索数据“最”有效率的方法。不过这个方法比较老了,不过很适合新手。希望我的回答能帮助你的学习路程能轻松一点。
1857
1