博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
协同过滤代码---loadMovieLens.py文件
阅读量:4880 次
发布时间:2019-06-11

本文共 1301 字,大约阅读时间需要 4 分钟。

#coding=utf-8import sysimport os##==================================#         加载指定的训练集文件#  参数fileName 代表某个训练集文件##==================================def loadMovieLensTrain(fileName='u1.base'):    str1 = './movielens/'                         # 目录的相对地址        prefer = {}    for line in open(str1+fileName,'r'):       # 打开指定文件        (userid, movieid, rating,ts) = line.split('\t')     # 数据集中每行有4项        prefer.setdefault(userid, {})      # 设置字典的默认格式,元素是user:{}字典        prefer[userid][movieid] = float(rating)        return prefer      # 格式如{:'user1'{itemid:rating, itemid2:rating, ,,}, {,,,}}##==================================#        加载对应的测试集文件#  参数fileName 代表某个测试集文件,如u1.test##==================================def loadMovieLensTest(fileName='u1.test'):    str1 = './movielens/'        prefer = {}    for line in open(str1+fileName,'r'):            (userid, movieid, rating,ts) = line.split('\t')   #数据集中每行有4项        prefer.setdefault(userid, {})            prefer[userid][movieid] = float(rating)       return prefer                   if __name__ == "__main__":    print ("""这个部分可以进行上面2个函数测试 """)        trainDict = loadMovieLensTrain()    testDict = loadMovieLensTest()    print (len(trainDict))    print (len(testDict))    print (""" 测试通过 """)

转载于:https://www.cnblogs.com/blueyyc/p/5666470.html

你可能感兴趣的文章
10.04 FZSZ模拟Day1 总结
查看>>
RabbitMQ学习以及与Spring的集成(二)
查看>>
Go语言数据类型
查看>>
User Get 'Access Denied' with Excel Service WebPart
查看>>
C# 读取WAV文件(详细)
查看>>
web服务器,验证码,Xftp使用方法
查看>>
割点 - 模板
查看>>
Ubuntu 16.04.6 + Win10 双系统时间错误且不一致
查看>>
第三次作业——结对编程
查看>>
ora-12899解决方法
查看>>
(8)关于flexbox的一些想法。
查看>>
一台机子同时启动两个相同版本的tomcat
查看>>
剑指offer——python【第29题】最小的K个数
查看>>
带你入门代理模式/SpringAop的运行机制
查看>>
参考的博客
查看>>
移动端适配方案
查看>>
eclipse对离线python的环境搭建
查看>>
要找工作啦
查看>>
JSON for java入门总结
查看>>
OpenCV imshow无法显示图片
查看>>