将movielens-1m数据集转化为原子数据时报错 #110

cizhouyu · 2022-11-10T08:00:56Z

您好！感谢提供转换数据集的方法。我遇到了一些问题：
使用命令 python run.py --dataset ml-1m --input_path ml-1m --output_path output_data/ml-1m --convert_inter --convert_item --convert_user 时，报错：
UnicodeDecodeError: 'utf-8' codec can't decode byte 0xe9 in position 3114: invalid continuation byte。

操作步骤：按照https://github.com/RUCAIBox/RecSysDatasets/blob/master/conversion_tools/usage/MovieLens.md 指引的操作步骤，到第三步时报错，如下图所示。

请问我要怎么做呢？

cizhouyu · 2022-11-10T08:06:38Z

我发现只有在--convert_item时会报错，--convert_inter和--convert_user都没有问题的。请问怎么做可以正确转换item数据呢？

cizhouyu · 2022-11-15T08:19:38Z

使用 #94 中，用户 guedes-joaofelipe 提到的方法，已经解决问题。

cizhouyu closed this as completed Nov 15, 2022

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

将movielens-1m数据集转化为原子数据时报错 #110

将movielens-1m数据集转化为原子数据时报错 #110

cizhouyu commented Nov 10, 2022

cizhouyu commented Nov 10, 2022

cizhouyu commented Nov 15, 2022

将movielens-1m数据集转化为原子数据时报错 #110

将movielens-1m数据集转化为原子数据时报错 #110

Comments

cizhouyu commented Nov 10, 2022

cizhouyu commented Nov 10, 2022

cizhouyu commented Nov 15, 2022