-1. 任务一:数据处理 (1)读取imdb数据集并构建词表(已有词表,但是还是希望能自己构建一个) IMDB 数据集包含来自互联网电影数据库(IMDB)的 50 000 条严重两极分化的评论。数据集被分为用于训练的 25 000 条评论与用于测试的 25 000 条评论,训练集和测试集都包含 50% 的正面评论和 50% 的负面评论。 train_labels 和 test_labels 都是 0 和 1 组成的列表,其中 0代表负面(negative),1 代表正面(positive) 熟悉python相关语法,完成数据集的读取,与词表的构建。 (2)使用dataset,dataloader包装imdb数据集。
-
Notifications
You must be signed in to change notification settings - Fork 0
rica451/misson1
About
No description, website, or topics provided.
Resources
Stars
Watchers
Forks
Releases
No releases published
Packages 0
No packages published