Formatting code

filipebraida · filipebraida · commit a09dfb839884 · 2019-08-14T11:11:13.000-03:00
diff --git a/src/movielens.jl b/src/movielens.jl
@@ -1,15 +1,15 @@
 const defdir = joinpath(dirname(@__FILE__), "..", "datasets")
 
 function getmovielensdata(dir)
-	mkpath(dir)
-	path = download("http://files.grouplens.org/datasets/movielens/ml-100k.zip")
-	run(unpack_cmd(path,dir,".zip", ""))
+   	mkpath(dir)
+   	path = download("http://files.grouplens.org/datasets/movielens/ml-100k.zip")
+   	run(unpack_cmd(path, dir, ".zip", ""))
 end
 
 function getmovielensdata1m(dir)
-	mkpath(dir)
-	path = download("http://files.grouplens.org/datasets/movielens/ml-1m.zip")
-	run(unpack_cmd(path,dir,".zip", ""))
+   	mkpath(dir)
+   	path = download("http://files.grouplens.org/datasets/movielens/ml-1m.zip")
+   	run(unpack_cmd(path, dir, ".zip", ""))
 end
 
 """
@@ -18,15 +18,15 @@ end
 Return MovieLens 100k dataset.
 """
 function MovieLens()::Persa.Dataset
-	filename = "$(defdir)/ml-100k/u.data"
+   	filename = "$(defdir)/ml-100k/u.data"
 
-	isfile(filename) || getmovielensdata(defdir)
+   	isfile(filename) || getmovielensdata(defdir)
 
-	file = DataFrame(CSV.read(filename, delim = '\t',
+   	file = DataFrame(CSV.read(filename, delim = '\t',
 	                      header = [:user, :item, :rating, :timestamp],
 						  types = [Int, Int, Int, Int]))
 
-	return Persa.Dataset(file)
+   	return Persa.Dataset(file)
 end
 
 """
@@ -45,11 +45,11 @@ function MovieLens1M()::Persa.Dataset
 
     df = DataFrame()
 
-	df[!, :user] = convert(Array{Int}, file[!, :user])
-	df[!, :item] = convert(Array{Int}, file[!, :item])
-	df[!, :item] = labelencode(labelmap(df[!, :item]), df[!, :item])
-	df[!, :rating] = convert(Array{Int}, file[!, :rating])
-	df[!, :timestamp] = convert(Array{Int}, file[!, :timestamp])
+   	df[!, :user] = convert(Array{Int}, file[!, :user])
+   	df[!, :item] = convert(Array{Int}, file[!, :item])
+   	df[!, :item] = labelencode(labelmap(df[!, :item]), df[!, :item])
+   	df[!, :rating] = convert(Array{Int}, file[!, :rating])
+   	df[!, :timestamp] = convert(Array{Int}, file[!, :timestamp])
 
     return Persa.Dataset(df)
 end
diff --git a/src/others.jl b/src/others.jl
@@ -1,94 +1,94 @@
 function Netflix()::Persa.CFDataset
-  filename = "$(defdir)/netflix/netflix.csv"
-  file = readtable(filename, separator = ',', header = false)
+    filename = "$(defdir)/netflix/netflix.csv"
+    file = readtable(filename, separator = ',', header = false)
 
 
-  df = DataFrame()
+    df = DataFrame()
 
-  df[:user] = labelencode(labelmap(file[:,1]), file[:,1])
-  df[:item] = file[:,2]
-  df[:rating] = file[:,3]
+    df[:user] = labelencode(labelmap(file[:,1]), file[:,1])
+    df[:item] = file[:,2]
+    df[:rating] = file[:,3]
 
-  return Persa.Dataset(df)
+    return Persa.Dataset(df)
 end
 
 function MovieTweeting()::Persa.TimeCFDataset
-  filename = "$(defdir)/Movie-Tweeting-200k/ratings.dat"
-  file = readtable(filename, separator = ':', header = false)
+    filename = "$(defdir)/Movie-Tweeting-200k/ratings.dat"
+    file = readtable(filename, separator = ':', header = false)
 
-  df = DataFrame()
+    df = DataFrame()
 
-  df[:user] = file[:,1]
-  df[:item] = labelencode(labelmap(file[:,2]), file[:,2])
-  df[:rating] = file[:,3]
-  df[:timestamp] = file[:,4]
+    df[:user] = file[:,1]
+    df[:item] = labelencode(labelmap(file[:,2]), file[:,2])
+    df[:rating] = file[:,3]
+    df[:timestamp] = file[:,4]
 
-  return Persa.Dataset(df)
+    return Persa.Dataset(df)
 end
 
 function MovieTweeting10k()::Persa.TimeCFDataset
-  filename = "$(defdir)/mt-snapshot-10k/ratings.dat"
-  file = readtable(filename, separator = ':', header = false)
+    filename = "$(defdir)/mt-snapshot-10k/ratings.dat"
+    file = readtable(filename, separator = ':', header = false)
 
-  df = DataFrame()
+    df = DataFrame()
 
-  df[:user] = file[:,1]
-  df[:item] = labelencode(labelmap(file[:,2]), file[:,2])
-  df[:rating] = file[:,3]
-  df[:timestamp] = file[:,4]
+    df[:user] = file[:,1]
+    df[:item] = labelencode(labelmap(file[:,2]), file[:,2])
+    df[:rating] = file[:,3]
+    df[:timestamp] = file[:,4]
 
-  return Persa.Dataset(df)
+    return Persa.Dataset(df)
 end
 
 function CiaoDVD()::Persa.TimeCFDataset
-  filename = "$(defdir)/CiaoDVD/movie-ratings.txt"
-  file = readtable(filename, separator = ',', header = false)
+    filename = "$(defdir)/CiaoDVD/movie-ratings.txt"
+    file = readtable(filename, separator = ',', header = false)
 
-  df = DataFrame()
+    df = DataFrame()
 
-  df[:user] = file[:,1]
-  df[:item] = file[:,2]
-  df[:rating] = file[:,5]
-  df[:timestamp] = convert(Array{Int}, Dates.datetime2unix.(Dates.DateTime(file[:,6])))
+    df[:user] = file[:,1]
+    df[:item] = file[:,2]
+    df[:rating] = file[:,5]
+    df[:timestamp] = convert(Array{Int}, Dates.datetime2unix.(Dates.DateTime(file[:,6])))
 
-  return Persa.Dataset(df)
+    return Persa.Dataset(df)
 end
 
 function FilmTrust()::Persa.CFDataset
-  filename = "$(defdir)/FilmTrust/ratings.txt"
-  file = readtable(filename, separator = ' ', header = false)
+    filename = "$(defdir)/FilmTrust/ratings.txt"
+    file = readtable(filename, separator = ' ', header = false)
 
-  df = DataFrame()
+    df = DataFrame()
 
-  df[:user] = file[:,1]
-  df[:item] = file[:,2]
-  df[:rating] = file[:,3]
+    df[:user] = file[:,1]
+    df[:item] = file[:,2]
+    df[:rating] = file[:,3]
 
-  return Persa.Dataset(df)
+    return Persa.Dataset(df)
 end
 
 function YahooMusic()::Persa.CFDataset
-  filename = "$(defdir)/yahoo-music-r3/ymusic-r3-dummy-time.dat"
-  file = readtable(filename, separator = ' ', header = false)
+    filename = "$(defdir)/yahoo-music-r3/ymusic-r3-dummy-time.dat"
+    file = readtable(filename, separator = ' ', header = false)
 
-  df = DataFrame()
+    df = DataFrame()
 
-  df[:user] = file[:,1]
-  df[:item] = file[:,2]
-  df[:rating] = file[:,3]
+    df[:user] = file[:,1]
+    df[:item] = file[:,2]
+    df[:rating] = file[:,3]
 
-  return Persa.Dataset(df)
+    return Persa.Dataset(df)
 end
 
 function LastFM()::Persa.CFDataset
-  filename = "$(defdir)/lastfm/last_fm.dat"
-  file = readtable(filename, separator = ',', header = false)
+    filename = "$(defdir)/lastfm/last_fm.dat"
+    file = readtable(filename, separator = ',', header = false)
 
-  df = DataFrame()
+    df = DataFrame()
 
-  df[:user] = labelencode(labelmap(file[:,1]), file[:,1])
-  df[:item] = labelencode(labelmap(file[:,2]), file[:,2])
-  df[:rating] = file[:,3]
+    df[:user] = labelencode(labelmap(file[:,1]), file[:,1])
+    df[:item] = labelencode(labelmap(file[:,2]), file[:,2])
+    df[:rating] = file[:,3]
 
-  return Persa.Dataset(df)
+    return Persa.Dataset(df)
 end
diff --git a/test/analysis.jl b/test/analysis.jl
@@ -52,39 +52,39 @@ factor = convert(Int, round(length(hist_user) / 200))
 
 open("t.txt", "w") do f
     write(f, "n\tcount\n")
-    for i=1:length(hist_user)
+    for i = 1:length(hist_user)
         if i % factor == 1
             write(f, "$i\t$(hist_user[i])\n")
         end
     end
- end
+end
 
 ###
 factor = convert(Int, round(length(hist_item) / 200))
 
 open("t.txt", "w") do f
     write(f, "n\tcount\n")
-    for i=1:length(hist_item)
+    for i = 1:length(hist_item)
         if i % factor == 1
             write(f, "$i\t$(hist_item[i])\n")
         end
     end
- end
+end
 
 #####
 ds = datasets[3]()
 sort!(ds.file, cols = :timestamp)
 ds.file[:timestamp]
 
-moments = Dict{Int, Int}()
+moments = Dict{Int,Int}()
 
 times = unique(ds.file[:timestamp])
 
-for i=1:length(times)
+for i = 1:length(times)
     moments[times[i]] = 0
 end
 
-for i=1:length(ds.file[:timestamp])
+for i = 1:length(ds.file[:timestamp])
     moments[ds.file[:timestamp][i]] += 1
 end
 
@@ -99,12 +99,12 @@ factor = convert(Int, round(size(moments2_sorted)[1] / 200))
 
 open("t.txt", "w") do f
     write(f, "n\tcount\n")
-    for i=1:size(moments2_sorted)[1]
+    for i = 1:size(moments2_sorted)[1]
         if i % factor == 1
             write(f, "$(moments2_sorted[i,1])\t$(sum(moments2_sorted[1:i,2]) ./ length(ds))\n")
         end
     end
- end
+end
 
 
 
@@ -116,8 +116,8 @@ times = unique(ds.file[:timestamp])
 
 qnt = collect(1:length(times))
 
-for i=1:length(times)
-    repeats = length(find(r->r==times[i], ds.file[:timestamp]))
+for i = 1:length(times)
+    repeats = length(find(r->r == times[i], ds.file[:timestamp]))
     if repeats > 1
         qnt[i] = qnt[i] + repeats - 1
     end
@@ -131,33 +131,33 @@ ds = datasets[1]()
 sort!(ds.file, cols = :timestamp)
 ds.file[:timestamp] = ds.file[:timestamp] .- ds.file[:timestamp][1]
 
-moments = Dict{Int, Array{Int}}()
+moments = Dict{Int,Array{Int}}()
 
 times = unique(ds.file[:timestamp])
 
-for i=1:length(times)
+for i = 1:length(times)
     moments[times[i]] = Array{Int}(0)
 end
 
-for (u,v,r,t) in ds
+for (u, v, r, t) in ds
     push!(moments[t], u)
 end
 
-moments2 = Array{Tuple{Int, Int, Int}}(0)
+moments2 = Array{Tuple{Int,Int,Int}}(0)
 
-for i=1:length(times)
+for i = 1:length(times)
     users = moments[times[i]]
-    for j=1:length(unique(users))
-        push!(moments2, (times[i], users[j], length(find(r->r==users[j], users))))
-        println(length(find(r->r==users[j], users)))
+    for j = 1:length(unique(users))
+        push!(moments2, (times[i], users[j], length(find(r->r == users[j], users))))
+        println(length(find(r->r == users[j], users)))
     end
 end
 
 x = Array{Int}(length(moments2))
 y = Array{Int}(length(moments2))
 z = Array{Int}(length(moments2))
 
-for i=1:length(moments2)
+for i = 1:length(moments2)
     x[i] = moments2[i][1]
     y[i] = moments2[i][2]
     z[i] = moments2[i][3]
@@ -169,11 +169,11 @@ moments = hcat(ds.file[:user], ds.file[:timestamp])
 moments[:,2] = moments[:,2] .- moments[1,2]
 
 select = find(r->r in [1:10...], y)
-select = (length(x)-1000):length(x)
+select = (length(x) - 1000):length(x)
 ###
-scatter(x[select], y[select], s = z[select].*25, alpha = 0.5)
+scatter(x[select], y[select], s = z[select] .* 25, alpha = 0.5)
 
-for i=1:10
+for i = 1:10
     plot(x[select], repeat([i], inner = length(x[select])))
 end