in prog

EdwardBerman · Oct 11, 2024 · b366b1c · b366b1c
1 parent f1f04d8
commit b366b1c
Showing 1 changed file with 254 additions and 0 deletions.
diff --git a/src/gradient_pass.jl b/src/gradient_pass.jl
@@ -0,0 +1,254 @@
+module skip_fuzzy
+include("metrics.jl")
+include("fuzzy_c_means.jl")
+
+using .metrics
+using .fuzzy
+
+using Zygote
+using UnicodePlots
+using Random
+using LinearAlgebra
+using Statistics
+using Distributions
+
+export skip_correlator
+
+function indicator_function(x, a, b)
+    if x < a
+        return 0
+    elseif x > b
+        return 0
+    else
+        return 1
+    end
+end
+
+function skip_correlator(ra::Vector{Float64}, 
+        dec::Vector{Float64},
+        quantity_one::Vector{fuzzy_shear},
+        quantity_two::Vector{fuzzy_shear},
+        initial_centers, 
+        initial_weights,
+        nclusters,
+        θ_min,
+        number_bins,
+        θ_max;
+        spacing = "linear",
+        fuzziness=2.0, 
+        dist_metric=Vincenty_Formula, 
+        tol=1e-6, 
+        verbose=false,
+        max_iter=1000)
+
+    data = hcat([[ra[i], dec[i]] for i in 1:length(ra)]...)
+
+    centers, weights, iterations = fuzzy_c_means(data, nclusters, initial_centers, initial_weights, fuzziness, dist_metric, tol, max_iter)
+
+    if verbose == true
+        println("Fuzzy C Means Converged in $iterations iterations")
+        println("Size centers: ", size(centers))
+        println("Size weights: ", size(weights))
+    end
+
+    quantity_one_shear_one = [quantity_one[i].shear[1] for i in 1:length(quantity_one)]
+    quantity_one_shear_two = [quantity_one[i].shear[2] for i in 1:length(quantity_one)]
+    quantity_two_shear_one = [quantity_two[i].shear[1] for i in 1:length(quantity_two)]
+    quantity_two_shear_two = [quantity_two[i].shear[2] for i in 1:length(quantity_two)]
+
+    assignment_matrix = zeros(size(weights))
+    for i in 1:size(weights, 1)
+        sample = argmax(weights[i, :])
+        for j in 1:size(weights, 2)
+            if j == sample
+                assignment_matrix[i, j] = 1
+            else
+                assignment_matrix[i, j] = 0
+            end
+        end
+    end
+
+    weighted_shear_one = [[weighted_average(quantity_one_shear_one, assignment_matrix)[i], weighted_average(quantity_one_shear_two, assignment_matrix)[i]] for i in 1:nclusters]
+    weighted_shear_two = [[weighted_average(quantity_two_shear_one, assignment_matrix)[i], weighted_average(quantity_two_shear_two, assignment_matrix)[i]] for i in 1:nclusters]
+
+    fuzzy_galaxies = [[centers[1,i], centers[2,i], weighted_shear_one[i], weighted_shear_two[i]] for i in 1:nclusters]
+
+    fuzzy_distances = [(fuzzy_galaxies[i], 
+                        fuzzy_galaxies[j], 
+                        Vincenty_Formula(fuzzy_galaxies[i][1:2], fuzzy_galaxies[j][1:2])) for i in 1:nclusters, j in 1:nclusters if i < j] 
+    ϵ = 1e-10
+    if spacing == "linear"
+        bins = range(θ_min, θ_max, length=number_bins)
+    elseif spacing == "log"
+        bins = 10 .^ range(log10(θ_min), log10(θ_max), length=number_bins)
+    end
+
+    if verbose == true
+        println(histogram([fuzzy_distance[3] for fuzzy_distance in fuzzy_distances], nbins=10))
+    end
+
+    filter_weights = [indicator_function(fuzzy_distance[3], bins[i], bins[i+1]) 
+                  for i in 1:length(bins)-1, fuzzy_distance in fuzzy_distances]
+
+    fuzzy_estimates = [fuzzy_shear_estimator(fuzzy_distances[j]) * filter_weights[i, j]
+                   for i in 1:size(filter_weights, 1), j in 1:size(filter_weights, 2)]
+
+    fuzzy_correlations = [ sum(fuzzy_estimates[i, :]) / (ϵ + sum(filter_weights[i, :]))
+                          for i in 1:size(fuzzy_estimates, 1)] 
+
+    mean_weighted_distances = [mean([fuzzy_distances[j][3] for j in 1:size(fuzzy_distances, 1) if filter_weights[i, j] == 1]) 
+                               for i in 1:size(filter_weights, 1)]
+
+    mean_weighted_distances = [if sum(filter_weights[i, :]) > 0
+                               mean([fuzzy_distances[j][3] for j in 1:size(fuzzy_distances, 1) if filter_weights[i, j] == 1])
+                           else
+                               NaN
+                           end for i in 1:size(filter_weights, 1)]
+
+    fuzzy_correlations = [if sum(filter_weights[i, :]) > 0
+                         fuzzy_correlations[i]
+                     else
+                         NaN
+                     end for i in 1:size(filter_weights, 1)]
+
+    return fuzzy_correlations, mean_weighted_distances
+end
+
+function fuzzy_galaxies_correlate(fuzzy_galaxies, 
+        θ_min,
+        number_bins,
+        θ_max;
+        spacing = "linear",
+        dist_metric=Vincenty_Formula)
+
+    fuzzy_distances = [(fuzzy_galaxies[i], 
+                        fuzzy_galaxies[j], 
+                        Vincenty_Formula(fuzzy_galaxies[i][1:2], fuzzy_galaxies[j][1:2])) for i in 1:nclusters, j in 1:nclusters if i < j] 
+    ϵ = 1e-10
+    if spacing == "linear"
+        bins = range(θ_min, θ_max, length=number_bins)
+    elseif spacing == "log"
+        bins = 10 .^ range(log10(θ_min), log10(θ_max), length=number_bins)
+    end
+
+    if verbose == true
+        println(histogram([fuzzy_distance[3] for fuzzy_distance in fuzzy_distances], nbins=10))
+    end
+
+    filter_weights = [indicator_function(fuzzy_distance[3], bins[i], bins[i+1]) 
+                  for i in 1:length(bins)-1, fuzzy_distance in fuzzy_distances]
+
+    fuzzy_estimates = [fuzzy_shear_estimator(fuzzy_distances[j]) * filter_weights[i, j]
+                   for i in 1:size(filter_weights, 1), j in 1:size(filter_weights, 2)]
+
+    fuzzy_correlations = [ sum(fuzzy_estimates[i, :]) / (ϵ + sum(filter_weights[i, :]))
+                          for i in 1:size(fuzzy_estimates, 1)] 
+
+    mean_weighted_distances = [mean([fuzzy_distances[j][3] for j in 1:size(fuzzy_distances, 1) if filter_weights[i, j] == 1]) 
+                               for i in 1:size(filter_weights, 1)]
+
+    mean_weighted_distances = [if sum(filter_weights[i, :]) > 0
+                               mean([fuzzy_distances[j][3] for j in 1:size(fuzzy_distances, 1) if filter_weights[i, j] == 1])
+                           else
+                               NaN
+                           end for i in 1:size(filter_weights, 1)]
+
+    fuzzy_correlations = [if sum(filter_weights[i, :]) > 0
+                         fuzzy_correlations[i]
+                     else
+                         NaN
+                     end for i in 1:size(filter_weights, 1)]
+
+    return fuzzy_correlations, mean_weighted_distances
+end
+
+function ForwardDiff.partials(f::typeof(skip_correlator), args::Tuple)
+    ra, dec, quantity_one, quantity_two, initial_centers, initial_weights, nclusters, θ_min, number_bins, θ_max = args
+
+    data = hcat([[ra[i], dec[i]] for i in 1:length(ra)]...)
+
+    centers, weights, iterations = fuzzy_c_means(data, nclusters, initial_centers, initial_weights, fuzziness, dist_metric, tol, max_iter)
+
+    if verbose == true
+        println("Fuzzy C Means Converged in $iterations iterations")
+        println("Size centers: ", size(centers))
+        println("Size weights: ", size(weights))
+    end
+
+    quantity_one_shear_one = [quantity_one[i].shear[1] for i in 1:length(quantity_one)]
+    quantity_one_shear_two = [quantity_one[i].shear[2] for i in 1:length(quantity_one)]
+    quantity_two_shear_one = [quantity_two[i].shear[1] for i in 1:length(quantity_two)]
+    quantity_two_shear_two = [quantity_two[i].shear[2] for i in 1:length(quantity_two)]
+
+    assignment_matrix = zeros(size(weights))
+    for i in 1:size(weights, 1)
+        sample = argmax(weights[i, :])
+        for j in 1:size(weights, 2)
+            if j == sample
+                assignment_matrix[i, j] = 1
+            else
+                assignment_matrix[i, j] = 0
+            end
+        end
+    end
+
+    weighted_shear_one = [[weighted_average(quantity_one_shear_one, assignment_matrix)[i], weighted_average(quantity_one_shear_two, assignment_matrix)[i]] for i in 1:nclusters]
+    weighted_shear_two = [[weighted_average(quantity_two_shear_one, assignment_matrix)[i], weighted_average(quantity_two_shear_two, assignment_matrix)[i]] for i in 1:nclusters]
+
+    fuzzy_galaxies = [[centers[1,i], centers[2,i], weighted_shear_one[i], weighted_shear_two[i]] for i in 1:nclusters]
+
+    fuzzy_distances = [(fuzzy_galaxies[i], 
+                        fuzzy_galaxies[j], 
+                        Vincenty_Formula(fuzzy_galaxies[i][1:2], fuzzy_galaxies[j][1:2])) for i in 1:nclusters, j in 1:nclusters if i < j] 
+    ϵ = 1e-10
+    if spacing == "linear"
+        bins = range(θ_min, θ_max, length=number_bins)
+    elseif spacing == "log"
+        bins = 10 .^ range(log10(θ_min), log10(θ_max), length=number_bins)
+    end
+
+    if verbose == true
+        println(histogram([fuzzy_distance[3] for fuzzy_distance in fuzzy_distances], nbins=10))
+    end
+
+    filter_weights = [indicator_function(fuzzy_distance[3], bins[i], bins[i+1]) 
+                  for i in 1:length(bins)-1, fuzzy_distance in fuzzy_distances]
+
+    fuzzy_estimates = [fuzzy_shear_estimator(fuzzy_distances[j]) * filter_weights[i, j]
+                   for i in 1:size(filter_weights, 1), j in 1:size(filter_weights, 2)]
+
+    fuzzy_correlations = [ sum(fuzzy_estimates[i, :]) / (ϵ + sum(filter_weights[i, :]))
+                          for i in 1:size(fuzzy_estimates, 1)] 
+
+    mean_weighted_distances = [mean([fuzzy_distances[j][3] for j in 1:size(fuzzy_distances, 1) if filter_weights[i, j] == 1]) 
+                               for i in 1:size(filter_weights, 1)]
+
+    mean_weighted_distances = [if sum(filter_weights[i, :]) > 0
+                               mean([fuzzy_distances[j][3] for j in 1:size(fuzzy_distances, 1) if filter_weights[i, j] == 1])
+                           else
+                               NaN
+                           end for i in 1:size(filter_weights, 1)]
+
+    fuzzy_correlations = [if sum(filter_weights[i, :]) > 0
+                         fuzzy_correlations[i]
+                     else
+                         NaN
+                     end for i in 1:size(filter_weights, 1)]
+
+    # check the assignment_matrix, then take the gradient of the fuzzy_galaxies_correlate function
+    ra_partials = ForwardDiff.partials(fuzzy_galaxies_correlate, (fuzzy_galaxies, θ_min, number_bins, θ_max))
+    dec_partials = ForwardDiff.partials(fuzzy_galaxies_correlate, (fuzzy_galaxies, θ_min, number_bins, θ_max))
+    quantity_one_partials = ForwardDiff.partials(fuzzy_galaxies_correlate, (fuzzy_galaxies, θ_min, number_bins, θ_max))
+    quantity_two_partials = ForwardDiff.partials(fuzzy_galaxies_correlate, (fuzzy_galaxies, θ_min, number_bins, θ_max))
+    initial_centers_partials = ForwardDiff.partials(fuzzy_galaxies_correlate, (fuzzy_galaxies, θ_min, number_bins, θ_max))
+    initial_weights_partials = ForwardDiff.partials(fuzzy_galaxies_correlate, (fuzzy_galaxies, θ_min, number_bins, θ_max))
+    nclusters_partials = ForwardDiff.partials(fuzzy_galaxies_correlate, (fuzzy_galaxies, θ_min, number_bins, θ_max))
+    θ_min_partials = ForwardDiff.partials(fuzzy_galaxies_correlate, (fuzzy_galaxies, θ_min, number_bins, θ_max))
+    number_bins_partials = ForwardDiff.partials(fuzzy_galaxies_correlate, (fuzzy_galaxies, θ_min, number_bins, θ_max))
+    θ_max_partials = ForwardDiff.partials(fuzzy_galaxies_correlate, (fuzzy_galaxies, θ_min, number_bins, θ_max))
+
+    return ForwardDiff.partials(skip_correlator, args, Val(:all))
+end
+
+end
+