QuantumKitHub · pbrehmer · Oct 29, 2024 · Oct 24, 2024 · Oct 25, 2024 · Oct 28, 2024
diff --git a/src/utility/util.jl b/src/utility/util.jl
@@ -12,24 +12,33 @@ function _elementwise_mult(a::AbstractTensorMap, b::AbstractTensorMap)
 end
 
 # Compute √S⁻¹ for diagonal TensorMaps
-function sdiag_inv_sqrt(S::AbstractTensorMap)
+_safe_inv(a, tol) = abs(a) < tol ? zero(a) : inv(a)
+function sdiag_inv_sqrt(S::AbstractTensorMap; tol::Real=eps(eltype(S))^(3 / 4))
+    tol *= norm(S, Inf)  # Relative tol w.r.t. largest singular value (use norm(∘, Inf) to make differentiable)
     invsq = similar(S)
 
     if sectortype(S) == Trivial
-        copyto!(invsq.data, LinearAlgebra.diagm(LinearAlgebra.diag(S.data) .^ (-1 / 2)))
+        copyto!(
+            invsq.data,
+            LinearAlgebra.diagm(_safe_inv.(LinearAlgebra.diag(S.data), tol) .^ (1 / 2)),
+        )
     else
         for (k, b) in blocks(S)
             copyto!(
-                blocks(invsq)[k], LinearAlgebra.diagm(LinearAlgebra.diag(b) .^ (-1 / 2))
+                blocks(invsq)[k],
+                LinearAlgebra.diagm(_safe_inv.(LinearAlgebra.diag(b), tol) .^ (1 / 2)),
             )
         end
     end
 
     return invsq
 end
 
-function ChainRulesCore.rrule(::typeof(sdiag_inv_sqrt), S::AbstractTensorMap)
-    invsq = sdiag_inv_sqrt(S)
+function ChainRulesCore.rrule(
+    ::typeof(sdiag_inv_sqrt), S::AbstractTensorMap; tol::Real=eps(eltype(S))^(3 / 4)
+)
+    tol *= norm(S, Inf)
+    invsq = sdiag_inv_sqrt(S; tol)
     function sdiag_inv_sqrt_pullback(c̄)
         return (ChainRulesCore.NoTangent(), -1 / 2 * _elementwise_mult(c̄, invsq'^3))
     end

diff --git a/test/ctmrg/gradients.jl b/test/ctmrg/gradients.jl
@@ -18,12 +18,7 @@ names = ["Heisenberg", "p-wave superconductor"]
 
 gradtol = 1e-4
 boundary_algs = [
-    CTMRG(;
-        tol=1e-10,
-        verbosity=0,
-        ctmrgscheme=:simultaneous,
-        svd_alg=SVDAdjoint(; fwd_alg=TensorKit.SVD(), rrule_alg=GMRES(; tol=1e-10)),
-    ),
+    CTMRG(; tol=1e-10, verbosity=0, ctmrgscheme=:simultaneous),
     CTMRG(; tol=1e-10, verbosity=0, ctmrgscheme=:sequential),
 ]
 gradmodes = [
@@ -36,7 +31,7 @@ gradmodes = [
         LinSolver(; solver=KrylovKit.GMRES(; tol=gradtol), iterscheme=:fixed),
         LinSolver(; solver=KrylovKit.GMRES(; tol=gradtol), iterscheme=:diffgauge),
     ],
-    [
+    [  # Only use :diffgauge due to high gauge-sensitivity (perhaps due to small χenv?)
         nothing,
         GeomSum(; tol=gradtol, iterscheme=:diffgauge),
         ManualIter(; tol=gradtol, iterscheme=:diffgauge),

diff --git a/test/pwave.jl b/test/pwave.jl
@@ -10,7 +10,13 @@ unitcell = (2, 2)
 H = pwave_superconductor(InfiniteSquare(unitcell...))
 χbond = 2
 χenv = 16
-ctm_alg = CTMRG(; tol=1e-8, maxiter=150, verbosity=2, ctmrgscheme=:sequential)
+ctm_alg = CTMRG(;
+    tol=1e-8,
+    maxiter=150,
+    verbosity=2,
+    ctmrgscheme=:simultaneous,
+    svd_alg=SVDAdjoint(; rrule_alg=Arnoldi(; tol=1e-9, krylovdim=χenv + 30)),
+)
 opt_alg = PEPSOptimize(;
     boundary_alg=ctm_alg,
     optimizer=LBFGS(4; maxiter=10, gradtol=1e-3, verbosity=2),