09_sensitivity.R

# Sensitivity analysis of LPL variant rs115849089 & rs1801177 ----
# Clear environment
rm(list = ls())

# install.packages(c("ieugwasr", "readxl", "ggplot2"))
library(ggplot2)
rsids <- c("rs115849089", "rs1801177")

# Set working directory
wd <- "/Users/fredriklandfors/projekt/lipase_genmimicry"

# Multiple comparisons correction ----
m_comp = 9

# Graphical parameters ----
## scatter_plot ----
scatter.width = 2.4
scatter.height  = 2.4

scatter.hvline.color = "grey25"
scatter.hline.size = 0.3
scatter.vline.size = 0.3
scatter.abline.size = 0.3
scatter.smooth.size = 0.3
scatter.linerange.size = 0.3
scatter.axis.line = element_line(size = 0.4)
scatter.axis.ticks = element_line(size = 0.4)
scatter.plot.title = element_text(family = "Helvetica", size = 6, colour = "black", face = "bold", hjust = 0.5,
                                  margin = margin(1,1,1,1))
scatter.plot.subtitle = element_text(family = "Helvetica", size = 5, colour = "black", face = "italic", hjust = 0.5,
                                     margin = margin(1,1,2,1))
scatter.legend.text = element_text(family = "Helvetica", size = 4, colour = "black", face = "plain")
scatter.legend.key.size = unit(0, 'points')
scatter.legend.margin = margin(0, 0, 0, 0)
scatter.axis.title = element_text(family = "Helvetica", size = 5, face = "plain")
scatter.axis.text.x = element_text(family = "Helvetica", size = 5, colour = "black", face = "plain")
scatter.axis.text.y = element_text(family = "Helvetica", size = 5, colour = "black", face = "plain")
scatter.xlims = c(-3.5, 3.5)
scatter.ylims = c(-3.5, 3.5)
scatter.point.size = 1
scatter.stroke = 0.25

# # Nightingale 20 ----
# ## Get gwas ids ----
# gwas <- readxl::read_xlsx("./data/gwas_id.xlsx", sheet = "Nightingale_2020")
# 
# ## Get effect of SNP on serum triglycerides
# tg.n <- ieugwasr::associations(variants = rsids, id = "met-d-Total_TG")
# 
# ## Import data
# import_gwas.n <- function(rsid,
#                         gwas_ids,
#                         gene_name,
#                         scalevar,
#                         scalenum) {
#   # get data from UKBB (requires internet connection)
#   out <- ieugwasr::associations(rsid, gwas_ids)
# 
#   # define cat vars
#   out <- merge(gwas[c("gwas_id", "class")], out, by.x = "gwas_id", by.y = "id")
# 
#   # get std errors
#   out$se_min <- out$beta - out$se
#   out$se_max <- out$beta + out$se
# 
#   # scale with outcome var
#   out[, paste0("beta.", scalevar)] <- out$beta / scalenum
#   out[, paste0("se.", scalevar)] <- out$se / scalenum
#   out[, paste0("se_min.", scalevar)] <- out$beta / scalenum - abs(out$se / scalenum)
#   out[, paste0("se_max.", scalevar)] <- out$beta / scalenum + abs(out$se / scalenum)
# 
#   # rename
#   names(out) <- sapply(names(out), function(x) {paste0(x, ".", gene_name)})
# 
#   # return
#   return(out)
# }
# 
# ## Get rs115849089 [eQTL] (LPL) summary stats and return to df
# lpl_nmr.n1 <- import_gwas.n(
#   rsid = "rs115849089",
#   gwas_ids = gwas$gwas_id,
#   gene_name = "LPL1",
#   scalevar = "tg",
#   scalenum = subset(tg.n, rsid == "rs115849089")$beta
# )
# lpl_nmr.n2 <- import_gwas.n(
#   rsid = "rs1801177",
#   gwas_ids = gwas$gwas_id,
#   gene_name = "LPL2",
#   scalevar = "tg",
#   scalenum = -subset(tg.n, rsid == "rs1801177")$beta
# )
# 
# ## Bind to df
# cbind_df <- cbind(lpl_nmr.n1, lpl_nmr.n2)
# cbind_df$class.LPL1 <- ifelse(
#   is.na(cbind_df$class.LPL1),
#   "Other metabolites",
#   cbind_df$class.LPL1
# )
# cbind_df$class.LPL2 <- ifelse(
#   is.na(cbind_df$class.LPL2),
#   "Other metabolites",
#   cbind_df$class.LPL2
# )
# 
# ### Save to file
# write.table(
#   cbind_df, file = paste0(wd, "/data/sensitivity/sensitivity_Nightingale20.txt"), sep = "\t",
#   quote = FALSE, row.names = FALSE
# )

### import data ----
cbind_df <- data.table::fread(
  file = paste0(wd, "/data/sensitivity/sensitivity_Nightingale20.txt"), sep = "\t"
)
cbind_df <- as.data.frame(cbind_df)

# Remove scaling param
cbind_df <- subset(cbind_df, gwas_id.LPL1 != "met-d-Total_TG")

## Scatter plot ----
scatter_plot <- function(df,
                         title = "",
                         subtitle = "",
                         x_var, y_var,
                         scale_var = "TG",
                         x_gene, y_gene,
                         x_mut, y_mut,
                         x_rsid = "rsid.x", 
                         y_rsid = "rsid.y",
                         x_lim = c(-1, 1),
                         y_lim = c(-1, 1),
                         point_size = 2) {
  out <- ggplot(data = df, mapping = aes_string(x = x_var, y = y_var)) + 
    ggtitle(label = paste0(title),
            subtitle = paste0(subtitle)) +
    xlab(paste0(x_gene," (", x_rsid,"-", df[1, paste0("ea.", x_gene)], 
                " ", x_mut, ")\n[1-SD effect on parameter per 1-SD TG change]")) + 
    ylab(paste0(y_gene," (", y_rsid,"-", df[1, paste0("ea.", y_gene)],
                " ", y_mut, ")\n[1-SD effect on parameter per 1-SD TG change]")) + 
    scale_x_continuous(limits = x_lim, breaks = seq(-3, 3, 1)) +
    scale_y_continuous(limits = y_lim, breaks = seq(-3, 3, 1)) +
    geom_hline(yintercept = 0, size = scatter.hline.size, color = scatter.hvline.color, linetype = "solid") + 
    geom_vline(xintercept = 0, size = scatter.vline.size, color = scatter.hvline.color, linetype = "solid") +
    geom_abline(intercept = 0, slope = -1, color = "grey50", linetype = "dashed",
                size = scatter.abline.size) +
    geom_linerange(aes_string(
      xmin = paste0("se_min.", scale_var, x_gene), 
      xmax = paste0("se_max.", scale_var, x_gene)
    ), color = "grey75", size = scatter.linerange.size
    ) +
    geom_linerange(aes_string(
      ymin = paste0("se_min.", scale_var, y_gene), 
      ymax = paste0("se_max.", scale_var, y_gene) 
    ), color = "grey75", size = scatter.linerange.size
    ) +
    geom_smooth(method = "lm", formula = y ~ x, color = "black",
                linetype = "dashed", size = scatter.smooth.size, fullrange = TRUE,
                level = 1 - 0.05 / m_comp) +
    geom_point(aes_string(fill = paste0("class.", x_gene)), 
               size = point_size, stroke = scatter.stroke,
               alpha = 1, shape = 21, color = "black") +
    theme_classic() +
    theme(
      plot.title = scatter.plot.title,
      plot.subtitle = scatter.plot.subtitle,
      legend.title = element_blank(),
      legend.justification = c(1, 0),
      legend.position = c(1, 0.6),
      legend.key.size = scatter.legend.key.size,
      legend.text = scatter.legend.text,
      legend.margin = scatter.legend.margin,
      axis.title = scatter.axis.title,
      axis.text.x = scatter.axis.text.x,
      axis.text.y = scatter.axis.text.y,
      axis.line = scatter.axis.line,
      axis.ticks = scatter.axis.ticks
    ) +
    scale_fill_manual(breaks = c("ApoA-I", "ApoB", "VLDL", "IDL", "LDL",
                                 "HDL", "Fatty acids", "Other lipids", "Other metabolites"),
                      values = c("white", "black", "#00A08A", "#F98400", "#F2AD00",
                                 "#5BBCD6", "#FD6467", "#046C9A", "grey50")
    ) + 
    coord_fixed(ratio = 1)
  return(out)
}

## Draw plot ----
p1 <- scatter_plot(
  cbind_df,
  title = "HUMAN PLASMA: rs115849089-A vs. rs1801177-A",
  subtitle = "Systemic effects on metabolic parameters per 1-SD TG change",
  y_var = "beta.tg.LPL1",
  x_var = "beta.tg.LPL2",
  scale_var = "tg.",
  y_gene = "LPL1",
  x_gene = "LPL2",
  y_rsid = "rs115849089",
  x_rsid = "rs1801177",
  y_mut = "[eQTL]",
  x_mut = "[D36N]",
  y_lim = scatter.xlims,
  x_lim = scatter.ylims,
  point_size = scatter.point.size
)

## write to file ----
ggsave(plot = p1,
       path = paste0(wd, "/plots/sensitivity/"),
       filename = "sens1_derivation.pdf",
       width = scatter.width, height = scatter.height, units = "in", dpi = 1100)

## Regression analysis ----
f1 <- lm(formula = beta.tg.LPL1 ~ beta.tg.LPL2, data = cbind_df)
s1 <- summary(f1)

## Get coef confidence intervals ----
c1 <- confint(f1, level = 1 - 0.05 / m_comp)