supaernova.steps.posterior.tf.map

[docs] module supaernova.steps.posterior.tf.map
# Copyright 2025 Patrick Armstrongimport osfrom typing importTYPE_CHECKINGimport numpy as npos.environ["TF_USE_LEGACY_KERAS"]="1"os.environ["KERAS_BACKEND"]="tensorflow"os.environ["TF_DETERMINISTIC_OPS"]="1"os.environ["TF_ENABLE_ONEDNN_OPTS"]="0"import tensorflow as tffrom tensorflow_probability importdistributionsastfdifTYPE_CHECKING:from typing importSelffrom supaernova.steps.pae.tf importTFPAEModelfrom supaernova.steps.nflow.tf importTFNFlowModelfrom supaernova.configs.steps.data importDataStepResultfrom supaernova.steps.posterior.model importPosteriorModelStepfrom supaernova.configs.steps.posterior.tf importTFPosteriorModelConfigfrom supaernova.configs.steps.posterior.posterior importPosteriorMapStageclass PosteriorMapValue(tf.Module):[docs]
def __init__(self,initial:tf.Variable)->None:self.original:tf.Variable=initialself.initial:tf.Variable=initialself.current:tf.Variable=initialself.best:tf.Variable=initialclass PosteriorMap(tf.Module):[docs]
def __init__(self,config:"PosteriorModelStep[TFPosteriorModelConfig]",nflow:"TFNFlowModel",pae:"TFPAEModel",data:"DataStepResult",)->None:self.random_initial_positions:bool=config.random_initial_positions# Equivalent to `self.name = ...` but avoids tf / ks from tracking self.namevars(self)["nflow"]:TFNFlowModel=nflowvars(self)["pae"]:TFPAEModel=paeself.data:DataStepResult=dataself.sn_dim=self.data.amplitude.shape[0]self.spec_dim=self.data.amplitude.shape[1]self.wl_dim=self.data.amplitude.shape[2]self.n_u_latents=self.nflow.n_u_latentsself.n_flow_latents=self.nflow.n_flow_latentsself.n_z_latents=self.pae.n_z_latentsself.n_pae_latents=self.pae.n_pae_latentsself.n_pos=self.n_u_latents# === Training ===self.chain_min=tf.Variable(tf.zeros(self.sn_dim,dtype=tf.int32))self.converged=tf.Variable(tf.cast(tf.zeros(self.sn_dim,dtype=tf.int32),tf.bool))self.improved=tf.Variable(tf.cast(tf.zeros(self.sn_dim,dtype=tf.int32),tf.bool))self.num_evaluations=tf.Variable(0,dtype=tf.int32)self.num_chain_evaluations=tf.Variable(0,dtype=tf.int32)self.negative_log_prob=tf.Variable(np.inf*tf.ones(self.sn_dim,dtype=tf.float32))# === Priors ===self.u_delta_av_min:float=config.u_delta_av_minself.u_delta_av_max:float=config.u_delta_av_maxself.u_delta_av_start:float=config.u_delta_av_startself.u_delta_av_end:float=config.u_delta_av_endself.u_delta_av_mean:float=config.u_delta_av_meanself.u_delta_av_std:float=config.u_delta_av_stdself.u_delta_av_prior=tfd.Normal(loc=self.u_delta_av_mean,scale=self.u_delta_av_std)ifself.nflow.physical_latents:self.n_pos+=1self.u_latents_min:float=config.u_latents_minself.u_latents_max:float=config.u_latents_maxself.u_latents_mean:float=config.u_latents_meanself.u_latents_std:float=config.u_latents_stdself.u_latents_prior=tfd.MultivariateNormalDiag(loc=self.u_latents_mean*tf.ones(self.n_u_latents),scale_diag=self.u_latents_std*tf.ones(self.n_u_latents),)self.delta_av_min:float=config.delta_av_minself.delta_av_max:float=config.delta_av_maxself.delta_av_start:float=config.delta_av_startself.delta_av_end:float=config.delta_av_endself.delta_av_mean:float=config.delta_av_meanself.delta_av_std:float=config.delta_av_stdself.delta_av_prior=tfd.Normal(loc=self.delta_av_mean,scale=self.delta_av_std)self.train_delta_m:bool=config.train_delta_mself.delta_m_min:float=config.delta_m_minself.delta_m_max:float=config.delta_m_maxself.delta_m_start:float=config.delta_m_startself.delta_m_end:float=config.delta_m_endself.delta_m_mean:float=config.delta_m_meanself.delta_m_std:float=config.delta_m_stdself.delta_m_prior=tfd.Normal(loc=self.delta_m_mean,scale=self.delta_m_std)ifself.train_delta_m:self.n_pos+=1self.train_delta_p:bool=config.train_delta_pself.delta_p_min:float=config.delta_p_minself.delta_p_max:float=config.delta_p_maxself.delta_p_start:float=config.delta_p_startself.delta_p_end:float=config.delta_p_endself.delta_p_mean:float=config.delta_p_meanself.delta_p_std:float=config.delta_p_stdself.delta_p_prior=tfd.Normal(loc=self.delta_p_mean,scale=self.delta_p_std)ifself.train_delta_p:self.n_pos+=1self.train_bias:bool=config.train_biasself.bias_min:float=config.bias_minself.bias_max:float=config.bias_maxself.bias_start:float=config.bias_startself.bias_end:float=config.bias_endself.bias_mean:float=config.bias_meanself.bias_std:float=config.bias_stdself.bias_prior=tfd.Normal(loc=self.bias_mean,scale=self.bias_std)ifself.train_bias:self.n_pos+=1self.u_delta_av:PosteriorMapValue=PosteriorMapValue(tf.Variable(np.inf*tf.ones((self.sn_dim,1))))self.u_latents:PosteriorMapValue=PosteriorMapValue(tf.Variable(np.inf*tf.ones((self.sn_dim,self.n_u_latents))))self.z_latents:PosteriorMapValue=PosteriorMapValue(tf.Variable(np.inf*tf.ones((self.sn_dim,self.n_z_latents))))self.delta_av:PosteriorMapValue=PosteriorMapValue(tf.Variable(np.inf*tf.ones((self.sn_dim,1))))self.delta_m:PosteriorMapValue=PosteriorMapValue(tf.Variable(np.inf*tf.ones((self.sn_dim,1))))self.delta_p:PosteriorMapValue=PosteriorMapValue(tf.Variable(np.inf*tf.ones((self.sn_dim,1))))self.bias:PosteriorMapValue=PosteriorMapValue(tf.Variable(np.inf*tf.ones((self.sn_dim,1))))self.position:PosteriorMapValue=PosteriorMapValue(tf.Variable(np.inf*tf.ones((self.sn_dim,self.n_pos))))self.labels:list[str]=[]ifself.train_delta_m:self.labels.append("Δℳ")ifself.train_delta_p:self.labels.append("Δp")ifself.train_bias:self.labels.append("Bias")ifself.nflow.physical_latents:self.labels.append("μΔAᵥ")foriinrange(self.n_u_latents):self.labels.append(f"μ{i}")def setup([docs]
self,stage:"PosteriorMapStage",chain:int,)->None:# === Initial Values ===# Generate values for all params which will serve as their initial value.ifstage.init:init_all="random"ifself.random_initial_positionselse"data"stage.init_u_delta_av=init_allstage.init_latents="u_random"ifinit_all=="random"else"z_data"stage.init_delta_av=init_allstage.init_delta_m=init_allstage.init_delta_p=init_allstage.init_bias=init_allelse:# After initialisation:# If we're not training a variable, don't bother generating itifnotself.train_delta_m:stage.init_delta_m="current"ifnotself.train_delta_p:stage.init_delta_p="current"ifnotself.train_bias:stage.init_bias="current"# If we're not using u_delta_av in the nflow model, don't generate itifnotself.nflow.physical_latents:stage.init_u_delta_av="current"ifnotself.pae.physical_latents:# If we're not using delta_av in the pae model, don't generate itstage.init_delta_av="current"# If we're not using delta_m or delta_p in the pae model, they can't be generated from data, so set to a constant insteadifstage.init_delta_m=="data":stage.init_delta_m="constant"ifstage.init_delta_p=="data":stage.init_delta_p="constant"ifstage.init_bias=="data":stage.init_bias="constant"ifstage.init_latents[0]=="u":# If we're generating u_latents, then u_delta_av can't be generated from data, so set it to the same generation as init_latentsifstage.init_u_delta_av=="data":stage.init_u_delta_av=("random"ifstage.init_latents=="u_random"else"constant")# If we're generating u_latents, then delta_m and delta_p can't be generate from data, so set to constant insteadifstage.init_delta_m=="data":stage.init_delta_m="constant"ifstage.init_delta_p=="data":stage.init_delta_p="constant"# === Generating Latent Values ===# We are generating u_latents then transforming them to z_latentsifstage.init_latents[0]=="u":ifstage.init_latents=="u_random":u_latents=self.u_latents_prior.sample(self.sn_dim)elifstage.init_latents=="u_constant":u_latents=self.u_latents_mean*tf.ones((self.sn_dim,self.n_u_latents,))# We need to generate u_delta_avifself.nflow.physical_latents:ifstage.init_u_delta_av=="current":u_delta_av=self.u_delta_av.currentelifstage.init_u_delta_av=="best":u_delta_av=self.u_delta_av.bestelifstage.init_u_delta_av=="random":u_delta_av=self.u_delta_av_prior.sample((self.sn_dim,1))elifstage.init_u_delta_av=="constant":u_delta_av=self.u_delta_av_mean*tf.ones((self.sn_dim,1))elifstage.init_u_delta_av=="scale":u_delta_av_slope=(self.u_delta_av_end-self.u_delta_av_start)/stage.n_chainsu_delta_av_scale=(self.u_delta_av_start+(stage.n_chains-chain)*u_delta_av_slope)u_delta_av=tf.ones((self.sn_dim,1))*u_delta_av_scaleus=tf.concat([u_delta_av,u_latents],axis=-1)else:us=u_latents# Transform u_latents to z_latentsz_latents=self.nflow.u_to_z(us,permute=True)ifself.nflow.physical_latents:ifstage.init_delta_av=="data":delta_av=z_latents[:,0:1]z_latents=z_latents[:,1:]# We are generating z_latents then transforming them to u_latentselifstage.init_latents[0]=="z":ifstage.init_latents=="z_data":# Generate z_latents directly from datapae_input=tf.concat((self.data.time,self.data.amplitude),axis=-1)z_latents=self.pae(pae_input,training=False,mask=self.data.mask,)[0][:,0,:]ifself.pae.physical_latents:ifstage.init_delta_av=="data":delta_av=z_latents[:,0:1]ifstage.init_delta_m=="data":delta_m=z_latents[:,self.n_z_latents+1:self.n_z_latents+2]ifstage.init_delta_p=="data":delta_p=z_latents[:,self.n_z_latents+2:self.n_z_latents+3]z_latents=z_latents[:,1:self.n_z_latents+1]ifself.nflow.physical_latents:zs=tf.concat([delta_av,z_latents],axis=-1)else:zs=z_latentselse:# First generate u_latents, then transform to z_latents, finally modify the result somehow.ifstage.init_latents=="z_random":u_latents=self.u_latents_prior.sample(self.sn_dim)elifstage.init_latents=="z_constant":u_latents=self.u_latents_mean*tf.ones((self.sn_dim,self.n_u_latents,))# We need to generate u_delta_avifself.nflow.physical_latents:ifstage.init_u_delta_av=="current":u_delta_av=self.u_delta_av.currentelifstage.init_u_delta_av=="best":u_delta_av=self.u_delta_av.bestelifstage.init_u_delta_av=="scale":u_delta_av_slope=(self.u_delta_av_end-self.u_delta_av_start)/stage.n_chainsu_delta_av_scale=(self.u_delta_av_start+(stage.n_chains-chain)*u_delta_av_slope)u_delta_av=tf.ones((self.sn_dim,1))*u_delta_av_scaleelifstage.init_u_delta_av=="random"or(stage.init_u_delta_av=="data"andstage.init_latents=="z_random"):u_delta_av=self.u_delta_av_prior.sample((self.sn_dim,1))elifstage.init_u_delta_av=="constant"or(stage.init_u_delta_av=="data"andstage.init_latents=="z_constant"):u_delta_av=self.u_delta_av_mean*tf.ones((self.sn_dim,1))us=tf.concat([u_delta_av,u_latents],axis=-1)else:us=u_latents# Transform u_latents to z_latentszs=self.nflow.u_to_z(us,permute=True)ifself.nflow.physical_latents:# We want to modify zsifstage.init_delta_av=="best":delta_av=self.delta_av.bestelifstage.init_delta_av=="scale":delta_av_slope=(self.delta_av_end-self.delta_av_start)/stage.n_chainsdelta_av_scale=(self.delta_av_start+(stage.n_chains-chain)*delta_av_slope)delta_av=tf.ones((self.sn_dim,1))*delta_av_scaleelifstage.init_delta_av=="random":delta_av=self.delta_av_prior.sample((self.sn_dim,1))elifstage.init_delta_av=="constant":delta_av=self.delta_av_mean*tf.ones((self.sn_dim,1))elifstage.init_delta_av=="data":delta_av=zs[:,0:1]z_latents=zs[:,1:]zs=tf.concat([delta_av,z_latents],axis=-1)else:z_latents=zs# After generating z_latents, transform them to u_latentsu_latents=self.nflow.z_to_u(zs,permute=True)ifself.nflow.physical_latents:ifstage.init_u_delta_av=="data":u_delta_av=u_latents[:,0:1]u_latents=u_latents[:,1:]# === Preset Values ===# --- Current ---ifstage.init_u_delta_av=="current":u_delta_av=self.u_delta_av.currentifstage.init_latents=="current":u_latents=self.u_latents.currentz_latents=self.u_latents.currentifstage.init_delta_av=="current":delta_av=self.delta_av.currentifstage.init_delta_m=="current":delta_m=self.delta_m.currentifstage.init_delta_p=="current":delta_p=self.delta_p.currentifstage.init_bias=="current":bias=self.bias.current# --- Best ---ifstage.init_u_delta_av=="best":u_delta_av=self.u_delta_av.bestifstage.init_latents=="best":u_latents=self.u_latents.bestz_latents=self.u_latents.bestifstage.init_delta_av=="best":delta_av=self.delta_av.bestifstage.init_delta_m=="best":delta_m=self.delta_m.bestifstage.init_delta_p=="best":delta_p=self.delta_p.bestifstage.init_bias=="best":bias=self.bias.best# At this point, we are certain to have generated u_latents, z_latents, u_delta_av as well as any parameters with "data" generation# Now we cover all the other options# --- delta_av ---# For delta_av to have been generated, it must have occured in either z_random or z_constantifnot(stage.init_latents[0]=="z"andstage.init_latents!="z_data"andself.nflow.physical_latents):ifstage.init_delta_av=="scale":delta_av_slope=(self.delta_av_end-self.delta_av_start)/stage.n_chainsdelta_av_scale=(self.delta_av_start+(stage.n_chains-chain)*delta_av_slope)delta_av=tf.ones((self.sn_dim,1))*delta_av_scaleelifstage.init_delta_av=="random":delta_av=self.delta_av_prior.sample((self.sn_dim,1))elifstage.init_delta_av=="constant":delta_av=self.delta_av_mean*tf.ones((self.sn_dim,1))# --- delta_m ---ifstage.init_delta_m=="random":delta_m=self.delta_m_prior.sample((self.sn_dim,1))elifstage.init_delta_m=="scale":delta_m_slope=(self.delta_m_end-self.delta_m_start)/stage.n_chainsdelta_m_scale=(self.delta_m_start+(stage.n_chains-chain)*delta_m_slope)delta_m=tf.zeros((self.sn_dim,1))+delta_m_scaleelifstage.init_delta_m=="constant":delta_m=self.delta_m_mean*tf.ones((self.sn_dim,1))# --- delta_p ---ifstage.init_delta_p=="random":delta_p=self.delta_p_prior.sample((self.sn_dim,1))elifstage.init_delta_p=="scale":delta_p_slope=(self.delta_p_end-self.delta_p_start)/stage.n_chainsdelta_p_scale=(self.delta_p_start+(stage.n_chains-chain)*delta_p_slope)delta_p=tf.zeros((self.sn_dim,1))+delta_p_scaleelifstage.init_delta_p=="constant":delta_p=self.delta_p_mean*tf.ones((self.sn_dim,1))# --- bias ---ifstage.init_bias=="random":bias=self.bias_prior.sample((self.sn_dim,1))elifstage.init_biasin{"scale","constant"}:bias=self.bias_mean*tf.ones((self.sn_dim,1))delta_m=tf.clip_by_value(delta_m,self.delta_m_min,self.delta_m_max)delta_p=tf.clip_by_value(delta_p,self.delta_p_min,self.delta_p_max)bias=tf.clip_by_value(bias,self.bias_min,self.bias_max)u_delta_av=tf.clip_by_value(u_delta_av,self.u_delta_av_min,self.u_delta_av_max)u_latents=tf.clip_by_value(u_latents,self.u_latents_min,self.u_latents_max)position=[]ifself.train_delta_m:position.append(delta_m)ifself.train_delta_p:position.append(delta_p)ifself.train_bias:position.append(bias)ifself.nflow.physical_latents:position.append(u_delta_av)position.append(u_latents)position=tf.concat(position,axis=-1)self.u_delta_av.current=tf.Variable(u_delta_av)self.u_latents.current=tf.Variable(u_latents)self.z_latents.current=tf.Variable(z_latents)self.delta_av.current=tf.Variable(delta_av)self.delta_m.current=tf.Variable(delta_m)self.delta_p.current=tf.Variable(delta_p)self.bias.current=tf.Variable(bias)self.position.current=tf.Variable(position)ifstage.init:self.u_delta_av.original=self.u_delta_av.currentself.u_delta_av.initial=self.u_delta_av.currentself.u_delta_av.best=self.u_delta_av.currentself.u_latents.original=self.u_latents.currentself.u_latents.initial=self.u_latents.currentself.u_latents.best=self.u_latents.currentself.z_latents.original=self.z_latents.currentself.z_latents.initial=self.z_latents.currentself.z_latents.best=self.z_latents.currentself.delta_av.original=self.delta_av.currentself.delta_av.initial=self.delta_av.currentself.delta_av.best=self.delta_av.currentself.delta_m.original=self.delta_m.currentself.delta_m.initial=self.delta_m.currentself.delta_m.best=self.delta_m.currentself.delta_p.original=self.delta_p.currentself.delta_p.initial=self.delta_p.currentself.delta_p.best=self.delta_p.currentself.bias.original=self.bias.currentself.bias.initial=self.bias.currentself.bias.best=self.bias.currentself.position.original=self.position.currentself.position.initial=self.position.currentself.position.best=self.position.currentdef get_position(self,position,best=False)->tf.Tensor:[docs]
u_delta_av=self.u_delta_av.bestifbestelseself.u_delta_av.currentdelta_m=self.delta_m.bestifbestelseself.delta_m.currentdelta_p=self.delta_p.bestifbestelseself.delta_p.currentbias=self.bias.bestifbestelseself.bias.currenti=0ifself.train_delta_m:delta_m=position[:,i:i+1]i+=1ifself.train_delta_p:delta_p=position[:,i:i+1]i+=1ifself.train_bias:bias=position[:,i:i+1]i+=1ifself.nflow.physical_latents:u_delta_av=position[:,i:i+1]i+=1u_latents=position[:,i:]delta_m=tf.clip_by_value(delta_m,self.delta_m_min,self.delta_m_max)delta_p=tf.clip_by_value(delta_p,self.delta_p_min,self.delta_p_max)bias=tf.clip_by_value(bias,self.bias_min,self.bias_max)u_delta_av=tf.clip_by_value(u_delta_av,self.u_delta_av_min,self.u_delta_av_max)u_latents=tf.clip_by_value(u_latents,self.u_latents_min,self.u_latents_max)returntf.concat([delta_m,delta_p,bias,u_delta_av,u_latents],axis=-1)def prior(self,position)->tf.Tensor:[docs]
log_prior=tf.zeros((position.shape[0],))inf_prior=-tf.ones_like(log_prior)*np.infdelta_m=position[:,0:1]delta_p=position[:,1:2]bias=position[:,2:3]u_delta_av=position[:,3:4]u_latents=position[:,4:]u_latents_log_prior=self.u_latents_prior.log_prob(u_latents)log_prior+=tf.where(tf.math.is_nan(u_latents_log_prior),inf_prior,u_latents_log_prior)ifself.train_delta_m:delta_m_log_prior=self.delta_m_prior.log_prob(delta_m)[:,0]log_prior+=tf.where(tf.math.is_nan(delta_m_log_prior),inf_prior,delta_m_log_prior)ifself.train_delta_p:delta_p_log_prior=self.delta_p_prior.log_prob(delta_p)[:,0]log_prior+=tf.where(tf.math.is_nan(delta_p_log_prior),inf_prior,delta_p_log_prior)ifself.train_bias:bias_log_prior=self.bias_prior.log_prob(bias)[:,0]log_prior+=tf.where(tf.math.is_nan(bias_log_prior),inf_prior,bias_log_prior)ifself.nflow.physical_latents:u_delta_av_log_prior=self.u_delta_av_prior.log_prob(u_delta_av)[:,0]log_prior+=tf.where(tf.math.is_nan(u_delta_av_log_prior),inf_prior,u_delta_av_log_prior)returnlog_prior