supaernova.steps.posterior.model

[docs] module supaernova.steps.posterior.model
# Copyright 2025 Patrick Armstrongfrom typing importTYPE_CHECKING,ClassVar,overrideimport importlibimport numpy as npimport pandas as pdfrom supaernova.steps.backends importAbstractModelfrom supaernova.analysis.dispersion importDispersionPlotterfrom supaernova.analysis.distribution importDistributionPlotterfrom supaernova.configs.steps.posterior import(PosteriorStepResult,)from supaernova.configs.steps.posterior.posterior importPosteriorMapStageifTYPE_CHECKING:from logging importLoggerfrom pathlib importPathfrom collections.abc importCallablefrom supaernova.configs.paths importPathConfigfrom supaernova.configs.globals importGlobalConfigfrom supaernova.steps.nflow.model importNFlowModelfrom supaernova.configs.steps.posterior import(PosteriorStepAnalysis,)from supaernova.configs.steps.posterior.model importPosteriorModelConfigfrom .tf importTFPosteriorModelPosteriorModel=TFPosteriorModelclass PosteriorModelStep[Backend:str](AbstractModel[Backend]):[docs]
# --- Class Variables ---model_backend:ClassVar[dict[str,"Callable[[], type[PosteriorModel]]"]]={"TensorFlow":lambda:importlib.import_module(".tf",__package__).TFPosteriorModel,}id:ClassVar[str]="posterior_model"def __init__(self,config:"PosteriorModelConfig")->None:# --- Superclass Variables ---self.options:PosteriorModelConfigself.config:GlobalConfigself.paths:PathConfigself.log:Loggerself.force:boolself.verbose:boolsuper().__init__(config)# --- Config Variabls ---self.debug:boolself.profile:boolself.savepath:Pathself.nflow:NFlowModelself.subsets=(["train"]ifself.options.train_subsetelse[])+(["test"]ifself.options.test_subsetelse[])self.seed:int=self.options.seedself.seeds:list[int]=[self.seed+iforiinrange(self.options.iterations)]self.results:dict[str,dict[int,PosteriorStepResult]]self.models:dict[str,dict[int,PosteriorModel]]self.analysis:PosteriorStepAnalysis=self.options.analysis# --- Setup Variables ---self.n_chains_early:int=self.options.n_chains_earlyself.n_chains_mid:int=self.options.n_chains_midself.n_chains_final:int=self.options.n_chains_finalself.map_stage_init:PosteriorMapStageself.map_stage_early:PosteriorMapStageself.map_stage_mid:PosteriorMapStageself.map_stage_final:PosteriorMapStageself.map_stages:list[PosteriorMapStage]@overridedef _setup(self,*,nflow:"NFlowModel")->None:self.debug=self.options.debugself.profile=self.options.profileself.nflow=nflowself.nflow.load()forsubsetinself.subsets:forseedinself.seeds:self.options.subset=subsetself.options.seed=seedself._model(force=True)self.savepath=self.paths.out/self.model.name# --- Stages ---self.map_stage_init=PosteriorMapStage.model_validate({"stage":0,"name":"init","fname":"init","n_chains":1,"init":True,})self.map_stage_early=PosteriorMapStage.model_validate({"stage":1,"name":"random","fname":"random","n_chains":self.n_chains_early,"init_u_delta_av":"random","init_latents":"u_random","init_delta_av":"data","init_delta_m":"random","init_delta_p":"random","init_bias":"current",})self.map_stage_mid=PosteriorMapStage.model_validate({"stage":2,"name":"delta_m","fname":"delta_m","n_chains":self.n_chains_mid,"init_u_delta_av":"constant","init_latents":"u_constant","init_delta_av":"data","init_delta_m":"scale","init_delta_p":"random","init_bias":"current",})self.map_stage_final=PosteriorMapStage.model_validate({"stage":3,"name":"delta_av","fname":"delta_av","n_chains":self.n_chains_final,"init_u_delta_av":"data","init_latents":"z_constant","init_delta_av":"scale","init_delta_m":"constant","init_delta_p":"random","init_bias":"current",})self.map_stages=[self.map_stage_init,self.map_stage_early,self.map_stage_mid,self.map_stage_final,]@overridedef _completed(self)->bool:forsubsetinself.subsets:forseedinself.seeds:self.options.subset=subsetself.options.seed=seedself._model(force=True)savepath=self.savepath/subset/str(seed)/self.model.ckpt_pathifnot(savepath.exists()andany(savepath.iterdir())):self.log.debug(f"{self.name} has not completed as {savepath} does not exist")returnFalsereturnTrue@overridedef _load(self)->None:models={}forsubsetinself.subsets:models[subset]={}forseedinself.seeds:self.options.subset=subsetself.options.seed=seedself._model(force=True)self.log.debug(f"Loading final Posterior model weights from {self.savepath / subset / str(seed)}")self.model.load_checkpoint(self.savepath/subset/str(seed),load_map=True,load_hmc=True)models[subset][seed]=self.modelself.models=models@overridedef _run(self)->None:models={}forsubsetinself.subsets:models[subset]={}forseedinself.seeds:self.options.subset=subsetself.options.seed=seedself._model(force=True)ckpt_path=self.savepath/subset/str(seed)/self.model.ckpt_path# Don't retrain stages if you don't need toifself.forceornot(ckpt_path.exists()andany(ckpt_path.iterdir())):self.model.train_model(self.map_stages,savepath=self.savepath/subset/str(seed))else:self.log.debug(f"Loading weights from {ckpt_path}")self.model.load_checkpoint(self.savepath/subset/str(seed),load_map=True,load_hmc=True)self.model.save_checkpoint(self.savepath/subset/str(seed),save_map=True,save_hmc=True)models[subset][seed]=self.modelself.models=models@overridedef _result(self)->None:data=self.nflow.pae.data.dataresults={}forsubsetinself.subsets:results[subset]={}forseedinself.seeds:self.options.subset=subsetself.options.seed=seedmodel=self.models[subset][seed]map_results={"chain_min":model.map.chain_min.numpy(),"converged":model.map.converged.numpy(),"num_evaluations":model.map.num_evaluations.numpy(),"negative_log_prob":model.map.negative_log_prob.numpy(),"init_u_delta_av":model.map.u_delta_av.initial.numpy(),"init_u_latents":model.map.u_latents.initial.numpy(),"init_delta_av":model.map.delta_av.initial.numpy(),"init_delta_m":model.map.delta_m.initial.numpy(),"init_delta_p":model.map.delta_p.initial.numpy(),"init_z_latents":model.map.z_latents.initial.numpy(),"best_u_delta_av":model.map.u_delta_av.best.numpy(),"best_u_latents":model.map.u_latents.best.numpy(),"best_delta_av":model.map.delta_av.best.numpy(),"best_delta_m":model.map.delta_m.best.numpy(),"best_delta_p":model.map.delta_p.best.numpy(),"best_z_latents":model.map.z_latents.best.numpy(),}hmc_results={"samples":model.hmc.samples.numpy(),"step_sizes_final":model.hmc.step_sizes_final.numpy(),"is_accepted":model.hmc.is_accepted.numpy(),"u_delta_av":model.hmc.u_delta_av.numpy(),"u_latents":model.hmc.u_latents.numpy(),"delta_av":model.hmc.delta_av.numpy(),"z_latents":model.hmc.z_latents.numpy(),"delta_m":model.hmc.delta_m.numpy(),"delta_p":model.hmc.delta_p.numpy(),}model_results={"ind":data.ind,"sn_name":data.sn_name,"spectra_id":data.spectra_id,"map":map_results,"hmc":hmc_results,}results[subset][seed]=PosteriorStepResult.model_validate(model_results)self.results=results@overridedef _analyse(self)->None:forsubsetinself.subsets:subset_map_init_results={}subset_map_best_results={}subset_map_labels={}subset_hmc_samples={}subset_hmc_labels={}forseedinself.seeds:self.options.subset=subsetself.options.seed=seedmodel=self.models[subset][seed]results=self.results[subset][seed]map_init_results=[]map_best_results=[]map_labels={}ind=0ifmodel.map.nflow.physical_latents:map_init_results.append(results.map.init_u_delta_av)map_best_results.append(results.map.best_u_delta_av)map_labels[0]="μΔAᵥ"ind=1foriinrange(model.map.n_u_latents):map_labels[ind]=f"μ{i}"ind+=1map_init_results.append(results.map.init_u_latents)map_best_results.append(results.map.best_u_latents)ifmodel.map.pae.physical_latents:map_init_results.append(results.map.init_delta_av)map_best_results.append(results.map.best_delta_av)map_labels[ind]="ΔAᵥ"ind+=1foriinrange(model.map.n_z_latents):map_labels[ind]=f"z{i}"ind+=1map_init_results.append(results.map.init_z_latents)map_best_results.append(results.map.best_z_latents)ifmodel.map.pae.physical_latents:map_init_results.extend((results.map.init_delta_m,results.map.init_delta_p,))map_best_results.extend((results.map.best_delta_m,results.map.best_delta_p,))map_labels[ind]="Δℳ"ind+=1map_labels[ind]="Δp"map_init_results=np.concatenate(map_init_results,axis=-1)map_best_results=np.concatenate(map_best_results,axis=-1)subset_map_init_results[seed]=map_init_resultssubset_map_best_results[seed]=map_best_resultssubset_map_labels[seed]=map_labelshmc_labels={}hmc_ind=0ifmodel.map.train_delta_m:hmc_labels[hmc_ind]="Δℳ"hmc_ind+=1ifmodel.map.train_delta_p:hmc_labels[hmc_ind]="Δp"hmc_ind+=1ifmodel.map.nflow.physical_latents:hmc_labels[hmc_ind]="μΔAᵥ"hmc_ind+=1foriinrange(model.map.n_u_latents):hmc_labels[hmc_ind+i]=f"μ{i}"subset_hmc_labels[seed]=hmc_labelsifself.analysis.plot_map_initisnotNone:ifnotisinstance(self.analysis.plot_map_init,list):self.analysis.plot_map_init=[self.analysis.plot_map_init]foroptsinself.analysis.plot_map_init:o=opts.model_copy()ifo.labelsisNone:o.labels=map_labelsifo.nameisNone:o.name="map_init"ifo.savepathisNone:o.savepath=(self.paths.plots/str(self.seeds[0])/subset/str(seed))o.savepath.mkdir(parents=True,exist_ok=True)DistributionPlotter.plot_corner(map_init_results,o,statistics="max_central",)ifself.analysis.plot_map_bestisnotNone:ifnotisinstance(self.analysis.plot_map_best,list):self.analysis.plot_map_best=[self.analysis.plot_map_best]foroptsinself.analysis.plot_map_best:o=opts.model_copy()ifo.labelsisNone:o.labels=map_labelsifo.nameisNone:o.name="map_best"ifo.savepathisNone:o.savepath=(self.paths.plots/str(self.seeds[0])/subset/str(seed))o.savepath.mkdir(parents=True,exist_ok=True)DistributionPlotter.plot_corner(map_best_results,o,statistics="max_central",)ifself.analysis.plot_hmcisnotNone:ifnotisinstance(self.analysis.plot_hmc,list):self.analysis.plot_hmc=[self.analysis.plot_hmc]foroptsinself.analysis.plot_hmc:o=opts.model_copy()ifo.labelsisNone:o.labels=hmc_labelsifo.nameisNone:o.name="hmc"ifo.savepathisNone:o.savepath=(self.paths.plots/str(self.seeds[0])/subset/str(seed))o.savepath.mkdir(parents=True,exist_ok=True)samples=results.hmc.sampleschains=[samples[:,i,:]foriinrange(samples.shape[1])]subset_hmc_samples[seed]=np.mean(chains,axis=0)DistributionPlotter.plot_corner(chains,o,statistics="max_central",)# === Subset Plots ===ifself.analysis.plot_map_initisnotNone:ifnotisinstance(self.analysis.plot_map_init,list):self.analysis.plot_map_init=[self.analysis.plot_map_init]foroptsinself.analysis.plot_map_init:o=opts.model_copy()ifo.labelsisNone:o.labels=subset_map_labelsifo.nameisNone:o.name="map_init"ifo.savepathisNone:o.savepath=self.paths.plots/str(self.seeds[0])/subseto.savepath.mkdir(parents=True,exist_ok=True)DistributionPlotter.plot_corner(subset_map_init_results,o,statistics="max_central",)ifself.analysis.plot_map_bestisnotNone:ifnotisinstance(self.analysis.plot_map_best,list):self.analysis.plot_map_best=[self.analysis.plot_map_best]foroptsinself.analysis.plot_map_best:o=opts.model_copy()ifo.labelsisNone:o.labels=subset_map_labelsifo.nameisNone:o.name="map_best"ifo.savepathisNone:o.savepath=self.paths.plots/str(self.seeds[0])/subseto.savepath.mkdir(parents=True,exist_ok=True)DistributionPlotter.plot_corner(subset_map_best_results,o,statistics="max_central",)ifself.analysis.plot_hmcisnotNone:ifnotisinstance(self.analysis.plot_hmc,list):self.analysis.plot_hmc=[self.analysis.plot_hmc]foroptsinself.analysis.plot_hmc:o=opts.model_copy()ifo.labelsisNone:o.labels=subset_hmc_labelsifo.nameisNone:o.name="hmc"ifo.savepathisNone:o.savepath=self.paths.plots/str(self.seeds[0])/subseto.mean=Falseo.savepath.mkdir(parents=True,exist_ok=True)DistributionPlotter.plot_corner(subset_hmc_samples,o,statistics="max_central",)ifself.analysis.plot_dispersionisnotNone:ifnotisinstance(self.analysis.plot_dispersion,list):self.analysis.plot_dispersion=[self.analysis.plot_dispersion]foroptsinself.analysis.plot_dispersion:o=opts.model_copy()ifo.subset!=subset:continueifo.nameisNone:o.name="dispersion"ifo.savepathisNone:o.savepath=self.paths.plots/str(self.seeds[0])/subseto.savepath.mkdir(parents=True,exist_ok=True)data=(self.nflow.pae.model.stage.train_dataifsubset=="train"elseself.nflow.pae.model.stage.test_data)hmc=list(self.results[subset].values())twins=Noneifo.twinsisnotNone:twins_path=self.nflow.pae.data.data_dir/o.twinsiftwins_path.exists():twins=pd.read_csv(twins_path,delimiter=",")else:self.log.error(f"{twins_path} does not exist, can not load twins data.")legacy_data=Noneifo.legacyisnotNone:legacy_data={}forpino.legacy:legacy_path=self.nflow.pae.data.data_dir/piflegacy_path.exists():l_d=np.load(legacy_path,allow_pickle=True).item()fork,vinl_d.items():ifknotinlegacy_data:legacy_data[k]=velse:found=Falsefordiminrange(len(v.shape)):if(notfoundandlegacy_data[k].shape[dim]!=v.shape[dim]):legacy_data[k]=np.concatenate((legacy_data[k],v),axis=dim)found=Trueelse:self.log.error(f"{legacy_path} does not exist, can not load legacy data.")DispersionPlotter.plot_dispersion(data,hmc,o,twins=twins,legacy=legacy_data)