supaernova.steps.nflow.model

[docs] module supaernova.steps.nflow.model
# Copyright 2025 Patrick Armstrongfrom typing importTYPE_CHECKING,ClassVar,overrideimport importlibimport numpy as npfrom supaernova.steps.backends importAbstractModelfrom supaernova.configs.steps.nflow importNFlowStepResultfrom supaernova.analysis.distribution importDistributionPlotterifTYPE_CHECKING:from logging importLoggerfrom pathlib importPathfrom collections.abc importCallablefrom supaernova.configs.paths importPathConfigfrom supaernova.configs.globals importGlobalConfigfrom supaernova.steps.pae.model importPAEModelStepfrom supaernova.configs.steps.nflow.model importNFlowModelConfig,NFlowStepAnalysisfrom .tf importTFNFlowModelNFlowModel=TFNFlowModelclass NFlowModelStep[Backend:str](AbstractModel[Backend]):[docs]
# --- Class Variables ---model_backend:ClassVar[dict[str,"Callable[[], type[NFlowModel]]"]]={"TensorFlow":lambda:importlib.import_module(".tf",__package__).TFNFlowModel,}id:ClassVar[str]="nflow_model"def __init__(self,config:"NFlowModelConfig")->None:# --- Superclass Variables ---self.options:NFlowModelConfigself.config:GlobalConfigself.paths:PathConfigself.log:Loggerself.force:boolself.verbose:boolsuper().__init__(config)# --- Config Variabls ---self.debug:boolself.profile:boolself.savepath:Pathself.pae:PAEModelStepself.results:dict[str,NFlowStepResult]self.analysis:tuple[NFlowStepAnalysis]=self.options.analysis@overridedef _setup(self,*,pae:"PAEModelStep")->None:self.debug=self.options.debugself.profile=self.options.profileself.pae=paeself._model(force=True)self.savepath=self.paths.out/self.model.name@overridedef _completed(self)->bool:self._model(force=True)savepath=self.savepath/self.model.ckpt_pathifnot(savepath.exists()andany(savepath.iterdir())):self.log.debug(f"{self.name} has not completed as {savepath} does not exist")returnFalsereturnTrue@overridedef _load(self)->None:self._model(force=True)self.log.debug(f"Loading final NFlow model weights from {self.savepath}")self.model.load_checkpoint(self.savepath)@overridedef _run(self)->None:self._model(force=True)self.model.train_model(savepath=self.savepath)@overridedef _result(self)->None:self.log.debug(f"Saving final NFlow model weights to {self.savepath}")self.model.save_checkpoint(self.savepath)dt_results:dict[str,NFlowStepResult]={}fordtin["train","test"]:data=getattr(self.model.pae.stage,f"{dt}_data")sn_mask=getattr(self.model.pae.stage,f"{dt}_sn_mask")spec_mask=getattr(self.model.pae.stage,f"{dt}_spec_mask")input_phase=data.timeinput_amplitude=data.amplitudeinput_mask=data.masklatents=self.model.pae((input_phase,input_amplitude),training=False,mask=input_mask*spec_mask,)[0]inds=np.squeeze(np.array(sn_mask).astype(np.bool_),axis=(1,2))latents=latents[inds]z=latents[:,0,:4]ifnotself.model.physical_latents:z=z[:,1:]log_prob=self.model(z)u=self.model.z_to_u(z)uz=self.model.u_to_z(u)model_results={"ind":data.ind,"sn_name":data.sn_name,"spectra_id":data.spectra_id,"latents":z.numpy(),"log_prob":-log_prob.numpy(),"z_to_u":u.numpy(),"u_to_z":uz.numpy(),}dt_results[dt]=NFlowStepResult.model_validate(model_results)self.results=dt_results@overridedef _analyse(self)->None:self._model()z_labels={}u_labels={}labels={}ind=0ifself.model.physical_latents:z_labels[0]="ΔAᵥ"u_labels[0]="μΔAᵥ"labels[0]="z/μΔAᵥ"ind=1foriinrange(self.model.n_u_latents):z_labels[ind]=f"z{i}"u_labels[ind]=f"μ{i}"labels[ind]=f"z/μ{i}"ind+=1fordtin["train","test"]:results=self.results[dt]gaussian=np.random.normal(0,1,(results.z_to_u.size**2,ind))ifself.analysis.plot_u_latentsisnotNone:ifnotisinstance(self.analysis.plot_u_latents,list):self.analysis.plot_u_latents=[self.analysis.plot_u_latents]foroptsinself.analysis.plot_u_latents:o=opts.model_copy()ifo.labelsisNone:o.labels={"gaussian":u_labels,"u_latents":u_labels}ifo.nameisNone:o.name="u_latents"ifo.savepathisNone:o.savepath=self.paths.plots/dt/str(self.model.seed)o.savepath.mkdir(parents=True,exist_ok=True)DistributionPlotter.plot_corner({"gaussian":gaussian,"u_latents":results.z_to_u},o,statistics="max_central",shade_alpha=0.0,plot_cloud=True,)ifself.analysis.plot_z_latentsisnotNone:ifnotisinstance(self.analysis.plot_z_latents,list):self.analysis.plot_z_latents=[self.analysis.plot_z_latents]foroptsinself.analysis.plot_z_latents:o=opts.model_copy()ifo.labelsisNone:o.labels=z_labelsifo.nameisNone:o.name="z_latents"ifo.savepathisNone:o.savepath=self.paths.plots/dt/str(self.model.seed)o.savepath.mkdir(parents=True,exist_ok=True)DistributionPlotter.plot_corner(results.u_to_z,o,statistics="max_central",shade_alpha=0.0,plot_cloud=True,)ifself.analysis.plot_latentsisnotNone:ifnotisinstance(self.analysis.plot_latents,list):self.analysis.plot_latents=[self.analysis.plot_latents]foroptsinself.analysis.plot_latents:o=opts.model_copy()ifo.labelsisNone:o.labels={"z_latents":labels,"u_latents":labels,}ifo.nameisNone:o.name="latents"ifo.savepathisNone:o.savepath=self.paths.plots/dt/str(self.model.seed)o.savepath.mkdir(parents=True,exist_ok=True)u_latents=self.model.z_to_u(results.latents,permute=True).numpy()z_latents=self.model.u_to_z(u_latents,permute=True).numpy()DistributionPlotter.plot_corner({"u_latents":u_latents,"z_latents":z_latents},o,statistics="max_central",shade_alpha=0.0,plot_cloud=True,)ifself.analysis.plot_latent_stepsisnotNone:ifnotisinstance(self.analysis.plot_latent_steps,list):self.analysis.plot_latent_steps=[self.analysis.plot_latent_steps]foroptsinself.analysis.plot_latent_steps:num_steps=len(self.model.flow.bijector.bijectors)+1forstepinrange(num_steps):step_latents,is_shift=self.model.z_to_u_steps(results.latents,step,permute=True)ifis_shift:continueo=opts.model_copy()ifo.labelsisNone:o.labels={"gaussian":labels,f"step_{step}_latents":labels,}ifo.nameisNone:o.name=f"step_{step}_latent_steps"ifo.savepathisNone:o.savepath=(self.paths.plots/dt/str(self.model.seed)/"steps")o.savepath.mkdir(parents=True,exist_ok=True)DistributionPlotter.plot_corner({"gaussian":gaussian,f"step_{step}_latents":step_latents.numpy(),},o,statistics="max_central",shade_alpha=0.0,plot_cloud=True,)## === NFlowModel Specific Functions ===#