Soporte nativo de audio texto->música/SFX en ComfyUI 0.26.0 capitalizado como
funciones del registry:
- comfyui_build_audio_workflow (pura): builder ACE-Step en API format. Cadena
CheckpointLoaderSimple -> TextEncodeAceStepAudio + ConditioningZeroOut +
EmptyAceStepLatentAudio -> ModelSamplingSD3 -> KSampler -> VAEDecodeAudio ->
SaveAudio. Params seconds/seed/steps/cfg/shift/lyrics. Tags comfyui,audio,ace-step.
- comfyui_fetch_output_audio (impura): baja el .flac/.wav/.mp3 del output (clave
'audio'). Hermana de comfyui_fetch_output_video, que no sirve para audio.
Modelo ACE-Step v1 3.5B (Apache 2.0, abierto). Stable Audio Open 1.0 descartado
por estar gated (HTTP 403) en HuggingFace. Cabe en 8GB con --lowvram.
Verificado e2e: 2 .flac reales generados desde texto (4.0s y 8.0s, seeds
distintos), duración exacta confirmada con ffprobe. Tests 6+5 verdes.
Co-Authored-By: Claude Opus 4.8 (1M context) <noreply@anthropic.com>