ESPHome: esphome/components/mixer/speaker/mixer_speaker.h Source File

#pragma once


#ifdef USE_ESP32


#include "esphome/components/audio/audio.h"

#include "esphome/components/audio/audio_transfer_buffer.h"

#include "esphome/components/ring_buffer/ring_buffer.h"

#include "esphome/components/speaker/speaker.h"


#include "esphome/core/component.h"

#include "esphome/core/helpers.h"

#include "esphome/core/static_task.h"


#include <ducking.h>  // esp-audio-libs


#include <freertos/event_groups.h>


#include <atomic>


namespace esphome::mixer_speaker {


/* Classes for mixing several source speaker audio streams and writing it to another speaker component.

 *  - Volume controls are passed through to the output speaker

 *  - Source speaker commands are signaled via event group bits and processed in its loop function to ensure thread

 * safety

 *  - Directly handles pausing at the SourceSpeaker level; pause state is not passed through to the output speaker.

 *  - Audio sent to the SourceSpeaker can have 8, 16, 24, or 32 bits per sample. Each source is converted to the output

 *    speaker's bit depth as it is mixed (or copied) into the output buffer.

 *  - Audio sent to the SourceSpeaker can have any number of channels. They are duplicated or ignored as needed to match

 *    the number of channels required for the output speaker.

 *  - In queue mode, the audio sent to the SourceSpeakers can have different sample rates.

 *  - In non-queue mode, the audio sent to the SourceSpeakers must have the same sample rates.

 *  - SourceSpeaker has an internal ring buffer. It also allocates a shared_ptr for an AudioTranserBuffer object.

 *  - Audio Data Flow:

 *      - Audio data played on a SourceSpeaker first writes to its internal ring buffer.

 *      - MixerSpeaker task temporarily takes shared ownership of each SourceSpeaker's AudioTransferBuffer.

 *      - MixerSpeaker calls SourceSpeaker's `process_data_from_source`, which transfers audio from the SourceSpeaker's

 *        ring buffer to its AudioTransferBuffer. Audio ducking is applied at this step.

 *      - In queue mode, MixerSpeaker prioritizes the earliest configured SourceSpeaker with audio data. Audio data is

 *        sent to the output speaker.

 *      - In non-queue mode, MixerSpeaker adds all the audio data in each SourceSpeaker into one stream that is written

 *        to the output speaker.

 */


class MixerSpeaker;


class SourceSpeaker : public speaker::Speaker, public Component {

 public:

  void dump_config() override;

  void setup() override;

  void loop() override;


  size_t play(const uint8_t *data, size_t length, TickType_t ticks_to_wait) override;

  size_t play(const uint8_t *data, size_t length) override { return this->play(data, length, 0); }


  void start() override;

  void stop() override;

  void finish() override;


  bool has_buffered_data() const override;


  void set_mute_state(bool mute_state) override;

  bool get_mute_state() override;


  void set_volume(float volume) override;

  float get_volume() override;


  void set_pause_state(bool pause_state) override { this->pause_state_ = pause_state; }

  bool get_pause_state() const override { return this->pause_state_; }


  size_t process_data_from_source(std::shared_ptr<audio::RingBufferAudioSource> &audio_source,

                                  TickType_t ticks_to_wait);


  void apply_ducking(uint8_t decibel_reduction, uint32_t duration);


  void set_buffer_duration(uint32_t buffer_duration_ms) { this->buffer_duration_ms_ = buffer_duration_ms; }

  void set_parent(MixerSpeaker *parent) { this->parent_ = parent; }

  void set_timeout(uint32_t ms) { this->timeout_ms_ = ms; }


  std::weak_ptr<audio::RingBufferAudioSource> get_audio_source() { return this->audio_source_; }


 protected:

  friend class MixerSpeaker;

  esp_err_t start_();

  void enter_stopping_state_();

  void send_command_(uint32_t command_bit, bool wake_loop = false);


  MixerSpeaker *parent_;


  std::shared_ptr<audio::RingBufferAudioSource> audio_source_;

  std::weak_ptr<ring_buffer::RingBuffer> ring_buffer_;


  uint32_t buffer_duration_ms_;

  uint32_t last_seen_data_ms_{0};

  optional<uint32_t> timeout_ms_;

  bool stop_gracefully_{false};


  bool pause_state_{false};


  esp_audio_libs::ducking::DuckingState ducking_state_{};


  std::atomic<uint32_t> pending_playback_frames_{0};

  std::atomic<uint32_t> playback_delay_frames_{0};  // Frames in output pipeline when this source started contributing

  std::atomic<bool> has_contributed_{false};        // Tracks if source has contributed during this session


  EventGroupHandle_t event_group_{nullptr};

  uint32_t stopping_start_ms_{0};

};


class MixerSpeaker : public Component {

 public:

  void dump_config() override;

  void setup() override;

  void loop() override;


  void init_source_speakers(size_t count) { this->source_speakers_.init(count); }

  void add_source_speaker(SourceSpeaker *source_speaker) { this->source_speakers_.push_back(source_speaker); }


  esp_err_t start(audio::AudioStreamInfo &stream_info);


  void set_output_channels(uint8_t output_channels) { this->output_channels_ = output_channels; }


  void set_output_bits_per_sample(uint8_t output_bits_per_sample) {

    this->output_bits_per_sample_ = output_bits_per_sample;

  }


  void set_output_speaker(speaker::Speaker *speaker) { this->output_speaker_ = speaker; }

  void set_queue_mode(bool queue_mode) { this->queue_mode_ = queue_mode; }

  void set_task_stack_in_psram(bool task_stack_in_psram) { this->task_stack_in_psram_ = task_stack_in_psram; }


  speaker::Speaker *get_output_speaker() const { return this->output_speaker_; }


  uint32_t get_frames_in_pipeline() const { return this->frames_in_pipeline_.load(std::memory_order_acquire); }


 protected:

  static void audio_mixer_task(void *params);


  EventGroupHandle_t event_group_{nullptr};


  FixedVector<SourceSpeaker *> source_speakers_;

  speaker::Speaker *output_speaker_{nullptr};


  uint8_t output_bits_per_sample_;

  uint8_t output_channels_;

  bool queue_mode_;

  bool task_stack_in_psram_{false};


  StaticTask task_;


  optional<audio::AudioStreamInfo> audio_stream_info_;


  std::atomic<uint32_t> frames_in_pipeline_{0};  // Frames written to output but not yet played

  uint32_t all_stopped_since_ms_{0};             // Debounce transient all-stopped windows before stopping task

};


}  // namespace esphome::mixer_speaker


#endif

audio.h

audio_transfer_buffer.h

esphome::Component
Definition component.h:145

esphome::FixedVector
Fixed-capacity vector - allocates once at runtime, never reallocates This avoids std::vector template...
Definition helpers.h:529

esphome::StaticTask
Helper for FreeRTOS static task management.
Definition static_task.h:15

esphome::audio::AudioStreamInfo
Definition audio.h:11

esphome::mixer_speaker::MixerSpeaker
Definition mixer_speaker.h:121

esphome::mixer_speaker::MixerSpeaker::queue_mode_
bool queue_mode_
Definition mixer_speaker.h:159

esphome::mixer_speaker::MixerSpeaker::get_frames_in_pipeline
uint32_t get_frames_in_pipeline() const
Returns the current number of frames in the output pipeline (written but not yet played)
Definition mixer_speaker.h:147

esphome::mixer_speaker::MixerSpeaker::all_stopped_since_ms_
uint32_t all_stopped_since_ms_
Definition mixer_speaker.h:167

esphome::mixer_speaker::MixerSpeaker::dump_config
void dump_config() override
Definition mixer_speaker.cpp:328

esphome::mixer_speaker::MixerSpeaker::start
esp_err_t start(audio::AudioStreamInfo &stream_info)
Starts the mixer task.
Definition mixer_speaker.cpp:425

esphome::mixer_speaker::MixerSpeaker::set_output_channels
void set_output_channels(uint8_t output_channels)
Definition mixer_speaker.h:136

esphome::mixer_speaker::MixerSpeaker::output_bits_per_sample_
uint8_t output_bits_per_sample_
Definition mixer_speaker.h:157

esphome::mixer_speaker::MixerSpeaker::add_source_speaker
void add_source_speaker(SourceSpeaker *source_speaker)
Definition mixer_speaker.h:128

esphome::mixer_speaker::MixerSpeaker::source_speakers_
FixedVector< SourceSpeaker * > source_speakers_
Definition mixer_speaker.h:154

esphome::mixer_speaker::MixerSpeaker::set_task_stack_in_psram
void set_task_stack_in_psram(bool task_stack_in_psram)
Definition mixer_speaker.h:142

esphome::mixer_speaker::MixerSpeaker::output_channels_
uint8_t output_channels_
Definition mixer_speaker.h:158

esphome::mixer_speaker::MixerSpeaker::get_output_speaker
speaker::Speaker * get_output_speaker() const
Definition mixer_speaker.h:144

esphome::mixer_speaker::MixerSpeaker::task_
StaticTask task_
Definition mixer_speaker.h:162

esphome::mixer_speaker::MixerSpeaker::set_output_speaker
void set_output_speaker(speaker::Speaker *speaker)
Definition mixer_speaker.h:140

esphome::mixer_speaker::MixerSpeaker::task_stack_in_psram_
bool task_stack_in_psram_
Definition mixer_speaker.h:160

esphome::mixer_speaker::MixerSpeaker::set_output_bits_per_sample
void set_output_bits_per_sample(uint8_t output_bits_per_sample)
Definition mixer_speaker.h:137

esphome::mixer_speaker::MixerSpeaker::set_queue_mode
void set_queue_mode(bool queue_mode)
Definition mixer_speaker.h:141

esphome::mixer_speaker::MixerSpeaker::frames_in_pipeline_
std::atomic< uint32_t > frames_in_pipeline_
Definition mixer_speaker.h:166

esphome::mixer_speaker::MixerSpeaker::loop
void loop() override
Definition mixer_speaker.cpp:350

esphome::mixer_speaker::MixerSpeaker::audio_mixer_task
static void audio_mixer_task(void *params)
Definition mixer_speaker.cpp:453

esphome::mixer_speaker::MixerSpeaker::event_group_
EventGroupHandle_t event_group_
Definition mixer_speaker.h:152

esphome::mixer_speaker::MixerSpeaker::output_speaker_
speaker::Speaker * output_speaker_
Definition mixer_speaker.h:155

esphome::mixer_speaker::MixerSpeaker::init_source_speakers
void init_source_speakers(size_t count)
Definition mixer_speaker.h:127

esphome::mixer_speaker::MixerSpeaker::audio_stream_info_
optional< audio::AudioStreamInfo > audio_stream_info_
Definition mixer_speaker.h:164

esphome::mixer_speaker::MixerSpeaker::setup
void setup() override
Definition mixer_speaker.cpp:336

esphome::mixer_speaker::SourceSpeaker
Definition mixer_speaker.h:47

esphome::mixer_speaker::SourceSpeaker::buffer_duration_ms_
uint32_t buffer_duration_ms_
Definition mixer_speaker.h:104

esphome::mixer_speaker::SourceSpeaker::ducking_state_
esp_audio_libs::ducking::DuckingState ducking_state_
Definition mixer_speaker.h:111

esphome::mixer_speaker::SourceSpeaker::start_
esp_err_t start_()
Definition mixer_speaker.cpp:247

esphome::mixer_speaker::SourceSpeaker::timeout_ms_
optional< uint32_t > timeout_ms_
Definition mixer_speaker.h:106

esphome::mixer_speaker::SourceSpeaker::get_volume
float get_volume() override
Definition mixer_speaker.cpp:296

esphome::mixer_speaker::SourceSpeaker::set_mute_state
void set_mute_state(bool mute_state) override
Mute state changes are passed to the parent's output speaker.
Definition mixer_speaker.cpp:284

esphome::mixer_speaker::SourceSpeaker::set_buffer_duration
void set_buffer_duration(uint32_t buffer_duration_ms)
Definition mixer_speaker.h:87

esphome::mixer_speaker::SourceSpeaker::parent_
MixerSpeaker * parent_
Definition mixer_speaker.h:99

esphome::mixer_speaker::SourceSpeaker::send_command_
void send_command_(uint32_t command_bit, bool wake_loop=false)
Definition mixer_speaker.cpp:234

esphome::mixer_speaker::SourceSpeaker::get_pause_state
bool get_pause_state() const override
Definition mixer_speaker.h:71

esphome::mixer_speaker::SourceSpeaker::get_mute_state
bool get_mute_state() override
Definition mixer_speaker.cpp:289

esphome::mixer_speaker::SourceSpeaker::setup
void setup() override
Definition mixer_speaker.cpp:83

esphome::mixer_speaker::SourceSpeaker::set_timeout
void set_timeout(uint32_t ms)
Definition mixer_speaker.h:89

esphome::mixer_speaker::SourceSpeaker::audio_source_
std::shared_ptr< audio::RingBufferAudioSource > audio_source_
Definition mixer_speaker.h:101

esphome::mixer_speaker::SourceSpeaker::playback_delay_frames_
std::atomic< uint32_t > playback_delay_frames_
Definition mixer_speaker.h:114

esphome::mixer_speaker::SourceSpeaker::finish
void finish() override
Definition mixer_speaker.cpp:278

esphome::mixer_speaker::SourceSpeaker::ring_buffer_
std::weak_ptr< ring_buffer::RingBuffer > ring_buffer_
Definition mixer_speaker.h:102

esphome::mixer_speaker::SourceSpeaker::stopping_start_ms_
uint32_t stopping_start_ms_
Definition mixer_speaker.h:118

esphome::mixer_speaker::SourceSpeaker::apply_ducking
void apply_ducking(uint8_t decibel_reduction, uint32_t duration)
Sets the ducking level for the source speaker.
Definition mixer_speaker.cpp:317

esphome::mixer_speaker::SourceSpeaker::get_audio_source
std::weak_ptr< audio::RingBufferAudioSource > get_audio_source()
Definition mixer_speaker.h:91

esphome::mixer_speaker::SourceSpeaker::play
size_t play(const uint8_t *data, size_t length) override
Definition mixer_speaker.h:54

esphome::mixer_speaker::SourceSpeaker::stop_gracefully_
bool stop_gracefully_
Definition mixer_speaker.h:107

esphome::mixer_speaker::SourceSpeaker::stop
void stop() override
Definition mixer_speaker.cpp:276

esphome::mixer_speaker::SourceSpeaker::play
size_t play(const uint8_t *data, size_t length, TickType_t ticks_to_wait) override
Definition mixer_speaker.cpp:215

esphome::mixer_speaker::SourceSpeaker::process_data_from_source
size_t process_data_from_source(std::shared_ptr< audio::RingBufferAudioSource > &audio_source, TickType_t ticks_to_wait)
Exposes the next ring buffer chunk (zero-copy) and ducks the freshly exposed bytes in place.
Definition mixer_speaker.cpp:298

esphome::mixer_speaker::SourceSpeaker::set_parent
void set_parent(MixerSpeaker *parent)
Definition mixer_speaker.h:88

esphome::mixer_speaker::SourceSpeaker::has_contributed_
std::atomic< bool > has_contributed_
Definition mixer_speaker.h:115

esphome::mixer_speaker::SourceSpeaker::pause_state_
bool pause_state_
Definition mixer_speaker.h:109

esphome::mixer_speaker::SourceSpeaker::dump_config
void dump_config() override
Definition mixer_speaker.cpp:71

esphome::mixer_speaker::SourceSpeaker::start
void start() override
Definition mixer_speaker.cpp:245

esphome::mixer_speaker::SourceSpeaker::enter_stopping_state_
void enter_stopping_state_()
Definition mixer_speaker.cpp:322

esphome::mixer_speaker::SourceSpeaker::set_volume
void set_volume(float volume) override
Volume state changes are passed to the parent's output speaker.
Definition mixer_speaker.cpp:291

esphome::mixer_speaker::SourceSpeaker::has_buffered_data
bool has_buffered_data() const override
Definition mixer_speaker.cpp:280

esphome::mixer_speaker::SourceSpeaker::last_seen_data_ms_
uint32_t last_seen_data_ms_
Definition mixer_speaker.h:105

esphome::mixer_speaker::SourceSpeaker::set_pause_state
void set_pause_state(bool pause_state) override
Definition mixer_speaker.h:70

esphome::mixer_speaker::SourceSpeaker::loop
void loop() override
Definition mixer_speaker.cpp:106

esphome::mixer_speaker::SourceSpeaker::event_group_
EventGroupHandle_t event_group_
Definition mixer_speaker.h:117

esphome::mixer_speaker::SourceSpeaker::pending_playback_frames_
std::atomic< uint32_t > pending_playback_frames_
Definition mixer_speaker.h:113

esphome::speaker::Speaker
Definition speaker.h:28

component.h

ring_buffer.h

helpers.h

duration
uint8_t duration
Definition msa3xx.h:0

esphome::mixer_speaker
Definition automation.h:8

uint32_t
static void uint32_t
Definition crash_handler.cpp:141

speaker.h

static_task.h

length
uint16_t length
Definition tt21100.cpp:0