Bonjour,
J'en rajoute une couche : effectivement un mélange enceinte BT + boîte à coin ferait office pour du son sans fil.
Pour ce qui est de la qualité du son, il n'y a pas que la qualité du HP qui compte, mais en général c'est l'élément prépondérant. Prendre compte la conception de l'enceinte ("maison") aussi, en fonction du bois utilisé, de la densité, du poids, et de la façon dont la maison est remplie (vide, rembourrée avec de la mousse ou autre) le comportement acoustique ne va pas être le même. Je suis bien incapable de dire quoi qu'est mieux, je pense qu'il faut tester (théoriquement ça se simule ... mais dans le contexte c'est overkill
).
Après, pour faire une séquence, il faut donc superviser, et là aussi je plussoie les précédents : WIFI c'est une méthode pratique pour le faire, qui limite au maximum les développements compliqués. Et on est complétement en train de faire de l'IoT
ESP32 l'avantage c'est que ce sont des cartes qui intègrent le WIFI et sont programmables en utilisant l'IDE Arduino. Après on peut utiliser une raspberry pour faire la supervision, et reprendre ce que tu as fait ici, juste au lieu d'envoyer des commandes en activant des GPIO, on envoie des commandes par WIFI. Mais un bête PC portable avec du WIFI peut faire office, aussi. Chaque maison à une IP fixe connue, avec ses sons dedans (genre avec une carte SD ou autre), on fait un réseau WIFI avec toutes les faisons dedans, et le superviseur envoie des commandes 'play' aux maisons individuellement.
IR : grmpf ... Avec des gens qui déambulent dans l'install ça risque vite d'être relou et tu vas rater des commandes. Ça ne me semble pas une bonne idée. Malheureusement, pour avoir un truc robuste il vaut mieux passer par de la radio (BT ou WIFI).
Une autre oeuvre techniquement assez proche sur laquelle j'avais vaguement contribué :
http://labo.feesdhiver.fr/portfolio/la-ligne-laterale/Florent avait fait une version beaucoup plus grande, dans laquelle la matrice de LEDs était découpée en sous-ensemble, chacun étant commandé par un Arduino avec un shield Ethernet, et il y avait un PC avec Max/MSP qui faisait la supervision et lançait les séquences. Ça faisait un réseau, et le superviseur allait dire à chaque carte quelle LED allumer à quel moment. Dans son cas, vu qu'il avait besoin d'une grande modularité, faire de l'Ethernet était une bonne solution, mais il avait des problèmes de latence - il fait des séquences très rapides avec des chaînes d'actions à moins de 10ms, et sur un gros système tel que celui-là ça ne se passait pas toujours bien.
Ce que tu veux faire est assez proche, mais sans fil, et au lieu de commander des relais tu lance des sons, mais c'est techniquement similaire, d'un point de vue système : un réseau d'actuateurs qui sont commandés en séquence.