Reconnaître des phrases courtes ou mots-clés (comme "sauver", "fuir", "continuer") avec :
latence faible
pas de téléchargement lourd
fonctionnement immédiat même sur smartphone
Utiliser Picovoice Porcupine ou Speechly en WebAssembly :
reconnaît quelques mots-clés en <1 Mo
fonctionne sans modèle vocal externe
compatible Firefox
js
Copier
Modifier
// déclenche "sauver", "fuir", "oui", "non"
porcupine.start();
Quand tu veux plus de liberté vocale (phrases libres) :
Utiliser Whisper API, AssemblyAI, ou ton propre serveur avec Vosk Python
Ce n'est appelé que si besoin (ex : mode "reconnaissance libre")
Chaque scène Oravox contient les choix attendus à l’avance :
json
Copier
Modifier
{
"segment": "Choix1",
"expected": ["sauver", "fuir"],
"offlineRecognition": true
}
Et ton moteur sait quoi écouter sans tout comprendre.
plaintext
Copier
Modifier
[index.html]
├─ vosk.js (optionnel, lourd)
├─ porcupine.wasm (léger, mots-clés)
├─ app.js (écoute micro, logique JSON)
├─ optional STT cloud fallback (Whisper)
Pour aller plus vite :
Tu fais une détection du volume + temps de parole
Quand l’utilisateur parle, tu affiches : "Interprété comme : « fuir » ?" (avec UI de validation)
Aucun STT réel utilisé
Action Outil / Technique Gain
Souhaites-tu que je t’envoie un prototype minimal basé sur Picovoice + structure Oravox JSON + fallback ?
Ou bien une démo prête à intégrer dans ton Docker ?