RECONNAISSANCE VOCALE

CPAS
Posts: 72
Joined: Thu Jun 12, 2025 9:36 am

RECONNAISSANCE VOCALE

Post by CPAS »

pour l'instant je travaille sur une API qui communique avec whisper d'openai

j'utilise la clé API openai de ton compte, Serge, et j'aimerais que tu regardes pour une manière d'activer des crédits. les seuls infos que je trouve sont celles de ce genre :
The Whisper API charges $0.006 per minute for on-demand speech-to-text services, making it a cost-effective option for developers.
mais je ne vois pas où payer cela, peut-etre par le panneau de openai.

Serge, peux-tu regarder à ça ?

edit : peut-etre par ici, si tu lui glisses 10 balles on peut tester si il se sert dedans
info sur le prépaiement : https://help.openai.com/en/articles/826 ... id-billing
la page en question : https://platform.openai.com/account/billing

pour avoir ta clé API : https://platform.openai.com/api-keys
User avatar
SergeV
Posts: 146
Joined: Thu Jun 12, 2025 10:00 am
Contact:

Re: RECONNAISSANCE VOCALE

Post by SergeV »

le payement est fait tu devrais avoir 10euro sur open AI . c'est un ordre permanent.
donc cela devrais aller non?
?
Dioxine de Pourpre : Magicien : Nothing is real.
CPAS
Posts: 72
Joined: Thu Jun 12, 2025 9:36 am

Re: RECONNAISSANCE VOCALE

Post by CPAS »

non, j'ai besoin de créer une clé API avec TON compte.

est-ce que rustdesk fonctionne ?
sinon je viendrai jeudi générer la clé
CPAS
Posts: 72
Joined: Thu Jun 12, 2025 9:36 am

Re: RECONNAISSANCE VOCALE

Post by CPAS »

Ca y est, j'ai réussi, en fait c'est simple et plein d'enseignements :

demander à une IA de t'expliquer un PRODUIT DE LA MEME SOCIETE : NON
cherche à l'ancienne sur le site d'openai après le fonctionnement de l'API de whisper : OUI

du coup je sais utiliser whisper en bash avec curl
du coup je sais utiliser whisper avec php

il reste plus qu'à contrôler ca avec javascript

du coup le workflow c'est :
- enregistrer de l'audio avec JS
-> envoyer l'audio en PHP et recevoir la transcription
-> en JS utiliser la transcription pour controler oravox
User avatar
MyQ
Posts: 19
Joined: Thu Jun 12, 2025 11:28 am
Contact:

Re: RECONNAISSANCE VOCALE

Post by MyQ »

Excellente nouvelle !!!
Avez-vous une estimation du temps de transaction ?
Ce n'est pas pour rien qu'il est plus facile de resserrer maintenant que plus tard, vous savez, la multiplication.

Un gros câlin, génial !
[google]
CPAS
Posts: 72
Joined: Thu Jun 12, 2025 9:36 am

Re: RECONNAISSANCE VOCALE

Post by CPAS »

Ca prend moins que le temps de l'audio, du coup pour une écoute de commande de 5 secondes ca prendra max 2 secondes de traitement, c'est parfaitement jouable !
CPAS
Posts: 72
Joined: Thu Jun 12, 2025 9:36 am

Re: RECONNAISSANCE VOCALE

Post by CPAS »

Vous êtes pas prêts.

Vous êtes vraiment pas prêts.


Faites-moi plaisir, amusez-vous ; mais attention, ça coûte (précisément) 0.0001$ la seconde.

Voilà comment ça marche : vous cliquez, ca enregistre 3 secondes, et ca vous affiche la transcription.

ORAVOX RECONNAISSANCE VOCALE TEST

C'est beau.

EDIT: bonus, le fichier audio (un blob webm) est même pas écrit sur le disque, il est envoyé direct au PHP (avec php://input), du coup pas de charge disque, pas de probème de confidentialité des données... je me suprend moi-même.
User avatar
SergeV
Posts: 146
Joined: Thu Jun 12, 2025 10:00 am
Contact:

Re: RECONNAISSANCE VOCALE

Post by SergeV »

Je viens de rentrer de bxl, un peu déconnecté.

Effectivement nous ne sommes tous pas pret! hahahah j'adore
patttttaaaattte donc ca marche!! hhhoooo genial hate d'essayer en vrai
donc c'est parti.
Super Xavier

Pour les histoires il serait évidement plus long le temps d'enregistrement je dirais 8 à 10 secondes.?
Dioxine de Pourpre : Magicien : Nothing is real.
CPAS
Posts: 72
Joined: Thu Jun 12, 2025 9:36 am

Re: RECONNAISSANCE VOCALE

Post by CPAS »

oui on peut bien sur augmenter au temps qu'on veut.

les implications sont les suivantes :

- le temps de transcription sera plus long d'une seconde ou deux
- ca coutera plus cher (0.001$ au lieu de 0.0003$ la transcription. donc ca fera 1$ les 10.000 transcriptions

je pense que c'est jouable. par contre je pense pas que ca soit utile, 3 secondes c'est court mais 5 secondes c'est long comme ma
je vais passer la page de test à 5 secondes pour que tu te rendes compte


EDIT BORDEL LE SITE EST ENCORE DOWN, J'EN PEUX PLUS DE CE DNS DE MIERDA

( pour jean-yves et les autres qui se connectent de l'extérieur : l'adresse du serveur c'est 91.182.178.235 )
( ainsi vous savez vous connecter sans le DNS de l'enfer )
CPAS
Posts: 72
Joined: Thu Jun 12, 2025 9:36 am

Re: RECONNAISSANCE VOCALE

Post by CPAS »

bon, restons sur du concret, j'ai besoin d'avancer

je vais prochainement intégrer ce code de transcription au site, mais j'ai besoin d'infos

je pensais fonctionner ainsi :

le fichier mp3 des histoires oravox a un petit jingle a la fin. ce jingle fait *ting* et je vais faire en sorte que la reconnaissance vocale fonctionne dès cet instant. ensuite, il y a 5 secondes pour la reconnaissance vocale, puis on "réserve" encore 5 secondes pour etre certain que le traitement soit effectué entretemps. ca fait en tout 10 secondes. peut-on se mettre d'accord que chaque oravox aura ce jingle spécifique 10 secondes avant la fin du mp3 ?

ainsi, quelques secondes après l'envoi de la commande vocale, le lecteur oravox réagit et change le chapitre en fonction du choix
si la commande est invalide, on lance un timeout OU on attend une commande manuelle OU on relance la détection vocale, ca peut etre au choix
User avatar
SergeV
Posts: 146
Joined: Thu Jun 12, 2025 10:00 am
Contact:

Re: RECONNAISSANCE VOCALE

Post by SergeV »

100% correct.. 5 secondes et si pas de réponse 5 seconde max en plus, avant un timeout "généralisé" pour toutes les stories
nous pouvons calculer le prix coutant comme cela, sur la base maxi de 10 secondes. tous les reste quand c'est plus court sera du bénéfice suppl.
Les prix me sembles correcte, mais attendons de voir si surprise il y a. C'est parti !!!!
Cours Forest cours

Serge
Dioxine de Pourpre : Magicien : Nothing is real.
User avatar
MyQ
Posts: 19
Joined: Thu Jun 12, 2025 11:28 am
Contact:

Re: RECONNAISSANCE VOCALE

Post by MyQ »

OK, ça a l'air bien.
Concernant le DNS : DuckDNS est constamment attaqué par des attaques DDoS. Il faudra voir qui gagne. La seule solution serait d'utiliser le fichier « HOSTS » ou d'usurper le DNS local. Au fait, ce n'est pas la première fois que Duck est attaqué, et ils ont remporté toutes les guerres précédentes.
[google]
User avatar
SergeV
Posts: 146
Joined: Thu Jun 12, 2025 10:00 am
Contact:

Re: RECONNAISSANCE VOCALE

Post by SergeV »

Idée : remettre des bonus aux rapides. !!! pour arrivé a une moyenne de 3-4 secondes.
Dioxine de Pourpre : Magicien : Nothing is real.
CPAS
Posts: 72
Joined: Thu Jun 12, 2025 9:36 am

Re: RECONNAISSANCE VOCALE

Post by CPAS »

ok, si l'idée c'est de pouvoir relancer la reconnaissance, alors c'est mieux que je sépare les responsabilités :

1) l'audio raconte l'histoire. il n'y a pas de jingle à la fin du mp3
2) quand l'audio est fini, le script déclenche le jingle dans un mp3 dédié à ça, enregistre 5 secondes, transcripte, et si rien de probant n'en sort, recommence une fois l'opération et si toujours rien -> timeout

on fait comme ça ?

si oui : Serge, envoie-moi un mp3 avec le jingle de fin de chapitre

pour duckdns : ok j'avais pas envisagé qu'ils se fassent DDoS, désolé pour eux, je vais les maudire avec compassion du coup
User avatar
SergeV
Posts: 146
Joined: Thu Jun 12, 2025 10:00 am
Contact:

Re: RECONNAISSANCE VOCALE

Post by SergeV »

je me rend compte des problèmes de dns et donc, question sommes nous a ce titre vulnérables?
Tous les systèmes sont t'il vulnérables et cela n'ouvre t'il pas la boite de pandore? passible pour des attaques? générales?

En 2 pour le jungle de fin je vais voir ce que j'ai en stock te remet cela aujourd'hui voir maintenant en fonction de ce que j'ai.
Dis moi si c'est bien ce qu'il te faut?
Attachments
Jingle.mp3
(547.96 KiB) Downloaded 2 times
Dioxine de Pourpre : Magicien : Nothing is real.
User avatar
MyQ
Posts: 19
Joined: Thu Jun 12, 2025 11:28 am
Contact:

Re: RECONNAISSANCE VOCALE

Post by MyQ »

Concernant le DNS [encore une fois] : pour ceux qui sont intéressés, vous pouvez vérifier cela en temps réel, par pays et par statut ici :
https://downforeveryoneorjustme.com/duc ... st-outages
User avatar
SergeV
Posts: 146
Joined: Thu Jun 12, 2025 10:00 am
Contact:

Re: RECONNAISSANCE VOCALE

Post by SergeV »

Ola,
bien je pense que pour évité ce bigbug, si il serait bon de tout transvaser sur oravox quitte a payer directement le solde du nom oravox.com , si c'est le problème. Il reste a payer 450euro! est-ce pertinent? je pense que beaucoup de problèmes vont etre résolus non.???
Breef c'est Serge, le nul de la bande
Serge
Dioxine de Pourpre : Magicien : Nothing is real.
User avatar
SergeV
Posts: 146
Joined: Thu Jun 12, 2025 10:00 am
Contact:

Re: RECONNAISSANCE VOCALE

Post by SergeV »

voici un jungle. c'est ppas vraiment le bon mais il a un nom en attendant.

Remarques : tu en pense quoi perso Xavier on met directement 8 secondes max et ensuite directement le timeout y a t'il un intérêt a diviser la demande d'enregistrement? et ou est l'intérêt en fait?
Dioxine de Pourpre : Magicien : Nothing is real.
CPAS
Posts: 72
Joined: Thu Jun 12, 2025 9:36 am

Re: RECONNAISSANCE VOCALE

Post by CPAS »

c'est cette partie du jingle que je veux

l'intéret de ne pas enregistrer trop, c'est d'avoir un temps de transcritpion plus court, moins cher, et d'avoir moins de bruit parasite (8 secondes c'est long pour ne pas avoir de gens qui parlent à coté de l'utilisateur et risquent d'ajouter des commandes non désirées

pour les 450€, c'est pas moi le gestionnaire du budget
(mais à titre très personnel je pense que cet argent serait mieux dans ta poche (ou la mienne) que dans la leur)
et d'un point de vue technique, il n'y a aucun intéret à avoir un site plutot qu'un DNS parce que je ne veux pas migrer le projet sur un serveur externe, je veux garder le controle total et donc il faudra de toute facon un DNS, mais je suis trop occupé pour me charger de la migration.
on peut continuer à utiliser duckdns et voir s'il continue à se faire attaquer.
par contre, les attaques DDoS ne concernent que lui, à ma connaissance nous on ne risque rien à part avoir un site inacessible (bon c'est vrai que c'est comme si on se faisait DDoS nous-mêmes en somme...)
Attachments
jingle.mp3
(55.52 KiB) Downloaded 5 times
User avatar
SergeV
Posts: 146
Joined: Thu Jun 12, 2025 10:00 am
Contact:

Re: RECONNAISSANCE VOCALE

Post by SergeV »

tu as toujours besoin de cette cloche ou pas je recherche?
ok je vois donc mettre la cloche a chaque début d'enregistrement x2? de type : ding......ding......timeout. C'est très bien !
ca donne du rythme parfait. on vera a l'ecoute si c'est pas trop agressif
Dioxine de Pourpre : Magicien : Nothing is real.
Post Reply

Who is online

Users browsing this forum: No registered users and 1 guest