Google2ubuntu – Le projet de reconnaissance vocale pour GNU/Linux a un nouveau développeur


Google2Ubuntu est un projet qui a pour but de vous permettre de lancer certaines actions, à l’aide d’un système de reconnaissance vocal dépendant de l’API Google. Vous pourrez ainsi lancer une application, influer sur le volume ou sur la luminosité de votre écran, effectuer des recherches sur certaines plateformes et tout cela, au simple son de votre petite voix fluette. Pour se faire Google2ubuntu va d’abord vous demander d’enregistrer une petite séquence de 5 secondes et une fois que votre voix est dans la boîte, l’application va se servir de l’API Google par laquelle va transiter l’instruction vocale, qui sera ensuite retournée sous forme de texte.

Alors si ça vous intéresse, je vous conseille de vous rendre sur cette page des forums Ubuntu (fr), où vous pourrez en savoir beaucoup plus et suivre l’évolution de ce projet qui soit-dit en passant, a été repris depuis peu par Benoit Franquet.

Vous pouvez aussi vous rendre sur la page Github du projet et enfin si vous voulez tester l’application, vous pouvez l’installer sur Ubuntu et dérivés à l’aide du PPA suivant et de ces quelques lignes de commande :

sudo add-apt-repository ppa:benoitfra/google2ubuntu
sudo apt-get update
sudo apt-get install google2ubuntu

Si vous voulez voir ce que ça donne en action vous pouvez visionner cette vidéo de démonstration :

J’ai vraiment trouvé cette application et l’idée très sympa, même si je n’ai pas encore pris le temps de la tester en profondeur. Cela dit j’en ai vu assez pour avoir envie de suivre son évolution et j’ai hâte de la voir s’enrichir en fonctions.

Amusez-vous bien.

Merci à Benoit pour le signalement et bon courage ;)




7 Responses

  1. Oto 6 février 2014 / 21 h 49 min

    Joli travail, toutefois je suis trés réservé sur la mise en pratique, malgré (1) la qualité de la reconnaissance vocale, (2) l’excellente intégration dans Ubuntu et (3) les possibilités de paramétrer trés finement l’application à ses goûts et besoins.

    Tout d’abord parce que la vidéo nous montre des temps de latences importants entre la commande et la réalisation de l’action. A ce jeu je préfère (l’également excellent) easystroke qui me permet d’utiliser la reconnaissance de mouvements de souris pour déclencher actions ou programmes avec une superbe réactivité.

    Par ailleurs, je rejoins « poum » dans son commentaire : les données que j’envoie à Google, je n’ai aucune certitude qu’elle n’y soient pas analysées ou conservées.

    Surtout, je m’interroge sur le fonctionnement de l’ensemble lorsque je ne suis pas connecté à internet… ce qui m’arrive tout de même trés souvent lorsque je me déplace (oui, j’ai un portable et, non, je n’utilise pas toujours mon routeur 4G). Alors même que nos machines embarquent des monstres de puissance de calcul (CPU multicoeurs, GPU) les données vocales sont transmises pour exploitation à distance ! Cela me ‘gratte’ un peu en terme d’architecture technique.

    Bref, autant que mon avis intéresse quelqu’un, je suggère de ramener en local le traitement de reconnaissance vocal. Mais il me semblerait dommage de s’arrêter là ! Une fusion avec easystroke dans un outil permettant d’enclencher des actions ou programmes sur reconnaissance vocale et gestuelle me paraîtrait à la fois un aboutissement plus naturel et beaucoup plus intéressant pour les utilisateurs (dont je suis).

    Je termine sur une remarque importante : merci encore à Noireaude de m’avoir fait découvrir un composant logiciel que je ne connaissais pas, un développeur de talent en la personne de Benoît Franquet et… bravo à tous d’avoir suivi mes commentaires jusqu’à leur conclusion ;)

    Oto

    • noireaude 6 février 2014 / 22 h 06 min

      Je suis d’accord avec ton analyse et il me paraît aussi important de ramener la reconnaissance vocale en local, ce qui techniquement peut se faire si remplacer l’API Google est dans la feuille de route du projet. Ça permet aussi et tu fais bien de le faire remarquer, car ça colle à ce que je vais dire plus bas, de se départir d’une connexion internet. C’est très important et pas seulement pour une histoire de latence.

      C’est important car le seul détail avec lequel je ne suis pas obligatoirement d’accord avec toi c’est sur le parallèle avec les mouvements de souris, car Google2ubuntu peut apporter un plus aux aveugles et aux mal voyants (comme le dit fibi plus bas). Ce qu’un mouvement de souris ne peut pas faire (ou moins bien). C’est une application qui peut aller beaucoup plus loin qu’un simple gadget pour GNU/Linux.

      Alors bien entendu il existe déjà d’autre systèmes pour les mal voyants, mais sont ils Libres? Je ne sais pas…. Gnome a beaucoup fait dans son environnement pour intégrer des options d’accessibilité, bien plus que les autres environnements d’ailleurs. À ce titre et dans cette optique je pense que Google2ubuntu a une très bonne carte à jouer, car on peut être « aveugle et libriste » et qu’à ma connaissance il n’y a pas grand-chose qui allie les deux pour le moment :)

      En tout cas merci d’avoir pris le temps d’écrire un commentaire de qualité et vraiment intéressant :)

      • fibi 7 février 2014 / 18 h 33 min

        Oui j’aurai tendance à dire à Oto cette version a été finalisée il y a peu et que des améliorations peuvent donc encore intervenir.

        Vous vous posez des questions sur le paramétrage de l’application. A priori celui-ci devrait gagner en facilité avec le temps (bien que pour l’instant c’est tout à fait faisable :) ).

        Il se trouve que j’utilise également Easystroke que je trouve très pratique (j’ouvre plusieurs applications avec régulièrement) mais pour moi c’est loin d’être facile à paramétrer pour le coup.

        Ensuite loin de moi de vouloir faire l’apologie de Google, je sais, c’est le Mal mais ça peut-être aussi le Bien. Et puis si je lance une recherche en vocal sur « Paris »… Ça n’est pas non plus de la plus grande importance.

        Chrome et Chromium ont par exemple beaucoup plus d’extensions fonctionnelles pour l’accessibilité que Firefox par exemple.

        Alors oui le Libre propose des choses intéressantes (Gnome, KDE, Orca des environnement ont vu le jour – Sonar -Vinux- Oralux- Beaucoup de travail sur la reconnaissance vocale mais rien de vraiment « probant ».

        Par contre Easystroke + Google2Ubuntu + des extensions + des logiciels qui voient le jour en ce moment (loupe d’écran, filtre d’écran…) La recherche vocale sur google avec Chrome(mium) Tout cela ajouté pourra je pense répondre à des besoins réels… En attendant d’être plus « Libres ».

        On a listé quelques liens si vous voulez: http://handylinux.org/forum/viewtopic.php?f=19&t=737

  2. fibi 6 février 2014 / 12 h 43 min

    Bonjour
    Oui benoifra a repris son projet et c’est vraiment quelque chose de super intéressant. Il peut y avoir de multiples utilisations de son super travail.
    Il sera certainement intégré dans « handylinux », (une distributions adaptée aux personnes âgées, en difficulté avec l’informatique ou souffrant de handicap).
    Nous suivons également de près l’évolution du projet…

    Encore merci à lui..

  3. poum 6 février 2014 / 11 h 41 min

    J’image que Google récupère ce qu’on lui transfère pour reconnaissance ….

    • noireaude 6 février 2014 / 19 h 55 min

      Je ne sais pas.

Comments are closed.