Google AIY: Inteligencia artificial propia

Alejandro Vargas
Alejandro Vargas

Cuando Amazon lanzó la API a su servicio de voz Alexa, básicamente obligaron a algunos jugadores serios en este dominio a llevar sus ofertas al mercado de hackers / fabricantes también. Ahora Google y Raspberry Pi se han unido para traernos la “Inteligencia Artificial Self” o AIY.

El hardware gratuito creado por Google se distribuyó con el número 57 de la revista MagPi, que se dirige a fabricantes y aficionados que se pueden ver en el video después del salto. El kit contiene un sombrero de voz Raspberry Pi, una placa de micrófono, un altavoz y algunos pequeños chips para montar el kit en una Raspberry Pi 3. Ponerlo todo junto y seguir las instrucciones del sitio web oficial le brinda Google Voice Interaction. Equipo con un montón de IO que gritan para ser utilizados.

El código fuente del programa Python se puede descargar de GitHub y consiste en un bucle que espera un disparador. Este disparador puede ser presionar un botón o dar una palmada cerca de los micrófonos. Cuando se detecta un disparador, la grabadora se hace cargo de la transmisión de la transmisión a Google Cloud. La conversión de palabra a texto se lleva a cabo allí y el resultado es procesado por un motor de texto a palabra que ayuda al sistema a hablar. El repositorio sugiere que la imagen SD oficial de Call Gear (893 MB descargables) está basada en Raspbian, así que no empiece a hacer una tarjeta de memoria de inmediato, podría agregarla a una instalación existente.

Y si aún no tienes acceso al equipo oficial, pero solo quieres probarlo, no busques más. Google tuvo la amabilidad de crear una Guía para agregar compatibilidad con el Asistente de Google a la Raspberry Pi 3. La única tableta ya tiene un altavoz y hay muchos micrófonos USB que realizarán la tarea. Las tarjetas de sonido USB funcionan bien y también después de seguir las instrucciones para configurar el SDK de Google, tienes un Asistente.

Si desea completar la experiencia del Kit AIY de Google, tendrá que piratear un poco. Agregar un botón para iniciar Assistant Script es bastante simple y si alguien quiere agregar un DIY Hit Escape, siga recto.

  • José dice:

    Entonces tienes que hacer tu propia detección de palabras clave

    • RicoElectrico dice:

      ¿Existen bibliotecas razonables (de código abierto, fáciles de usar, con calidad de producto) para esta tarea?

      • RicoElectrico dice:

        Ah, y fácil de entrenar.

        • Alex dice:

          La mejor fuente totalmente abierta que conozco es Pocketsphinx, que es un motor de reconocimiento de voz completo, o si estás dispuesto a usar una fuente parcialmente abierta, se supone que Snowboy es muy bueno; el único problema es que tienes que entrenar la voz modelo en línea, pero después de eso, el reconocimiento funciona completamente fuera de línea.

  • Haydn dice:

    vendido 🙁

  • Rog Fanther dice:

    Esperaré a que lancen algo instalable en la pi y trabajen desconectados de la nube.

    • Doc dice:

      También preferiría tener algo que pueda funcionar fuera de los servidores de Google y, por lo tanto, no sea visible. Me oculta lo suficiente como para almacenar en caché todas las preguntas que haces con las indicaciones de voz de Google Now.

    • CodeReclaimers dice:

      Sí, no soy un fanático de todos estos productos de IA que funcionan en una caja negra en cualquier otra máquina. Ya tengo suficientes dispositivos que informan sobre mi comportamiento, no necesito agregar más con un proyecto de hobby.

      ¿Seguramente hay un enfoque de reconocimiento de voz lo suficientemente ligero como para trabajar con Pi o algún otro pasatiempo?

      • Alphatek dice:

        Hace más de 20 años, vi un buen reconocimiento independiente de voz en ARM7 @ 30MHz, por lo que es de esperar

      • Nitori dice:

        Quiero ver un proyecto en el que todo el software funcione dentro del dispositivo real o al menos a través de su propio servidor.

        • demócrata011 dice:

          ¿Has oído hablar de https://mycroft.ai/? Realmente no sé qué tan rápido / receptivo es esto porque solo lo he leído, pero este sería su anfitrión. De lo contrario, una vez fue Sirius quien se convirtió en lucida. Creo que …

    • salec dice:

      ¿Quizás puedas usar la nube de Google para entrenar tu propia ANN? Si una máquina incorporada puede aceptarlo, eso es. Aliméntalo y Google tendrá registros de él para que no comprometas tu propia privacidad.

    • Rog Fanther dice:

      Ni siquiera por privacidad, pero a veces desea instalar algo usando esto en su lugar sin una conexión a Internet.

      También sobre la ejecución en pi: hemos tenido un reconocimiento de voz bastante funcional desde la época de OS / 2. Entonces, Dragon Dictate y otros trabajaron en 386 y 486. Dado el poder de procesamiento del pi, espero que sea más que capaz de lanzar algo como esto. Tal vez si Google realmente codificó algo para él, en lugar de acumular algunas bibliotecas Java infladas para la tarea

    • nic0mac dice:

      Parece que no encuentro cómo hacerlo en las instrucciones, pero en su página de desarrollador dicen instrucciones para crear una interfaz de usuario de voz (VUI) que puede usar servicios en la nube (como el nuevo Google Assistant SDK o la API de Cloud Speech) o se ejecuta completamente en el dispositivo ”. Así que supongo que hay una manera de ejecutarlo sin conexión con solo algunas funciones según el dispositivo, o tal vez me equivoque …

      • Comer dice:

        Parece estar en la configuración:
        https://github.com/google/aiyprojects-raspbian/blob/master/config/voice-recognizer.ini.default#L7

        • nic0mac dice:

          genial, gracias por no decirme que estaba equivocado, todavía no miré tan duro. Esta podría ser una mejor manera de acceder a la transmisión de seguridad desde el camino de entrada en el televisor, porque ya sabes, a veces es difícil encontrar el control remoto y presionar 3 botones o simplemente mirar por la ventana cuando escucho que un automóvil se levanta.

    • Comer dice:

      Es posible que desee ver Jasper (http://jasperproject.github.io/documentation/configuration/), que ofrece una selección de motores de reconocimiento de voz que incluyen 2 variantes fuera de línea

  • Ken Quast dice:

    Más datos e información para Google. ¡Sí!

    • Clovis Fritzen dice:

      Usar nuestros datos es su negocio, eso no ha sido una sorpresa para nadie desde 1998, señor.

    • koromd dice:

      No puede escucharlo hasta que presione adentro o use algo para activar la detección. En este momento, el único dispositivo independiente que puede configurar Google o ejecutar “siempre” es Google Home.

  • Tweepy dice:

    ¿Como funciona esto? ¿Cómo es diferente?
    Mientras GAFAM permanezca informado, no usaré dicho sistema.

    • ???? ???? dice:

      Es un juguete educativo si necesita seguridad y privacidad tales sistemas no son adecuados. Sin embargo, puede usar API de voz para ayudar a entrenar su propio sistema de conversión de voz a texto a acción y luego simplemente operar la red neuronal local cuando sea lo suficientemente competente.

  • kriptilomese dice:

    Por favor, haga que la herramienta esté disponible para su compra por separado de la revista.

    • notarealemail dice:

      https://developers.googleblog.com/2017/05/aiy-projects-voice-kit.html

      • notarealemail dice:

        El kit de herramientas de voz se envía a todos los suscriptores de MagPi Magazine el 4 de mayo de 2017, y hemos publicado una lista parcial, instrucciones de montaje, código fuente y complementos sugeridos en nuestro sitio web: aiyprojects.withgoogle.com. El kit completo también se vende en más de 500 tiendas Barnes & Noble en todo el país, así como en los minoristas británicos WH Smith, Tesco, Sainsburys y Asda.

        • haydn dice:

          Creo que podrían significar que esos minoristas británicos están proporcionando la revista magpi porque no están proporcionando raspadores ni ningún otro dispositivo electrónico. Acabo de regresar de una pareja que tenía espacios vacíos donde debería estar magpi, y todos los sitios de Internet estaban agotados. Precio inicial de £ 20 en eBay.

  • MCenderdragon dice:

    Entonces, ¿cuántos datos se envían a goolge? ¿Utilizo sgoogle solo para la conversión de voz a texto o también para la tarea completa de IA? Si fuera solo el STT, simplemente usaríamos un teclado como entrada. Pero por ahora suena como una charla de Google. goolge alimenta la inteligencia artificial de texto, la inteligencia artificial hace magia, google devuelve texto, el texto para escribir en cero te habla.

  • ???? ???? dice:

    Puede hacer todo esto y mucho más con un teléfono Android 6.0 con $ 50, una aplicación personalizada y con cualquier cantidad de “cosas” habilitadas para ESP8266. La oferta de Google es para niños, no para hardware.

    • Fred dice:

      https://www.hackster.io/bastiaan-slee/nabaztag-gets-a-new-life-with-google-aiy-e9f2c8

      Me suena a hacker. y parece ser un buen truco también.

      Ahora enrolla tu cuello y vuelve a tu agujero y deja de verter neveras …..

      • ???? ???? dice:

        No estoy “tirando” nada con lo que estás bromeando, ya que puedes conseguir todo y más ya empacado por menos dinero, esto es una cuestión de hechos verificables y solo un completo idiota lo rechazaría.

  • Fuente de bajo grado dice:

    Hay muchos módulos de reconocimiento de voz (

  • Steve dice:

    Recibí Mag Pi y el equipo esta tarde en un WH Smiths remoto cerca de donde trabajaba. Todo funciona bastante bien.
    Fue muy fácil ponerlo en funcionamiento.

    Sin embargo, el Voice Hat es interesante, muchos otros escapes en él, no solo la salida de altavoz, entrada de micrófono y entrada de botón. El kit viene con un encabezado que le permite realizar:

    Fugas de I2C y SPI

    Lo que parecen 6 salidas de servicio y 4 “pilotos” (conductores de motores) son almohadillas de barril de entrada de CC deshabitadas (los tableros de artículos de Mag Pi muestran que está habitada) y algunos otros puentes también.

    Nada mal para un regalo con una revista de £ 5,99.

    • Steve dice:

      Significaba cabezas deshabitadas, no camisetas.

  • oliv4945 dice:

    El proyecto de código abierto Jarvis puede evitar trabajar con Google 🙂
    https://github.com/alexylem/jarvis

  • Cerveza con gaseosa dice:

    De acuerdo, pero el límite de tener que permitir una conexión a la nube de Google es “dolor en la espalda”, especialmente cuando quieres usarlo por teléfono en una carretera secundaria, ni siquiera puede enviar mensajes de texto sin estar en línea.

    Definitivamente necesitan hacer una versión sin conexión.

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *