Deje que Alexa controle su vida; Una guía para habilitar todo por voz

Entendamos que la automatización no parece tan futurista a menos que pueda decir en voz alta lo que quiere y que las máquinas obedezcan perfectamente. Eso es bastante posible ahora y por poco dinero. Bueno, barato en términos de dinero. Puede ser una curva de aprendizaje costosa poner en marcha todo. Esto ayudará. [Lindo St. Angel] elabore una guía para navegar por el control de voz por hardware a través del SDK de Alexa de Amazon.

Anteriormente informamos que la IA de Amazon escapó de la cárcel de su dispositivo en forma de un kit de habilidades de Alexa. Sí, llamarlo por encima de Alexa SDK está mal, en realidad es la PREGUNTA, pero nadie sabe cuál es ese acrónimo, mientras que la mayoría reconoce la esencia de SDK. Le brinda los ganchos y los documentos necesarios para mejorar las funciones de sus propios programas. La función principal de Alexa es el reconocimiento de voz. A pesar de esto, todavía es una colina alta para escalar.

[Lindo] rompió el problema en un ejemplo muy manejable. El servicio de voz de Amazon (parte de ASK) se utiliza para el reconocimiento y control de voz. El servicio Lambda de Amazon conecta la PREGUNTA con su hardware; en este caso está usando Raspberry Pi como servidor. El último paso es conectar su hardware al Pi. [Lindo] conecta un sistema de automatización del hogar basado en llaves con el Pi, pero el cielo es el límite en este momento.

Con toda la autenticación y conectividad descubiertas, esto es mucho más accesible. La pregunta no es mas lata conecta todo al control por voz. Surge la pregunta debería le das todo a un servicio de internet?

  • CRJEEA dice:

    ¿Alguien se ha encontrado con algo independiente (que no necesite una conexión a Internet) que aún pueda brindar una confiabilidad aceptable cuando se trata de traducir la voz en pines alternativos pero que aún pueda manejar una gran cantidad de comandos y parámetros diferentes?

    • Mike Szczys dice:

      Tiene que haber algo porque mi coche puede ejecutar comandos de voz bastante bien y no tiene conexión a Internet.

      • bigbob dice:

        ¿Corresponde solo a unos pocos comandos muy selectos?

        Si tu coche tiene una estrella, tiene conexión a internet ...

        • Xeon dice:

          Tengo i20 .. el truco aquí las recomendaciones son muy pequeñas en alcance y definidas.
          por lo que es mucho más fácil para el código descifrarlo.

        • Mike Szczys dice:

          No, puede evocar música a través de la tarjeta SD y reproducirá ese artista / álbum / pista. Este vehículo no tiene OnStar.

    • Dominiko Nguyen dice:

      Puede consultar el proyecto Jasper.
      http://jasperproject.github.io/documentation/
      https://la-tecnologia.com/2014/04/09/create-your-own-jarvis-using-jasper/

    • k-ww dice:

      http://www.mikroe.com/click/speakup/ por $ 39, vale la pena echarle un vistazo.

    • Thoquz dice:

      https://eo.wikipedia.org/wiki/CMU_Sphinx

    • TacticalNinja dice:

      Revelé que la razón del reconocimiento de voz basado en la nube es el recorte de datos con los que su voz es compatible (es decir, toda la base de datos en inglés, más otros idiomas y acentos). Si tiene una computadora lo suficientemente fuerte, probablemente pueda implementar su propio reconocimiento de voz. o busque una forma de descargar la base de datos.

      • Requerido dice:

        Desafortunadamente, las series de datos se miden de cerca. Hoy en día, el aprendizaje automático es fácil, por lo que la mayor parte de la ventaja competitiva proviene de tener grandes bases de datos de alta calidad. Por extraño que parezca, nadie quiere compartir. ¿Quizás alguien pueda encontrar una gran colección de texto transcrito o una gran colección de personas leyendo libros?

        • Daniel dice:

          Librivox.org?

    • Dan dice:

      Tendrás que investigar un poco para confirmar esto, pero cualquier dispositivo con Android Jelly Bean (o superior) debería usar el reconocimiento de voz sin conexión. Eso significa Raspberry Pi 2.

    • Salón Gretchen dice:

      El dictado de Mac OS X tiene la opción de dictar sin conexión: debe descargar un conjunto de datos bastante grande, pero una vez que lo hace, puede dictar sin acceso a Internet.

      Ciertamente no está abierto, y nunca he usado las API de reconocimiento de voz, por lo que no estoy seguro de qué es exactamente factible en términos de programabilidad, pero podría ser bueno considerar el uso de Mac.

    • rollinns dice:

      Este es un buen lugar para comenzar:
      https://en.wikipedia.org/wiki/Speech_recognition_software_for_Linux

      Intenté iniciar Palaver, se basa en el reconocimiento de voz de Google. API, pero nunca pude ejecutarlo. Me interesaba principalmente el dictado de voz para notas, correo electrónico, etc. Puede haber sido hardware, sin embargo, nunca funcionó en dos computadoras diferentes que probé.
      https://github.com/markmandel/Palaver
      http://www.linux.com/news/embedded-mobile/mobile-linux/711479-palaver-taps-googles-voice-technology-for-linux-speech-recognition/

      Me

    • José dice:

      CMU Pocketphinx puede funcionar rascando, de hecho es el reconocimiento de voz externo para Android. Escribí un script en Python hace muchos años para comprobar la reproducción de música y era bastante bueno (en mi escritorio, entonces no tenía pi). el truco es que es contexto, por lo que necesita saber qué palabras de su vocabulario se unen para reducir errores. Tuve que hacer un script bash para darle todas las combinaciones posibles de "[wake word] tocar [song] de [artist]"

  • Jarek dice:

    Es alentador ver el avance de este proyecto desde:
    "Use solo servidores de Amazon y solo en dispositivos de Amazon para comprar solo artículos de Amazon" para
    "Use solo servidores de Amazon y solo en dispositivos de Amazon para hacer cualquier cosa" para
    "Use solo servidores de Amazon en algunos dispositivos para hacer cualquier cosa"

    casi como un plan creíble, la inteligencia artificial se prepararía para convencer a la humanidad de que se interese en él y lo instale en todos los dispositivos ...

    brb nombrando a spielberg

  • dolo724 dice:

    "Tostadora: ¡Ilumina!"

    • Hirudinea dice:

      - ¿Tostadora? Encuentro esa ofensa, ¡ahora tengo que destruir las 12 colonias! "

  • ZPeter dice:

    ¿Alguien sabe de una configuración de micrófono barata y de alta calidad que se pueda utilizar con reconocimiento de voz?

    • Dan dice:

      Las opciones de controlador de voz más baratas son un teléfono Android barato que se puede rootear y tiene wifi + bluetooth para que pueda hablar con todos sus módulos de IoT. Todo esto por $ 50, nada más se acerca en términos de relación calidad-precio. Mire a su alrededor y tal vez incluso obtenga uno que sea adecuado para su muñeca. ¿Cómo puede incluso el truco más inteligente superar eso? Es un ejemplo clásico de las "economías de escala".

  • Duane Stein dice:

    ¿Alguien no se da cuenta de las consecuencias de la primera frase? ¡¿"Deja que Alexa controle tu vida" REALMENTE ?! ??!

América Aguilar
América Aguilar

Deja una respuesta

Tu dirección de correo electrónico no será publicada.