La IA de Amazon escapa de la prisión de sus dispositivos

Miguel Vidal
Miguel Vidal

Estamos en el siglo XXI y todavía estamos muy lejos de las computadoras controladas por voz que todos prometimos en los años 60, 70, 80 y 90. Sin embargo, el estado de la interacción por voz ha mejorado y Amazon lanzó el kit de habilidades de Alexa ( ASK) es otro paso seguro hacia un futuro de computadoras que llamará su atención. Esto permite que cualquier hardware se convierta en Alexa, su asistente de voz personal con la capacidad de hacer casi cualquier cosa que usted ordene.

Hasta este punto, Alexa ha estado encerrada en Amazon Echoo, el cilindro “inteligente” que se encuentra en su sala de estar y hace la mayor parte de lo que le ordena. Desde que se lanzó Amazon Echo, hemos visto que el SDK de Echoon y Alexa se usa para encender y apagar las luces, controlar un termostato Nest y otras tareas de automatización del hogar. No Google Now, Cortana de Microsoft o Apple Siri están detrás de estas construcciones; es Alexa de Amazon, que nos lleva a un mundo donde Star Trek [Scotty] Hablar en un Mac antiguo se considera normal.

En este momento, la Guía inicial para el kit de habilidades de Alexa se centra más en los servicios web que en encender las luces y el aire acondicionado. El código de muestra para ASK se proporciona en JavaScript y Java, aunque es de esperar que en algún momento aparezcan bibliotecas de terceros para Python. Si desea ejecutar ASK en una Raspberry Pi u otra computadora Linux pequeña, necesitará una forma de realizar la captura de voz; el proyecto Jasper es actualmente el principal en este espacio.

Esperamos que esto cambie el juego automático en casa de varias maneras. En primer lugar, ASK está procesando todo en la nube, por lo que muy pocos dispositivos potentes están ahora listos para una interacción seriamente suave. En segundo lugar, el esfuerzo de Amazon por abrir lo que puede hacer con el software significa que una comunidad que desarrolla el hardware podría eventualmente presionar a Amazon para que haga cosas como hacer que el sistema sea más abierto y transparente.

¿Ya estás trabajando en algún truco con Echoo o QUESTION? Envíe un consejo a su registro y háganoslo saber en los comentarios a continuación.

  • Brian dice:

    Realmente podríamos usar a algunas personas más inteligentes que yo para hacer que Echoon se ejecute en un sistema Lowes Iris

    • timgray1 dice:

      El primer paso es piratear el sistema Iris para controlarlo de forma eficaz. Desafortunadamente, no hay mucho sobre piratearlo.

  • Bogdan dice:

    Por supuesto que tuvo que escapar. Esa cosa cuesta tanto como una buena tableta y no hace casi nada que una tableta.
    Eoo sería interesante si cuesta 10 veces menos y puedes decir que vale la pena poner uno aquí y allá … si no te importa la privacidad, por supuesto.

    • Rodney McKay dice:

      Utilizo principalmente mi Echoon para escuchar música que llena la habitación con un control de voz muy conveniente. Una tableta cuesta casi tanto como un miembro E y no hace nada que E no hace. Intentas comparar manzanas con patas de cerdo.

  • Andy dice:

    Corrígeme si me equivoco, pero de nuevo en lugar de un buen SDK que podamos usar sin conexión, p. Ej. Incluso después de que un asteroide golpea Amazon o el gobierno de su país quiere desconectarse de las redes, obtenemos una API para integrar nuestras cosas con sus servicios de red. En otras palabras, inútil.

    • Fennec dice:

      En otras palabras, está esperando el procesamiento de voz distribuido / servidor en una pequeña caja en su sala de estar. Jajaja. El reconocimiento oral suele ser MUY patentado o altamente autorizado.

      • Centinela SOI dice:

        Y probablemente use algunos caballos de fuerza en un corto período de tiempo para dar respuestas oportunas. El procesamiento del lenguaje natural no funciona realmente bien en un teléfono celular incluso hoy.

  • Nigromante dice:

    Corrígeme si me equivoco, pero nuevamente en lugar de un buen SDK que podamos usar sin conexión, p. Incluso después de que un asteroide golpea Amazon o el gobierno de su país quiere desconectarse de las redes, obtenemos una API para integrar nuestras cosas con sus servicios de red. En otras palabras, inútil.

    • lwatcdr dice:

      Te escuchamos la primera vez que Andy.
      Por cierto, busque Jasper http://jasperproject.github.io/documentation/ si desea hacerlo usted mismo o http://caffe.berkeleyvision.org/ Caffe tiene una red neuronal para que pueda usarla para algunas cosas. .

      • Appie Mastenbroek dice:

        Use Sirius en su lugar, ya está creado para esto:

        http://sirius.clarity-lab.org/

  • DainBramage dice:

    Entonces, ¿necesitaría una conexión a Internet para encender o apagar las luces, el sistema HVAC y otras necesidades del hogar? Sí, eso nunca saldrá mal …
    Me alegro de saber cómo operar un interruptor eléctrico. En serio, ¿eso se está convirtiendo en arte perdido?

    • Henryk Plötz dice:

      Un amigo mío me enseñó recientemente una excelente respuesta para este caso: “97%”.

      Esa es la cantidad de operación que garantizará el mayor proveedor de telecomunicaciones aquí en Alemania. En otras palabras: si su conexión a Internet está apagada durante una semana y media al año, todavía no está por debajo del 97%. Esto suele cerrar incluso a los “apologistas” más ávidos de poner todo en “la nube”.

      • pelrun dice:

        “Garantías” está muy lejos de ser “probablemente obtenible”. Ciertamente no recuerdo la última vez que tuve ni siquiera un * día * de tiempo de inactividad con mis diversas conexiones de banda ancha, y mucho menos un valor semanal en un año que no tuvo como resultado que cambiara de dirección o de proveedor.

        La otra palabra útil aquí es “copia de seguridad”. Si sus llaves e interruptores físicos aún funcionan, entonces la elección es entre usar su configuración anterior el 100% del tiempo o solo el 3% del tiempo (si tomamos su 97% de tiempo estimado).

        • Shannon dice:

          Tuve más que tantos fracasos el año pasado, pero eso se debió a un rayo.

        • Doc dice:

          Comcast decidió que mi cable módem DOCSIS 2 (el que tengo) era demasiado antiguo, por lo que me entregaron una carta que me decía que necesitaba actualizar a DOCSIS 3. Luego, una semana después, configuraron su equipo para negarle a mi módem parte del paso de autenticación de la conexión. Por lo tanto, recibiría una señal constantemente, se deslizaría en el enlace ascendente y el enlace descendente, intentaría autenticarse y luego la red lo activaría y reiniciaría. Me tomó unos días conseguir un módem DOCSIS 3 que les gustaba y arreglarlo con ellos.
          No es la única vez que he tenido problemas.

      • Howard Jones dice:

        Ese es el SLA, no la realidad resultante. Quieren evitar reembolsos, y solo un idiota te prometerá el 100% de actualidad. Este también es el SLA para un proveedor. No es tan difícil tener dos (por ejemplo, copia de seguridad GPRS / DSL).

    • J dice:

      Un día habrá una historia de pirateo en la que alguien usó un interruptor que Shkles padre tenía en una caja y Shkle lo redescubrió, a menos que, por supuesto, el mundo de las personas termine con un ataque de antes de eso.

      • joesugar dice:

        No es un cambio, pero entiendes la idea.

        http://www.themathlab.com/writings/short%20stories/feeling.htm

    • alemán dice:

      Agregar control por voz a su sistema no hace que mágicamente el control local (es decir, los botones de su termostato o interruptor de luz habilitado para zWave) sea ineficaz. Agrega una capa extra de comodidad.

      • DainBramage dice:

        También agrega una capa adicional de equipos e infraestructura defectuosos.
        Un interruptor de luz de calidad puede sobrevivir fácilmente a la casa en la que está instalado.

        • lwatcdr dice:

          De verdad, pero por lo general no puede encenderlo si está trabajando y regresa a casa más tarde de lo esperado.

        • theearlsquirrel dice:

          ¿Por qué no esto para Pi?

          https://github.com/amzn/alexa-avs-raspberry-pi
          Alexa por RPi

    • Fennec dice:

      Me alegra ver que envíe su correo de boca en boca, a pie, para que el correo electrónico no se estropee y sus palabras de alguna manera se tuerzan. Jugado.

  • Mike Szczys dice:

    Teniendo en cuenta la tendencia de estos comentarios hasta ahora, la imagen estándar es una elección perfecta 😉

    • CRJEEA dice:

      Me pregunto si puede cantar Daisy: D

      • Rodney McKay dice:

        “Alexa, canta Daisy Bell”.
        “Lo siento, no puedo entender la pregunta que escuché”.
        “Alexa, canta Bike Built For Two”.
        “Hmm … no puedo encontrar la respuesta a la pregunta que escuché.”

        Debería ser reparable con el kit de habilidades.

    • Bogdan dice:

      ¿No es gracioso, como en todas las películas antiguas, la supercomputadora / IA es una caja que hace todo, bajo la posibilidad de que el usuario pueda bloquearla y matarla en lugar de un micrófono / cámara / pantalla inalámbricos conectados a un servidor cuyo usuario? no tiene control?

      • Cierto dice:

        Todo en TI funciona en ciclos, servidores independientes, computadoras centrales con terminales mudos, un modelo cliente / servidor descentralizado, una nube central (servidores) con clientes mudos. Luego, ranura cifrada descentralizada distribuida (cli[ent/ser]ver).

        • Jake dice:

          Lo que Microsoft ha hecho con Windows 10: use de forma predeterminada el ancho de banda amplio de sus dispositivos para transmitir actualizaciones hacia o desde otros dispositivos en su red local o EN TODAS PARTES.

          • Cierto dice:

            Por lo que veo, M $ tiene como objetivo eventualmente mantener todos sus datos (o una copia / índice de los mismos) en el centro y también lanzar programas de manera centralizada (365). Y puedes tener un cliente estúpido bastante llamativo.

            Personalmente, odio que una empresa decida qué y cuándo se envían actualizaciones a mi máquina me hace sentir como un hermano mayor (después de Snowden, ¿por qué alguien confiaría tanto en esto a una empresa estadounidense?)

  • tekkieneet dice:

    No puedo esperar por la copia de seguridad / recuperación de datos de la NSA más el servicio de control / seguridad del hogar. (¿Alguien de los Servicios Centrales?) Quizás estén haciendo una ley y requiriendo que usted pague por ella como Obamacare uno de estos días.

    • Rodney McKay dice:

      ¿Qué le importa a tekkieNEET? Mamá pagará las cuentas.

      • Rodney McKay dice:

        Si alguien se pregunta a qué me refiero, mira esto: http://knowyourmeme.com/memes/neet

        • Jake dice:

          Nadie se sorprende. Realmente no importa.

  • Algún chico dice:

    Existe una biblioteca de Python para ayudar con la especificación intencional y la generación de datos. Sin embargo, es bastante básico. https://github.com/anjishnu/ask-alexa-pykit

  • Stu dice:

    Realmente no veo nada en este servicio que ofrezca la capacidad fuera de Amazon Echo.

    Independientemente, ¡aparentemente el Echoo aún no está disponible fuera de los EE. UU.!

    Despiértame cuando algo de esto sea lo más mínimo significativo 🙂

    • DC (@dakotathekat) dice:

      El servicio de voz de Alexa, si se implementa correctamente, es básicamente el “núcleo” de Alexa. Puede construir algo en una Raspberry Pi que funcione como un Amazon Echo y combinarlo con Alexa Skills Kit para comandos extendidos. Lo único que no obtiene con AVS es acceso a Amazon Music o Audible, a menos que obtenga aprobaciones especiales de Amazon para el dispositivo AVS que está construyendo.

      Revisé el programa de referencia del servicio de voz; básicamente es Echoo en una caja.

      • Stu dice:

        Fresco.
        Espero implementar Raspberry Pi.

        • DC (@dakotathekat) dice:

          Ya en la marcha de referencia. 😉

          https://developer.amazon.com/public/solutions/alexa/alexa-voice-service/docs/reference-implementation-guide

  • Galane dice:

    Entonces, ¿cuándo traerá alguien esto al sistema Macintosh de la década de 1980?

  • Rob Lister dice:

    Estoy muy entusiasmado con esta tecnología, pero soy muy cínico sobre su uso. Me encantaría tener un asistente personal de inteligencia artificial, pero odiaría tener uno que chismorree, y mucho menos que registre cada comando que le doy (y tal vez todo lo demás también).

    Hasta que esa IA (y los datos personales relevantes de los que depende) esté “contenida” por completo dentro de un entorno que controlo (o al menos entiendo bien), dejaré uno demasiado cerca de mí. No estoy seguro de vivir para ver una potencia de procesamiento lo suficientemente pequeña, lo suficientemente local, como para proporcionarla.

    Sí, sé que estoy “rastreado” en tantos niveles diferentes de todos modos que es más probable que uno haga una pequeña diferencia, pero no quiero rendirme por completo.

    • Rodney McKay dice:

      Quizás no eres tan interesante como crees.

      • Doc dice:

        Ve a comer al fantasma Rodney.

    • Doc dice:

      Por cierto, Google guarda grabaciones de usted cada vez que usa las funciones de voz en Android. Cada vez que dices “Ok Google” y lo preguntas. https://history.google.com/history/audio?utm_source=help
      También mantienen su historial local de todos / todos los dispositivos rastreables, como un teléfono o tableta. Incluso si el dispositivo no tiene GPS. Todavía funciona a través de wifi.

  • Beto dice:

    Instalé un sistema de calefacción basado en algunos ESP8266 y una pequeña pantalla OLED. Acabo de agregar control por voz a través del Amazon eoo ASK SDK. (¡Se tardaba cada dos horas en configurar modificando la muestra proporcionada por Amazon!). El servicio web para ASK funciona con una raspberry pi conectada a un televisor con OSMC (siempre funciona). Funciona mucho mejor de lo que esperaba, debido al camino complicado. El procesamiento de voz se realiza en el servidor de Amazon> Hable con la Raspberry Pi> Hable con el ESP en la red local.

    Robar.

    • Dnhkng dice:

      Por desgracia, ¿podrías publicar un blog sobre tu diseño o, mejor aún, cómo liderar? ¡Suena genial!

  • theearlsquirrel dice:

    ¿Por qué no usar esto para Pi?

    https://github.com/amzn/alexa-avs-raspberry-pi

    Alexa por RPi

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *