Re: [請益] Alexa費用問題

作者langrisser19 (lan)

看板Soft_Job

標題Re: [請益] Alexa費用問題

時間Fri Sep 15 13:58:59 2017

基本上推文的回覆是錯的如果你要的是speech to text 那你沒辦法透過alexa拿到使用者的完整對話 https://goo.gl/VsmzHQ 你應該先看一下AVS或是alexa的文件 alexa解決的是辨識使用者的意圖告訴你這個意圖對應的slot type & value 舉個例子，你要開發一個智慧開燈裝置你必須針對這件事定義出一個intention => ControlLight 然後這個控制燈的意圖底下可以有對應的slot 像是LightState:on, off 然後給它幾個 Sample Utterances ControlLight Turn {LightState} the light ControlLight Turn the light {LightState} https://goo.gl/WYef22 https://goo.gl/f9siVU 那這樣不管使用者說了甚麼從最簡單的turn on light 或是 please turn on light 或是 xxx xxx xxxx turn on light xxxx alexa都可以解析出使用者要打開燈然後對應到燈的狀態是開 alexa就只做到這個程度也不會跟你收半毛錢不過你也拿不到使用者當初到底是怎麼說的後續你可以在endpoint裡面設定這個解析結果要發到哪裡可以是lambda或是你自己的server 然後去做對應的處理會被收錢的是這部分然後我看你的要求如果不排斥大陸人的產品那就用這個吧 http://ai.chumenwenwen.com/pages/document/android/example ※ 引述《checkIO (chec)》之銘言： : 大家好 : 不知道有沒有版友的專案有使用到Amazon Alexa : 想了解一下面對一般user的使用量跟費用 : 大概會是多少(多少user跟辨識的用途) -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 1.169.70.78 ※ 文章網址: https://www.ptt.cc/bbs/Soft_Job/M.1505455143.A.5AC.html

→ checkIO: 如果我不需要知道使用者說了甚麼只需要辨識出"開燈意圖" 09/15 14:04

→ checkIO: 如果我需要ALEXA回傳"TURN ON"字串這樣是不需要收錢的? 09/15 14:05

→ checkIO: 喔...是解析的結果...... 09/15 14:05

看不懂你要的東西耶@@? 解析結果是不收費的啊但是alexa不會告訴你使用者當時到底是怎麼說的只會把開燈這個結果傳給你指定的位置後面你再根據這個結果去打開燈如果你是把結果送到lambda，然後透過aws iot去開燈那你就會被收費如果你是把結果送到自己的伺服器，然後自己弄個mqtt server去開燈那你就不會被收費如果這是你的需求你也可以去看一下amazon lex，它是alexa的本體，你把alexa左右兩個a拿到就是它了因為alexa的彈性還是沒有lex好舉個例子定飯店 book hotel 你知道系統要完成訂飯店這件事，大概需要日期、時間、地點、房型這些資訊但是使用者說話沒有固定的順序它可能說我要訂紐約9.10號的飯店或是我要訂9.10號的飯店或是我要訂飯店還是我要訂紐約最高級的飯店這些都是不固定的對話方式，要用alexa解決會很麻煩但lex自己會根據缺少的資訊，自動跟使用者對話&詢問，把需要的東西補齊而且它不只語音，連文字也支援就是可以讓你做個chatbot的意思了不過既然它這樣厲害當然就要收費了 https://aws.amazon.com/tw/lex/pricing/ 但amazon目前只支援英文跟德文如果你要中文就只能用我上面給的問問了 ※ 編輯: langrisser19 (1.169.70.78), 09/15/2017 14:31:35

推 bejoe: 確實可透過lambda那文字意圖和部份speech to text,我實作過 09/15 14:37

→ bejoe: 然後再送文字資料到client 09/15 14:38

還是你可以分享一下做法因為alexa解析出的就是intention & slots 你在lambda收到的就已經是辨識完的結果了所以amazon官方也是這樣回答 test頁面有一個 voice simulator https://imgur.com/a/UeRtV 裡面可以看到送出的封包根本不會有使用者當初說的話不知道你是怎麼作到的 @@? ※ 編輯: langrisser19 (1.169.70.78), 09/15/2017 14:48:28

推 bejoe: lex是另一套，跟alexa沒直接關係 09/15 14:41

https://aws.amazon.com/tw/lex/faqs/ 問：什麼是 Amazon Lex？ Amazon Lex 是一種服務，用於使用語音和文字來建立交談界面。Amazon Lex 使用與 Alexa 相同的交談引擎技術支援，提供高品質的語音辨識和語言理解功能，因此可在新的和現有應用程式中加入複雜的自然語言「聊天機器人」。Amazon Lex 簡化多平台開發的工作，讓您輕鬆地將語音或文字聊天機器人發佈到行動裝置和多種聊天服務 (如 Facebook Messenger、Slack 或 Twilio SMS)。與 AWS Lambda、AWS MobileHub 及 Amazon CloudWatch 的原生相互操作性，以及易於整合 AWS 平台上許多其他服務 (包括 Amazon Cognito 和 Amazon DynamoDB)，這些特性讓機器人開發變得毫不費力。 ※ 編輯: langrisser19 (1.169.70.78), 09/15/2017 14:54:15

→ MOONY135: 好棒的分享 09/15 16:04

推 kurtsgm: 推 09/15 16:15

推 genesic: 我試過把整個speech當作一個slot XD 高機率成功 09/15 20:05

→ genesic: 這樣子拿到的就是使用者整個完整的speech 09/15 20:05

→ genesic: 當然這個intention不能跟其他intention的關鍵字衝到 09/15 20:06

要硬幹也是可以但如果是一些語助詞呢就像開燈偏偏有人就是喜歡說乾！給我開燈這樣這句話要完整捕捉到,我還真不知道slottype跟例句要怎麼設而且如果為了包山包海設了一堆句子，那系統誤判的機率又更高了所以重點還是... 如果只是要把聲音轉文字,那從一開始就不應該用alexa啊 alexa是要幫你把使用者的意圖跟關鍵字自動抓出來使用者原先說什麼，在這邊根本不是重點重點是使用者的意圖才是 ※ 編輯: langrisser19 (114.198.170.96), 09/15/2017 20:27:27

推 genesic: 你好像誤會我的意思? 因為問題似乎不是出在你說的case 09/15 21:32

→ genesic: 自訂slot type，列舉的時候多列一點各種字數的句子 09/15 21:36

→ genesic: 然後整個intent就只有一個slot， ex: "{Message}" 09/15 21:38

→ genesic: 我大概有列了7~8個各種不同字數的句子，高機率能match到 09/15 21:39

→ genesic: 當然如果你的case是沒有意義的發音，那本來就轉不成文字 09/15 21:40

→ genesic: 另外如果是要speech recognition的話，alexa本來就不太適 09/15 21:42

→ genesic: 合XDD 還不如去用microsoft cognitive 09/15 21:43