→ checkIO: 如果我不需要知道使用者說了甚麼 只需要辨識出"開燈意圖" 09/15 14:04
→ checkIO: 如果我需要ALEXA回傳"TURN ON"字串 這樣是不需要收錢的? 09/15 14:05
→ checkIO: 喔...是解析的結果...... 09/15 14:05
看不懂你要的東西耶@@?
解析結果是不收費的啊
但是alexa不會告訴你使用者當時到底是怎麼說的
只會把開燈這個結果傳給你指定的位置
後面你再根據這個結果去打開燈
如果你是把結果送到lambda,然後透過aws iot去開燈
那你就會被收費
如果你是把結果送到自己的伺服器,然後自己弄個mqtt server去開燈
那你就不會被收費
如果這是你的需求
你也可以去看一下amazon lex,它是alexa的本體,你把alexa左右兩個a拿到就是它了
因為alexa的彈性還是沒有lex好
舉個例子 定飯店 book hotel
你知道系統要完成訂飯店這件事,大概需要日期、時間、地點、房型這些資訊
但是使用者說話沒有固定的順序
它可能說我要訂紐約9.10號的飯店
或是我要訂9.10號的飯店
或是我要訂飯店
還是我要訂紐約最高級的飯店
這些都是不固定的對話方式,要用alexa解決會很麻煩
但lex自己會根據缺少的資訊,自動跟使用者對話&詢問,把需要的東西補齊
而且它不只語音,連文字也支援
就是可以讓你做個chatbot的意思了
不過既然它這樣厲害
當然就要收費了
https://aws.amazon.com/tw/lex/pricing/
但amazon目前只支援英文跟德文
如果你要中文
就只能用我上面給的問問了
※ 編輯: langrisser19 (1.169.70.78), 09/15/2017 14:31:35
推 bejoe: 確實可透過lambda那文字意圖和部份speech to text,我實作過 09/15 14:37
→ bejoe: 然後再送文字資料到client 09/15 14:38
還是你可以分享一下做法
因為alexa解析出的就是intention & slots
你在lambda收到的就已經是辨識完的結果了
所以amazon官方也是這樣回答
test頁面有一個 voice simulator
https://imgur.com/a/UeRtV
裡面可以看到送出的封包根本不會有使用者當初說的話
不知道你是怎麼作到的 @@?
※ 編輯: langrisser19 (1.169.70.78), 09/15/2017 14:48:28
推 bejoe: lex是另一套,跟alexa沒直接關係 09/15 14:41
https://aws.amazon.com/tw/lex/faqs/
問:什麼是 Amazon Lex?
Amazon Lex 是一種服務,用於使用語音和文字來建立交談界面。Amazon Lex 使用與
Alexa 相同的交談引擎技術支援,
提供高品質的語音辨識和語言理解功能,因此可在新
的和現有應用程式中加入複雜的自然語言「聊天機器人」。Amazon Lex 簡化多平台開發
的工作,讓您輕鬆地將語音或文字聊天機器人發佈到行動裝置和多種聊天服務 (如
Facebook Messenger、Slack 或 Twilio SMS)。與 AWS Lambda、AWS MobileHub 及
Amazon CloudWatch 的原生相互操作性,以及易於整合 AWS 平台上許多其他服務 (包括
Amazon Cognito 和 Amazon DynamoDB),這些特性讓機器人開發變得毫不費力。
※ 編輯: langrisser19 (1.169.70.78), 09/15/2017 14:54:15
→ MOONY135: 好棒的分享 09/15 16:04
推 kurtsgm: 推 09/15 16:15
推 genesic: 我試過把整個speech當作一個slot XD 高機率成功 09/15 20:05
→ genesic: 這樣子拿到的就是使用者整個完整的speech 09/15 20:05
→ genesic: 當然這個intention不能跟其他intention的關鍵字衝到 09/15 20:06
要硬幹也是可以
但如果是一些語助詞呢
就像開燈
偏偏有人就是喜歡說 乾!給我開燈
這樣這句話要完整捕捉到,我還真不知道slottype跟例句要怎麼設
而且如果為了包山包海設了一堆句子,那系統誤判的機率又更高了
所以重點還是...
如果只是要把聲音轉文字,那從一開始就不應該用alexa啊
alexa是要幫你把使用者的意圖跟關鍵字自動抓出來
使用者原先說什麼,在這邊根本不是重點
重點是使用者的意圖才是
※ 編輯: langrisser19 (114.198.170.96), 09/15/2017 20:27:27
推 genesic: 你好像誤會我的意思? 因為問題似乎不是出在你說的case 09/15 21:32
→ genesic: 自訂slot type,列舉的時候多列一點各種字數的句子 09/15 21:36
→ genesic: 然後整個intent就只有一個slot, ex: "{Message}" 09/15 21:38
→ genesic: 我大概有列了7~8個各種不同字數的句子,高機率能match到 09/15 21:39
→ genesic: 當然如果你的case是沒有意義的發音,那本來就轉不成文字 09/15 21:40
→ genesic: 另外如果是要speech recognition的話,alexa本來就不太適 09/15 21:42
→ genesic: 合XDD 還不如去用microsoft cognitive 09/15 21:43