看板 DataScience 關於我們 聯絡資訊
問題類別:NLP 使用工具:tensorflow 問題內容: 需求如下,給定句子,風景真美麗,斷詞後並打亂,可能變成 「美麗,風景,真」或「真,風景,美麗」或其它組合 目標是機器訓練後, 當輸入「美麗,風景,真」或「真,風景,美麗」或其它組合 輸出會得到 風景真美麗 給定句子,我要買玩具,斷詞後並打亂會得到隨機的文字序列 當輸入隨機的文字序列, 輸出會得到 我要買玩具 想知道 該下什麼關鍵字 才能找到這方面的資料? 一直找不到,故上站發問,謝謝能解答的各位 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 1.160.218.107 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/DataScience/M.1666172064.A.FC0.html
chang1248w: 自己斷詞之後打亂不行嗎 10/19 22:57
chang1248w: 你是要找refer還是資料集....? 10/19 22:58
chang1248w: 我記得bert的其中一個是抽換語句順序的 10/19 22:59
chang1248w: ^訓練任務 10/19 23:00
chang1248w: 不是bert就是albert 10/19 23:06
chang1248w: https://bit.ly/3ySynjL 10/19 23:13
chang1248w: 你有先土炮硬上過嗎 10/19 23:16
imvic999: 參考這個概念看看"以功能詞及知網為基礎之軟體搜尋系統" 10/20 13:39
imvic999: 18年前寫的碩論 10/20 13:41
stayfool: 如果這個題目從來沒有人研究,那我只好獨自鑽研 10/20 14:38
stayfool: 否則,我希望有範例能參考,就不用重新打造輪子 10/20 14:40
stayfool: 我看了碩論,找不到能解決我的需求的概念 10/20 14:41
chang1248w: https://arxiv.org/abs/1604.08633 10/20 16:13
chang1248w: 稍微爬了一下,跟恢復句意相比,研究模型怎麼理解句意 10/20 16:55
chang1248w: 才是主流 10/20 16:56
chang1248w: https://bit.ly/3sbBAY4 10/20 18:21
chang1248w: 研究多半只抽換一兩個詞的順序,不會完全破壞整體的 10/20 18:24
chang1248w: 句法結構 10/20 18:24
chang1248w: 所以不如從詞袋造句開始找 10/20 18:25
chang1248w: 噢... 你是之前那個google壞掉的天兵 10/20 18:30
stayfool: ch大!強!給出的連結就是我想查詢的資料 10/20 19:20
stayfool: 你說的詞袋造句,該如何查呢?google"詞袋 造句"或 10/20 19:23
stayfool: "bag of words sentence" "機器學習 造句"都找不到 10/20 19:24
stayfool: 適合的資料 10/20 19:24
lycantrope: 原來是google壞掉的部分,建議google如何使用google 10/21 10:48