作者stayfool (fool)
看板Python
標題[問題]tenflow dataset 元素順序求解
時間Wed Jan 20 17:48:22 2021
程式碼
builder = tfds.builder("wmt", config=config)
datasets = builder.as_dataset(split='train')
for value in datasets:
print(value)
程式執行結果,每次都不一樣,dataset裡的內容依序是你、我、他
預期執行結果如下
你
我
他
但實際執行結果卻是隨機,有時你、他、我,有時我、你、他
改成
for value in datasets.range(3):
print(value)
執行結果只能得到數字012,順序正確但需要的是"文字"
請教如何改寫才能得到正確的結果
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 1.171.144.10 (臺灣)
※ 文章網址: https://www.ptt.cc/bbs/Python/M.1611136104.A.DF5.html
推 Ryspon: 跟新版 tf 不太熟,把 datasets 轉成 orderedDict 試試? 01/20 23:53
→ chickengod: config=config 這行的問題?是不是有shuffle? 01/21 04:58
→ chickengod: print(list(datasets.as_numpy_iterator())[:3])) 01/21 05:23