作者sma1033 (死馬)
看板Python
標題Re: [問題] numpy broadcasting 的使用
時間Fri Jun 15 18:58:00 2018
延續之前的問題,想延伸問一個相關的問題
目前看起來若要把A矩陣當中的element以10%的機率設為零的方法是
=> A[np.random.normal(A.shape)<0.1] = 0
但是這個方法無法確保每次A當中被設為0的元素的總數目是一樣的
假如我想要讓
"A當中位置隨機,但數量佔A當中總數量為10%的元素被設為0"的話該怎麼做最好?
我目前知道的方法為以下:
element_idx = list(range(np.prod(A.shape)))
np.shuffle(element_idx)
ary_idx = np.array(element_idx).reshape(A.shape)
A[ary_idx < np.prod(A.shape)*0.1] = 0
請問各位版友有更快或更簡潔的方法嗎?
感謝大家~
※ 引述《sma1033 (死馬)》之銘言:
: ※ 引述《NMOSFET (NMOSFET)》之銘言:
: : 各位大大好,小的最近遇到一個問題,
: : 假設有個 numpy 二維矩陣 A,
: : 我想要讓 A 矩陣裡的值,
: : 以 10% 的機率設為 0,
: : 於是寫了以下程式碼 :
: : rows = 10
: : cols = 10
: : prb = np.random.random((rows, cols))
: : mask = prb<0.1
: : for row in range(rows):
: : for col in range(cols):
: : if(mask[row][col]):
: : A[row][col]=0
: : 有沒有能夠利用numpy的broadcasting來達到同樣的效果,
: : 而不是用 for 迴圈,因為上面這種寫法,
: : 我只要在if()裡面產生隨機數判斷就好,
: : 不用在上面宣告 prb 和 mask 來多此一舉,
: : 能否請各位大大幫我解惑,感恩!!
: 用for迴圈在這邊根本脫褲子放屁
: 如果是我的話,會用以下作法
: mask = np.random.random((row, col))
: mask[prb<0.1] = 0
: mask[prb>=0.1] = 1
: A = np.multiply(A, mask)
: done.
: 速度要快就是要用矩陣同時處理多element(可以平行算)
: 如果你用for迴圈一個一個element依序處理A當中的資料
: 不管你用什麼方法生成random都一樣會慢
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 118.160.86.55
※ 文章網址: https://www.ptt.cc/bbs/Python/M.1529060285.A.DFA.html
→ ThxThx: 缺點:100 / (機率) 要是整數 06/15 19:15
→ sma1033: 感謝ThxThx解答,如果還有其他方法也歡迎提出討論 06/15 19:20
→ GeoMeTric: 將 0.1 取代為隨機數的 10th percentile,如 06/16 08:57
→ GeoMeTric: A = np.where(prb < np.percentile(prb, 10), 0, A) 06/16 08:57
推 iphone2003: index = np.random.choice(np.prod(A.shape), int(np. 06/16 13:43
→ iphone2003: prod(A.shape) * 0.1) 06/16 13:43
→ iphone2003: A.ravel()[index] = 0 06/16 13:43
→ sma1033: 感謝樓上熱心網友的回覆,小弟又多學了好幾招~ 06/18 18:47