→ terter: 一時想到比較笨的方法是,從最後解。假設原陣列A,新陣列B02/07 11:59
→ terter: B[3]=A[2]<<6, B[2]=A[1}<<6+A[2}>>202/07 12:00
我剛剛發文後也想到這個方法
目前也是先用這樣的方法去寫 但不知道有沒有更簡單的方式能達成目標 尤其是要應付大量
資料的情況
→ terter: 想了一下,好像用型別轉換去作比較快,一次可以處理多個 02/07 12:07
→ terter: 譬如說用uint64這種 02/07 12:08
謝謝 這樣確實能提升一些速度
不過還是想問問看 假設我的bitmap有e.g. 超過1000個index
這樣即使用uint64還是會需要重複好幾遍
真的沒有辦法是可以直接對整個陣列所有位元進行移動的方法嗎?
→ Lipraxde: 有更完整的使用情境嗎? 02/07 15:27
推 lwecloud: tmp = bitmap[i] & 0xFC; 02/07 15:28
→ lwecloud: bitmap[i] = (bitmap[i] >> 6) & 0x3F; 02/07 15:29
→ lwecloud: bitmap[i] |= (remain << 6) & 0xC0; 02/07 15:30
→ lwecloud: remain = tmp; 02/07 15:30
→ lwecloud: 這樣呢? (用推文好難打 囧) 02/07 15:31
→ lwecloud: 第一行就錯了 tmp = bitmap[i] & 0x3; 才對... 02/07 15:32
→ lwecloud: 陽春做法,搞不好有些library可以直接做到 02/07 15:42
能大概了解你想表達的意思 感謝
→ leolarrel: terter的型別轉換法目前看起來最快最簡潔 02/07 17:37
推 don323: 類似二樓的寫法就是最快的,客製化各種運算 02/08 08:13
※ 編輯: handofn0xus (220.130.45.59 臺灣), 02/08/2023 15:55:39
推 johnjohnlin: char不小心shift太多會UB,最好先轉unsigned 02/08 21:47
→ johnjohnlin: 戳到MSB變1會是UB 02/08 21:48
→ yesiah: stackoverflow 有類似的討論 02/09 11:50
→ yesiah: 看了一下有兩個方向 02/09 11:50
→ yesiah: 一個是想辦法用SIMD instructions,另一個是一邊寫loop一 02/09 11:50
→ yesiah: 邊看assembly有沒有良好vectorize 02/09 11:50
→ yesiah: 第二個方法可能要加__restrict讓compiler知道src跟dst不重 02/09 11:50
→ yesiah: 疊,所以他可以做更多最佳化 02/09 11:50
→ longlongint: 如果要平行化 又不用省空間的話 掛一層f(idx) 04/09 23:03
→ longlongint: 就可以分段copy了 04/09 23:04