作者laughingman (笑面男)
看板C_and_CPP
標題[問題] vector emplace_back() 花費時間問題
時間Tue Jan 11 23:06:32 2022
開發平台(Platform): (Ex: Win10, Linux, ...)
Linux
編譯器(Ex: GCC, clang, VC++...)+目標環境(跟開發平台不同的話需列出)
GCC
問題(Question):
我用以下的程式碼來測量vector emplace_back(int)所需要的時間,
為了避免vector重新分配記憶體多花的時間,
我先用reserve()將vector的容量調到我需要的大小:
#include <iostream>
#include <vector>
uint64_t get_tscp()
{
uint64_t a, d;
__asm__ volatile("rdtscp" : "=a"(a), "=d"(d));
return (d << 32) | a;
}
int main()
{
std::vector<int> v;
int size = 4096;
v.reserve(size);
for (int i = 0; i < size; ++i)
{
auto t1 = get_tscp();
v.emplace_back(i);
auto t2 = get_tscp();
std::cout << (t2 - t1) / 2.6 << std::endl;
}
return 0;
}
結果我發現emplace_back(int)所花費的時間大多在15ns上下,
但在第1021、2045、3069次loop,花費的時間突然暴增到2us左右,
請問各位大神有沒有什麼想法可以指點一下小弟,怎麼解釋這種情形?
感恩。
--
生死去來,棚頭傀儡,一線斷時,落落磊磊。
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 111.248.153.109 (臺灣)
※ 文章網址: https://www.ptt.cc/bbs/C_and_CPP/M.1641913630.A.26C.html
→ stucode: 直覺猜是 cache miss。 01/11 23:18
→ sarafciel: 應該是page miss , linux一個page大小預設是4KB 01/11 23:22
推 g0010726: 先說個問題 建議不要在迴圈裡做I/O,尤其是又用了endl 01/12 02:41
→ g0010726: 去flush buffer。目前這樣很有可能測得時間大部分是i/o 01/12 02:41
→ g0010726: 的時間XD 01/12 02:41
→ g0010726: 畢竟有時候真的不知道os的io順序是怎樣 01/12 02:47
→ laughingman: 回g大,我以為get_tscp()內的rdtscp就避免掉cpu亂序 01/12 03:09
→ laughingman: 執行的問題,還是我有考慮不周的地方?再麻煩告知。 01/12 03:10
→ laughingman: 回前兩樓,有什麼可以證明是cache miss或是page 01/12 03:12
→ laughingman: fault的方法嗎?可以稍微指點一下嗎?感恩<(_ _)> 01/12 03:14
推 mmmmei: int換double看看? 01/12 07:45
→ laughingman: 我用getconf PAGESIZE得到page大小為4096byte,然後 01/12 10:47
→ laughingman: 我的int大小為4byte,double為8byte,我換成double後 01/12 10:48
→ laughingman: 變成在512倍數次loop時間就會變大,所以應該是 01/12 10:50
→ laughingman: page fault造成的,感謝上面各位高手<(_ _)> 01/12 10:51